Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке

 

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ

МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ

(ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

ИНСТИТУТ ИНОСТРАННЫХ ЯЗЫКОВ МАИ












ДИПЛОМНАЯ РАБОТА

на тему

Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке


Оглавление


Введение

1. К определению основных понятий лингвостилистики.

1.1 Основные понятия

1.2 Функциональные стили

1.3 Стилистическая характеристика научно-технического стиля

1.3.1 Общие особенности

1.3.2 Лексические особенности научно-технического стиля

1.3.3 Синтаксические особенности научно-технического стиля

1.3.4 Морфологические особенности научно-технического стиля

1.3.5 Подстили

2. К проблеме машинного перевода в современном языкознании

2.1 Основные понятия машинного перевода

2.1.1 Развитие машинного перевода

2.1.2 Степень реализации СМП

2.1.3 Принципы оценки СМП

2.1.4 Принцип действия СМП

2.2 Подходы к машинному переводу

2.2.1 СМП основанные на правилах

2.2.2 Системы машинного перевода основанные на примерах

2.2.3 Статистический машинный перевод

2.3 ТМ-системы

2.4 Сравнение различных типов СМП

3. Структурно-семантические трансформации в англоязычном научно техническом тексте при машинном переводе

3.1 Основные особенности

3.2 Лексические особенности

3.3 Синтаксические особенности

3.4 Морфологические особенности

Заключение

Библиография

Приложения

Схема 1: основные понятия стилистики

Схема 2: тропы и фигуры

Схема 3: функциональные стили языка

Схема 4: особенности научно-технического стиля

Образцы проанализированных текстов

Отрывок 1

Оригинал

Перевод, выполненный статистической СМП

Перевод, выполненный трансфертной СМП

Перевод, выполненный человеком

Отрывок 2

Оригинал

Перевод, выполненный статистической СМП

Перевод, выполненный трансфертной СМП

Перевод, выполненный человеком

Отрывок 3

Оригинал

Перевод, выполненный статистической СМП

Перевод, выполненный трансфертной СМП

Перевод, выполненный человеком

Таблицы анализа

Список сокращений

Условные обозначения


Введение


Мы живем в мире информационных технологий, которые прочно вошли в нашу жизнь. Мы пользуемся современными средствами связи. Компьютер превратился в неотъемлемый элемент нашей жизни не только на рабочем месте, но и в повседневной жизни. Быстрое развитие новых информационных технологий свидетельствует о всевозрастающей роли компьютерной техники в мировом информационном пространстве.

С каждым днем увеличивается число пользователей Интернета. Все больше сетевые технологии оказывают влияние на развитие самой науки и техники. За последние годы сильно начал меняться характер образования, переходя на уровень дистанционного. Этот переход осуществляется даже в классических вузах. Развитие науки и образования, да и вообще формирование мирового информационного пространства значительно тормозится из-за так называемого языкового барьера. Эта проблема пока не нашла своего кардинального решения.

Последние годы объем предназначенной для перевода информации увеличился. Создание универсального языка типа Эсперанто, «эльфийских языков» или какого-либо другого языка не привели к изменению ситуации. Использование традиционных средств межкультурной коммуникации может быть достойным выходом. Нынешний век диктует свои условия: информация меняется двадцать четыре часа в сутки, широко применяются электронные средства связи. В такой ситуации классический подход к осуществлению перевода не всегда оправдывает себя. Он требует значительных капиталовложений и временных затрат. В некоторых случаях более целесообразным представляется использование машинного или автоматического перевода и систем машинного перевода (СМП).

Работа посвящена изучению стилистики текста, и исследованию особенностей стиля научно-технической литературы, в аспекте применения автоматизированных средств перевода.

Актуальность темы оправдана появлением большого количества научно-технических документов и необходимостью оперативного их перевода на другие языки.

Цель работы: изучение особенностей научно-технического стиля в аспекте машинного перевода.

Задачи работы:

·описать в общих чертах стилистику научно-технического текста;

·описать принципы работы, основные типы систем машинного перевода;

·изучить особенности языковых средств научного стиля;

·выяснить какие из языковых средств остаются в тексте после его перевода;

·сравнить текст, переведенный машиной и профессиональным переводчиком.

Объектом исследования являются преобразования, возникающие при машинном переводе текста научно-технической литературы.

Предметом исследования являются особенности структурно-семантических трансформаций при машинном переводе определенной научной работы с английского языка на русский.

В ходе исследования были использованы следующие методы:

·аналитический;

·сравнительный;

·изучение монографических публикаций и статей;

·метод сплошной выборки;

·методы лингвистического анализа;

·метод обобщения.

Теоретическая значимость работы заключается в попытке собрать и систематизировать информацию о малоизученном аспекте взаимодействия двух областей знаний:

·об особенностях стиля научно-технической литературы;

·об особенностях систем машинного перевода.

Практическая ценность работы определяется:

·описанием особенностей научного стиля в виде диаграмм и схем, что, по нашему мнению, является наиболее доходчивым и методически оправданным.

·комплексом собранных сведений относительно систем машинного перевода, которые также представлены в виде диаграмм и схем;

·приведенным стилистическим анализом отрывков из классического труда Д. Кнута «Искусство программирования»;

·сопоставлением машинного и «человеческого» перевода приведенного отрывка.

В качестве теоретической основы исследования были использованы как классические работы А.И. Гальперина И.В. Арнольд, посвященные стилистике английского языка, Я.И. Рецкера, А.Д. Швейцера, посвященные общей теории перевода, так и современные труды Ю.Н. Марчука, П.Н. Хроменкова, Б. Н. Рахимбердиева, посвященные машинному переводу. Особенно хотелось бы отметить работу С. Рассела, в которой дается объяснение принципов работы многих приложений искусственного интеллекта, в том числе машинного перевода.

В качестве фактического материала использован первый том классического труда Д. Кнута «Искусство программирования», а также переводы этой работы, выполненные как человеком, так и с помощью программных средств. Очень подробно были проанализированы три отрывка из этой работы, взятые из начала, середины и конца книги. Оригинальные отрывки на английском языке содержат примерно полторы тысячи языковых единиц (1685). Общий объем проанализированных единиц составляет 6259 слов.

1. К определению основных понятий лингвостилистики.


Стилистикой называется отрасль лингвистики, исследующая принципы и эффект выбора и использования лексических, грамматических, фонетических и вообще языковых средств для передачи мысли и эмоции в разных условиях общения (Арнольд, 1990: 10).



Лингвистическая стилистика - раздел языкознания, занимается исследованием:

·стилей речи;

·стилистических приемов;

·выразительных средств языка в их отношении к выражаемому содержанию.

Связь стилистики с другими дисциплинами можно представить в виде диаграммы.


Стилистика языка исследует:

·специфику языковых подсистем - функциональных стилей и подъязыков, которые характеризуются своеобразием:

oсловаря,

oфразеологии,

oсинтаксиса;

·экспрессивные, эмоциональные и оценочные свойства различных языковых средств.

Следует выделять стилистику текста. Понятие стилистики текста часто путают с понятием стилистики языка. Стилистика текста необходима, так же как грамматика, семантика и другие аспекты и области изучения текста. Важны оба компонента названия - стилистика и текст.

Первый компонент обозначает стилистический подход ко всем явлениям текста. Второй - предмет изучения и специфику стилистического изучения (изучаются не традиционные языковые единицы, а тексты).

В определении И.Р. Гальперина, под текстом понимается произведение, имеющее определенную направленность и прагматическую установку, и характеризующееся завершенностью и многомерностью.

Стилистика изучает отдельные реальные тексты. Она рассматривает, каким образом тексты передают содержание:

·следуя нормам, известным грамматике и стилистике языка;

·на основе значащих отклонений от этих норм.

Задачи стилистики:

.Анализ выбора определенных языковых средств при наличии синонимичных форм выражения мысли для полноценной и эффективной передачи информации.

.Анализ экспрессивных средств языка на всех уровнях.

.Определение функции задания - определение стилистической функции, которую выполняет языковое средство.

Стилистика подразделяется по уровням на лексическую, грамматическую и фонетическую стилистику.



Лексическая стилистика изучает функции лексики и рассматривает взаимодействие прямых и переносных значений. Лексическая стилистика изучает:

·разные составляющие контекстуальных значений слов, их потенциал

oэкспрессивный,

oэмоциональный

oоценочный;

·их отнесенность к разным функционально-стилистическим пластам.

Диалектные слова, термины, слова сленга, разговорные слова и выражения, неологизмы, архаизмы, иностранные слова и т.д. изучаются с точки зрения их взаимодействия с разными условиями контекста. Важную роль в стилистическом анализе играет разбор фразеологических единиц и пословиц.

Грамматическая стилистика подразделяется на:

·морфологическую;

·синтаксическую.

Морфологическая стилистика рассматривает стилистические возможности различных грамматических категорий, присущих тем или иным частям речи. Здесь рассматриваются:

·стилистические возможности категории числа;

·противопоставлении в системе местоимений;

·именной и глагольный стили речи;

·связи художественного и грамматического времени и т.д.

Синтаксическая стилистика исследует экспрессивные возможности:

·порядка слов;

·типов предложений;

·типов синтаксической связи.

Важное место здесь занимают фигуры речи:

·синтаксические;

·стилистические;

·риторические фигуры.

Это особые синтаксические построения, придающие речи добавочную выразительность. Как в лингвостилистике, так и в литературной стилистике много внимания уделяется разным формам передачи речи повествователя и персонажей: диалог, несобственно-прямая речь, поток сознания и др. Фонетическая стилистика, включает все явления звуковой организации стихов и прозы:

·ритм;

·аллитерацию;

·звукоподражание;

·рифму;

·ассонансы и т.п.

Сюда же относится рассмотрение нестандартного произношения с комическим или сатирическим эффектом для показа социального неравенства или для создания местного колорита.

Практическая стилистика учит умению правильно выражаться, советует использовать слова, значениями которых мы умеем оперировать, не злоупотреблять фразеологическими оборотами, учит правильно обращаться с языком. Все должно употребляться согласно случаю. Функциональная стилистика изучает стиль как функциональную разновидность языка, особенно в художественном тексте.


1.1 Основные понятия


В лингвистике очень часто используются такие термины как: выразительные средства языка, экспрессивные средства языка, стилистические средства, стилистические приемы. Эти термины иногда употребляются синонимически, иногда же в них вкладывается различное содержание (Гальперин, 1958: 43).



Все выразительные средства языка (лексические, морфологические, синтаксические, фонетические) являются объектом изучения как лексикологии, грамматики и фонетики, так и стилистики. Первые три раздела науки о языке рассматривают выразительные средства как факты языка, выясняя их лингвистическую природу. Стилистика изучает выразительные средства с точки зрения их использования в разных стилях речи, полифункциональности, потенциальных возможностей употребления в качестве стилистического приема (Гальперин, 1958: 46).

Изобразительными средствами языка при этом называют все виды образного употребления слов, словосочетаний и фонем, объединяя все виды переносных наименований общим термином «тропы». Изобразительные средства служат описанию и являются по преимуществу лексическими.

Тропы - семантические преобразования языковых единиц. Тропы в определенном контексте трансформируют значение единиц путем установления отношения адекватности с понятиями другой предметной области. Образуется своеобразная семантическая сеть.

При образовании тропов активную роль играет ассоциативное мышление. Тропы реорганизуют семантическое пространство языка и, снимая в нем границы между реальным и возможным, создают основу для постижения глубинной структуры реальности особым, «новым» способом, порождая «парадоксальную семантическую ситуацию» (Фатеева, 2006).

Выразительные средства, или фигуры речи, не создают образы, а повышают выразительность речи и усиливают ее эмоциональность при помощи особых синтаксических построений: инверсии, риторического вопроса, параллельных конструкций, контраста и т. д. (Арнольд, 1990:39).

Так же выделяют понятие стилистического приема. И.Р. Гальперин описывает его как намеренное и сознательное усиление какой-либо типической структурной и/или семантической черты языковой единицы (нейтральной или экспрессивной), достигшее обобщения и типизации и ставшее таким образом порождающей моделью. Основным признаком является намеренность или целенаправленность употребления того или иного элемента, противопоставляемая его существованию в системе языка. С понятием стилистического приема связано понятие стилистической функции.

Стилистическая функция - та роль, которую языковое средство играет при передаче экспрессивной информации:

·создание художественной выразительности;

·создание художественного пафоса;

·создание комического эффекта;

·создание речевой характеристики героя.

Прямого соответствия между стилистическими средствами, стилистическими приемами и стилистической функцией нет. Стилистические средства неоднозначны. Инверсия, например, в зависимости от контекста и ситуации может создать пафос и приподнятость или, напротив, придать ироническое, пародийное звучание. Многосоюзие, в зависимости от контекстуальных условий, может служить для логического выделения элементов высказывания, для создания впечатления неторопливого, размеренного повествования или, наоборот, для передачи серии взволнованных вопросов, предположений и т.д. Гипербола может быть трагической и комической, патетической и гротескной. Функционально-стилистическую окраску не следует смешивать со стилистической функцией. Первая принадлежит языку, вторая - тексту. В словарях функционально-стилистическая коннотация - историческая отнесенность слов и принадлежность к специальной терминологии, - так же как коннотация эмоциональная, указывается специальными пометами: colloquial, poetical, slang, ironical, anatomy и т.д. В отличие от стилистической коннотации стилистическая функция помогает читателю правильно расставить акценты и выделить главное. Стилистическую функцию важно также отличать от стилистического приема. К стилистическим приемам относят стилистические фигуры и тропы. Стилистическими приемами являются также синтаксические или стилистические фигуры, увеличивающие эмоциональность и экспрессивность высказывания за счет необычного синтаксического построения: разные типы повторов, инверсия, параллелизм, градация, многочленные сочинительные единства, эллипсис, сопоставление противоположностей и т.д. Особую группу образуют фонетические стилистические приемы: аллитерация, ассонанс, ономатопея и другие приемы звуковой организации речи.


.2 Функциональные стили


Отличительные черты каждого стиля зависят от его назначения и той комбинации языковых функций, которая преобладает в акте коммуникации:

·от сферы общения;

·от того, имеет ли общение своей главной целью:

oсообщение сведений,

oвыражение эмоций (общение),

oпобуждение к каким-либо действиям.

Функциональный стиль (ФС) (Functional Style, также Register) - это общественно осознанная и функционально обусловленная совокупность приемов употребления, отбора, и сочетания языковых средств, направленная на достижение определенной цели сообщения. Понятие ФС связано с понятием языковой вариативности. Разные авторы выделяют разное количество функциональных стилей.

По И.Р. Гальперину ФС всего пять.



По И.В. Арнольд их четыре.



Существует много других классификаций функциональных стилей.

Не существует единственно правильного варианта. Рассмотрим трудности выделения ФС.

.ФС переплетаются.

.ФС исторически изменчивы.

.Понятие ФС очень тесно соприкасается с жанрами. Стиль может составлять совокупность жанров, например, стиль художественной прозы - это роман, рассказ, поэма, и т.д.

.Стили не изолированы, но, что важно, они имеют собственное ядро, собственные параметры. Меньше всего под влиянием других стилей находится деловой стиль.

Мы вслед за Гальпериным будем выделять пять стилей языка:

·научный;

·художественный;

·публицистический;

·официально-деловой;

·разговорный.

Причем, в данном случае, стили можно связать с функциями языка следующим образом:



Стили разделены на две категории. Это книжные стили и разговорный стиль. При этом книжные стили это:

·научный;

·художественный;

·публицистический;

·официально-деловой.

Основные черты стилей и их жанры приведены на схеме в приложении.


1.3 Стилистическая характеристика научно-технического стиля


Научно-технический стиль - стиль научной прозы, который используется в изложении, имеющем определенное содержание. Наиболее характерными чертами стиля научной прозы является синтаксическая организация предложений и выбор лексики. Отбор лексики в стиле научной прозы подчиняется одной основной задаче: адекватно донести до читателя описываемое явление в многообразии признаков, характеризующих это явление. Поэтому слова, используемые для выражения мысли в научной прозе имеют одно, обычно ведущее, предметно-логическое значение. Вообще, наиболее характерным для стиля научной прозы является использование слов в основных предметно-логических значениях. В этом стиле слова редко используются в переносных и других контекстуальных значениях (Гальперин, 1958: 424).

Принято считать, что единственной функцией научного стиля является функция интеллектуально-коммуникативная, другие функции факультативны. Научный стиль характерен для текстов, предназначенных для сообщения точных сведений из какой-либо специальной области и для закрепления процесса познания.


.3.1 Общие особенности

Общие особенности стиля можно представить в виде диаграммы:



Определенной стилистической обособленностью обладают в подобных текстах:

·леммы;

·аксиомы;

·теоремы;

·доказательства;

·алгоритмы.

Для таких структур характерна формальность изложения и перегруженность штампами. Без специальной подготовки они сложны для понимания.


1.3.2 Лексические особенности научно-технического стиля

Образность

Образность, как правило, не свойственна стилю научной прозы.

Очень редко встречаются:

·метафоры;

·метонимии;

·гиперболы;

·сравнения;

·другие средства создания образности.

Но неверно предполагать полное отсутствие образности в научных текстах. Здесь она может быть использована как вспомогательное средство. Образность в научной прозе - это средство проявления индивидуальной манеры изложения, которое само по себе не является обязательным для стиля научной прозы. Образность обычно усиливает, оттеняет уже аргументированную логически мысль.

Неологизмы

В научном тексте чаще, чем в иных появляются неологизмы. Это связано, с острой необходимостью новых слов:

·при изучении ранее неизвестных явлений;

·при изобретении новых устройств;

·при применении новых методов;

·при переосмыслении старого научного опыта.

В отличие от неологизмов, появляющихся в живой разговорной речи и в газетно-публицистическом стиле, неологизмы, появляющиеся в стиле научной прозы, оказываются значительно более устойчивыми. В зависимости от того, насколько широко те или иные научные открытия становятся известными широким массам, слова-неологизмы, их обозначающие, входят в фонд общеупотребительной лексики или остаются в обращении лишь в узкой области, где возник такой неологизм. В стиле научной прозы вырабатывается особая, общая для многих разновидностей этого стиля, научная фразеология (Гальперин, 1958: 425). Последнее тесно связано с возникновением терминов.

Термины

Термин - слово или словосочетание, точно и однозначно именующее понятие и его соотношение с другими понятиями в пределах специальной сферы. Терминами обозначают вновь появляющиеся понятия, связанные с развитием науки, техники и искусства. Важно понимать, что нет однозначного соответствия между терминами и неологизмами. Не всякий научный термин является неологизмом, не всякий неологизм становится термином. Термины чаще всего лишены эмоционального значения. В отдельных случаях могут его приобретать. Кроме того, термины чаще всего характеризуются однозначностью. Однако такая однозначность может существовать только в пределах одной научной темы. А даже в рамках конкретной науки моносемантичность может быть нарушена.

Например, термин «бинарный» (binary), в математике.


Бинарный код двоичная система счисления.Бинарный поискклассический алгоритм поиска элемента в отсортированном массиве.

Например, термин «архитектура» (architecture), в информатике.


Системная архитектурафундаментальная организация системы, реализованная в ее компонентах, связях этих компонентов друг с другом и внешней средой и принципах, определяющих структуру и развитие системы.Архитектура оборудованияиспользуемые технические средства/решения.Архитектура компьютераконцептуальная структура вычислительной машины, определяющая проведение обработки информации и включающая методы преобразования информации в данные и принципы взаимодействия технических средств и программного обеспечения.Архитектура персонального компьютеракомпоновка его основных частей, таких как процессор, ОЗУ, видеоподсистема, дисковая система, периферийные устройства и устройства ввода-вывода.Архитектура набора командчасть архитектуры компьютера, определяющая программируемую часть ядра микропроцессора.Микроархитектураэто способ, которым данная архитектура набора команд реализована в процессоре. Архитектура приложенийфункциональный и компонентный состав информационной системы.

Последний пример является хрестоматийным. Многие теоретики компьютерной техники признают, что термин является «одним из самых невезучих».

Но вообще, по своей природе термины оказывают большее сопротивление процессу обрастания дополнительными значениями. И казусы, описанные выше, возникают из-за рассогласования терминологии. Подобное может возникать и если термин недостаточно устоялся в какой-то определенной области. Также, важно заметить, что наличие терминов и неологизмов в научно-техническом тексте не обязательно, а является лишь средством обеспечения логичности и понятности. Научный текст или устно произнесенный научный доклад или лекция отражают работу разума и адресованы разуму, следовательно, они должны удовлетворять требованиям логического построения и максимальной объективности изложения (Арнольд, 1990: 130).

Наиболее часто встречаются в научных текстах, конечно же, не термины, а общеупотребительные слова. Интересно заметить, что строгость в употреблении терминов и привычных формулировок, в целом, более свойственна русскому научно-техническому стилю, чем английскому. Поэтому переводчик нередко чувствует себя обязанным осуществлять «стилистическую правку» оригинала, вводить вместо парафразы точный термин, разъяснять, что конкретно имеется в виду, заменять авторский оборот более привычным штампом. Одно из распространенных проявлений стилистической адаптации в научно-техническом переводе - это стремление «закавычить» стилистические инородные элементы.

Таким образом, всю совокупность лексических особенностей можно изобразить в виде схемы:



.3.3 Синтаксические особенности научно-технического стиля

Союзы

С точки зрения синтаксической организации предложения стиль научной прозы характеризуется точно определенной системой союзной связи, вытекающей из строгой логически последовательной системы изложения. Эта развернутая система связи вызвала к жизни многие и многие обороты предложного и наречного характера, которые стали употребляться в синтаксических функциях связующих элементов речи. Именно в этом стиле речи произошла постепенная десемантизация таких слов, как consequence result, connection и др.

В таких сочетаниях как in consequence of, as a result, in connection with и др. В стиле научной прозы находит свое наиболее яркое выражение логический синтаксис, в отличие от эмоционального синтаксиса художественной речи (Гальперин, 1958: 425).

Подобное можно увидеть не только в английском языке, но и в русском.

В научном стиле активны союзы, предлоги и предложные сочетания. В роли них могут выступать слова, обладающие самостоятельным значением в иных условиях. Прежде всего, это существительные.

Для научной речи характерно преобладание сложноподчиненных предложений, в которых союзы четко отражают причинно-следственные отношения (если... то, так что, в то время как); той же цели служит употребление местоименно-наречных и союзных слов (и потому, поэтому, следовательно, благодаря этому, в результате этого и др.). Сложноподчиненные и тем более бессоюзные предложения здесь менее употребительны (Голуб, 2003: 31).

Предлоги и союзы позволяют более определенно и точно выражать мысль.

Не только союзная связь выражает четкие логические взаимосвязи отдельных частей высказывания. Значительную роль в этом отношении в английской научной прозе играют причастные и инфинитивные обороты. Однако, в отличие от стиля газетных сообщений и газетных статей, в которых краткость изложения вызывается условиями коммуникации, в стиле научной прозы краткость не является характерной чертой стиля. Наоборот, всесторонность и убедительность доказательств выдвигаемых положений нередко требует развернутости изложения.

Структура

В стиле научной прозы весьма важную роль играют сверхфразовые единства - абзацы. Как таковое, разбиение на абзацы скорее относится к общим особенностям научного текста. Но структура абзацев полностью повторяет с одной стороны структуру предложений, а с другой стороны логику развертывания текста в целом.

В стиле научной прозыкаждый последующий абзац раскрывает мысль, которую нес предыдущий абзац. Иногда это следование может быть очевидным, иногда происходит при помощи синтаксических структур. В каждом абзаце легко можно выделить основную мысль.

Принцип сочинения и подчинения предложений отвечают требованиям логики. Главная мысль содержится в главном предложении, подчиненная мысль - в придаточном.

Для научно-технических материалов английского языка характерно преобладание простых предложений, которые, составляют в среднем свыше половины общего числа предложений в тексте. В то же время число сложных предложений сравнительно невелико. Это явление несвойственно соответствующему стилю в русском языке, где сложные предложения используются очень широко. В связи с этим в англо-русских технических переводах часто используется прием объединения предложений, в результате чего двум или более простым предложениям английского оригинала соответствует одно сложное предложение в русском переводе.

В английских текстах особенно часто встречаются пассивные обороты. Форма изложения в стиле научной прозы не несет дополнительных функций воздействия на читателя. Она лишь средство придать ясность изложению. Вот почему редактирование научной «прозы, в основном, сводится к уточнению значений слов и словосочетаний и характера связи между отдельными частями высказывания (Гальперин, 1958: 435).

К синтаксическим особенностям можно отнести и наличие неалфавитных

знаков в тексте. Это могут быть:

·формулы;

·символы;

·графики;

·диаграммы.

Таким образом, всю совокупность синтаксических особенностей можно изобразить в виде схемы:



.3.4 Морфологические особенности научно-технического стиля

Авторская речь построена в первом лице множественного числа «мы»:

·наука создана содружеством большого количества учёных;

·вовлечение читателей в процесс рассуждения и доказательства:

we are coming to realise,

the tube has shown us,

we are beginning to see,

we deal with.

·множественное скромности;

Например:an illustration let us take the language of Euclidean geometry and algebra.(A.Einstein)

Широко употребляются безличные формы c it и конструкции с one:

·it should be borne in mind;

·it may be seen;

·one may write;

·one may show;

·one may assume;

·one can readily see;

Модальные глаголы в научных и технических текстах употребляются без отчетливой дифференциации их значений. С этим утверждением можно поспорить (например, в спецификации CSS level 2 это не так), но, в некоторых случаях, такое явление может встречаться.

Заметное предпочтение отдается пассивным и неличным формам глагола.

Не научно: use the same notation as previously

Научно: notation is the same as previously used

Преобладание именных, а не глагольных конструкций даёт возможность большего обобщения, устраняя необходимость указывать время действия.

Не научноwe arrived

Научноthe time of our arrival

Термины, обозначающие вещество или отвлеченное понятие, употребляются в обеих числовых формах без сдвига лексического значения и могут определяться числительными;

Например: two horizontal permeabilities are measured.

В научно-техническом тексте встречается сравнительно частое употребление настоящего продолженного и будущего вместо простого настоящего:

·today we are coming to realize that ...;

·we are beginning to see that ...;

·finally, as long as the automaton is running.

Таким образом, всю совокупность морфологических особенностей можно изобразить в виде схемы:


1.3.5 Подстили

Обычно говорят от трех подстилях научного стиля: собственно-научный; научно-учебный; научно-популярный.

Жанры собственно-научного подстиля выделяются:

·монография;

·диссертация;

·доклад и др.

Подстиль отличается строгой, академической манерой изложения. Тексты этого подстиля пишут «специалисты для специалистов». Этому подстилю противопоставлен научно-популярный подстиль. Он реализуют функцию популяризации научных знаний. Тексты этого подстиля пишут «специалисты для обывателей». Информация преподносится в доступной и занимательной форме. Отличительная черта стиля - это соединение противоположных характеристик текста:

·логичности и эмоциональности;

·объективности и субъективности;

·абстрактности и конкретности.

В отличие от научной прозы в научно-популярной литературе значительно меньше специальных терминов и других научных средств.

Научно-учебный подстиль соединяет в себе черты собственно-научного подстиля и научно-популярного изложения.

Основные черты:

·терминологичность;

·системность в описании научных сведений;

·логичность;

·насыщенность иллюстративным материалом;

·доказательность;

·доступность.

Задача этого стиля - быстро и понятно донести информацию в всей своей полноте.

Жанры научно-учебного подстиля:

·учебное пособие;

·лекция;

·семинарский доклад;

·ответ на экзамене.

2. К проблеме машинного перевода в современном языкознании


В настоящее время имеется достаточно широкий выбор пакетов программ, облегчающих труд переводчика, которые условно можно подразделить на две основные группы:

·электронные словари (electronic dictionary)

·системы машинного перевода (machine translation system).

Системы машинного перевода (СМП) текстов с одних естественных языков на другие моделируют работу человека-переводчика.

Их полезность зависит от того, в какой степени в них учитываются объективные законы языка и мышления. Законы эти пока еще изучены плохо. Поэтому, решая задачу машинного перевода, необходимо учитывать опыт межнационального общения и опыт переводческой деятельности, накопленный человечеством. В процессе перевода в качестве основных единиц смысла выступают не отдельные слова, а фразеологические словосочетания, выражающие понятия. Именно понятия являются элементарными мыслительными образами. Только используя их можно строить более сложные образы, соответствующие переводимому тексту. Обычно сравнивая работу машины и человека приводят следующую характеристику.



На наш взгляд, она не очень верна, и отчасти предвзята. Для проведения такого сравнения нужно знать тип СМП и принцип ее работы. Причем, когда говорят о переводе «с помощью вычислительной техники», то часто путают понятия. Вообще, в современной лингвистике можно выделить ряд направлений использования компьютера.



В этой работе мы будем подробно рассматривать системы машинного перевода. Ниже расскажем кратко о других направлениях.


2.1 Основные понятия машинного перевода


На данный момент выделяют три типа систем машинного перевода.



Полностью автоматические системы машинного перевода являются скорее несбыточной мечтой, чем реальной идей. В этой работе мы их рассматривать не будем. Все системы машинного перевода (MT-системы) работают при участии человека в той или иной мере. TM-системы иногда называют еще «памятью переводчика». Они являются скорее просто удобным инструментом, нежели элементом автоматизации.

2.1.1 Развитие машинного перевода

Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического прототипа электронных цифровых вычислительных машин, появившихся через 100 лет.

Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить.

Задача аксиоматизации лингвистики была выдвинута одним из виднейших лингвистов московской школы П.С. Кузнецовым как задача формализации грамматики, восходящая к идеям выдающегося русского языковеда Ф. Ф. Фортунатова (1848-1914) Первые эксперименты по машинному переводу, подтвердившие принципиальную возможность его реализации, были проведены в 1954 г в Джорджтаунском университете (г. Вашингтон, США). Вскоре после этого в промышленно развитых странах мира были начаты исследования и разработки, направленные на создание систем машинного перевода (систем МП). И хотя с тех пор прошло полстолетия, проблема машинного перевода все еще не решена на должном уровне. Она оказалась значительно сложнее, чем это представляли себе пионеры и энтузиасты МП конца пятидесятых - начала шестидесятых годов прошлого века. Поэтому, оценивая сегодняшнюю реальность, уместно говорить и о разочарованиях, и о надеждах в этой области.

В 70-х годах разработку основ технологии машинного перевода продолжила группа специалистов в ВИНИТИ под руководством профессора Г.Г. Белоногова. В результате в 1993 г. была создана промышленная версия системы RETRANS фразеологического машинного перевода с русского языка на английский и обратно, которая применялась в министерствах обороны, путей сообщения, науки и технологий, а также во ВНТИЦ. Практическое применение принципов смыслового анализа текстов потребовалось при создании систем машинного перевода с иероглифических языков (китайского, японского и др.). Вопросы создания таких систем были разработаны в диссертации В.М. Зелко в 80-х годах. Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов.

Они были реализованы на персональных компьютерах и являлись системами прямого перевода, возможности которых базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты.


.1.2 Степень реализации СМП

По степени разработанности отличают следующие классы СМП:



2.1.3 Принципы оценки СМП

Сейчас достаточно очевидно, что невозможно заменить человека-переводчика машиной. Однако, можно сильно облегчить труд переводчика и повысить его производительность. Для того, чтобы судить на сколько труд переводчика стал эффективнее и проще использует следующие методы оценки СМП.


Методы отчасти являются относительными и формального критерия в принципе быть не может. На наш взгляд, наиболее адекватными являются субъективные и статистические методы. Но они применимы только для конкретной команды переводчиков и редакторов. И для каждого человека будут давать сильно разнящиеся показатели. Инженерные и программные методы позволят оценить СМП только на уровне конечного продукта.

На уровне разработки пользы от них не много.


2.1.4 Принцип действия СМП

Любая СМП в своей работе (на этапе эксплуатации) использует формальные шаги представленные на схеме.


2.2 Подходы к машинному переводу


Системы машинного перевода могут использовать метод перевода основанный на лингвистических правилах. Наиболее подходящие слова из исходного языка просто заменяются словами переводного языка.

Часто утверждается, что для успешного решения проблемы машинного перевода, необходимо решить проблему понимания текста на естественном языке.

Как правило, метод перевода основанный на правилах использует символическое представление (посредника), на основе которого создается текст на переводном языке. А если учитывать природу посредника то можно говорить об интерлингвистическом машинном переводе или трансфертном машинном переводе. Эти методы требуют очень больших словарей с морфологической, синтаксической и семантической информацией и большого набора правил.

Если у системы машинного перевода будет достаточное количество данных, то можно получить перевод хорошего качества. Основная трудность заключается в формировании этих данных. Например, большие корпуса текста необходимые для статистических методов перевода, для перевода, основанного на грамматике, оказываются недостаточными. Более того, для последних, требуется дополнительное задание грамматики.

Для перевода родственных языков (русский, украинский) может оказаться достаточной простая замена слов.

Современные системы машинного перевода делят на три большие группы:

·основанные на правилах;

·основанные на примерах;

·статистические.

Далее мы рассмотрим эту классификацию подробнее.


2.2.1 СМП, основанные на правилах

Системы машинного перевода основанные на правилах - общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках.

Они состоят из двуязычных словарей и грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим.

На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода. Часто, такие системы противопоставляют системам машинного перевода, которые основаны на примерах.

Принцип работы таких систем - связь структуры входного и выходного предложения. Перевод при этом получается не особенно хорошего качества. Но на простых примерах работает.

Перевод с английского на немецкий будет выглядеть как:

A girl eats an apple. à Ein Madchen isst einen Apfel.

Эти системы делятся на три группы:

·системы пословного перевода;

·трансфертные системы;

·интерлингвистические;

Пословный перевод

Такие системы используются сейчас крайне редко из-за низкого качества перевода. Слова исходного текста преобразуются (как есть) в слова переводного текста. Часто такое преобразование происходит без лемматизации и морфологического анализа. Это самый простой метод машинного перевода. Он используется для перевода длинных списков слов (например, каталогов). Так же он может быть использован для составления подстрочечника для TM-систем.

Трансфертные системы

Как трансфертные системы, так и интерлингвистические, имеют одну и ту же общую идею. Для перевода необходимо иметь посредника, который в себе несет смысл переводимого выражения. В интерлингвистических системах посредник не зависит от пары языков, в то время как в трансфертных - зависит.

Трансфертные системы работают по очень простому принципу: к входному тексту применяются правила, которые ставят в соответствие структуры исходного и переводного языков. Начальный этап работы включает в себя морфологический, синтаксический (а иногда и семантический) анализ текста для создания внутреннего представление. Перевод генерируется из этого представления с использованием двуязычных словарей и грамматических правил. Иногда на основе первичного представления, которое было получено из исходного текста, строят более «абстрактное» внутренне представление. Это делается для того, чтобы акцентировать места важные для перевода, и отбросить несущественные части текста. При построении текста перевода преобразование уровней внутренних представлений происходит в обратном порядке.

При использовании этой стратегии получается достаточно высокое качество переводов, с точностью в районе 90% (хотя это сильно зависит от языковой пары). Работа любой системы трансфертного перевода состоит как минимум из пяти частей:

·морфологический анализ;

·лексическая категоризация;

·лексический трансфер;

·структурный трансфер;

·морфологическая генерация.

Морфологический анализ. Слова исходного текста классифицируются по частям речи. Выявляются их морфологические признаки. Определяются леммы слов.

Лексические категоризации. В любом тексте некоторые слова могут иметь более чем одно значение, вызывая неоднозначность в анализе. При лексической категоризации выявляется контекст слова. Возможны различного рода пометки и уточнения.

Лексический трансфер. На основе двуязычного словаря происходит перевод лемм слов. Действие очень похоже на пословный перевод.

Структурный трансфер. Слова согласуются в предложении.

Морфологическая генерация. На основе выходных данных структурного трансфера создаются словоформы переводного текста.


Одной из основных особенностей трансфеных систем машинного перевода является этап, во время которого промежуточное представление текста на языке оригинала «передается» в промежуточное представление текста в целевом языке. Это может работать на одном из двух уровней лингвистического анализа, или сразу на обоих.

Уровни:

.Поверхностный (синтаксический) трансфер. Этот уровень характеризуется передачей «синтаксических структур» между исходным и переводным языком. Подходит для языков в той же семье или того же типа, например, в романских языков, между итальянским испанским, каталонским, французским, и т.д.

.Глубинный (семантический) трансфер. Уровень характеризуется семантическим представлением. Оно зависит от языка оригинала. Это представление может состоять из ряда структур, которые представляют значение. Перевод также обычно требует структурного трансфера. Этот уровень используется для перевода между более отдаленными языками.

Интерлингвистический машинный перевод

Интерлингвистический машинный перевод - один из классических подходов к машинному переводу. Исходный текст трансформируется в абстрактное представление, которое не зависит от языка (в отличие от трансфертного перевода). Переводной текст создается на основе этого представления. Основным преимуществом такого подхода является то, что для добавления нового языка в систему. Можно доказать математически, что в рамках этого подхода, создания каждого нового интерпретатора языка для такой системы будет удешевлять ее, по сравнению, например, с системой трансфертного перевода. Кроме того, в рамках такого подхода можно

·реализовать «пересказ текста», перефразирование исходного текста в рамках одного языка;

·относительно простая реализация перевода сильно отличающихся языков, таких как, например русский и арабский.

Однако, до сих пор не существует реализаций такого подхода, которые бы корректно работали бы хотя бы для двух языков. Многие эксперты высказывают сомнения в возможности такой реализации. Сама большая сложность для создания подобных систем заключается в проектировании межъязыкового представления. Оно должно быть одновременно абстрактным и независящим от конкретных языков, но в тоже время оно должно отражать особенности любого существующего языка. С другой стороны, в рамках искусственного интеллекта, задача выделения смысла текста на данный момент до сих пор не решена.

Впервые интерлингвистический подход был предложен в 17 веке Декартом и Лейбницем, которые предложили универсальные словари, использующие числовые коды. Другие, такие как Кейв Бек, Афанасий Кирхер и Иоганн Иоахим Бехер работали над разработкой однозначного универсального языка, основанного на принципах логики и иконографики.

В 1668 году Джон Уилкинс в трактате «Опыт о Подлинной символике и философском языке» рассказал о своем интерлингва .

В 18 и 19 веков было разработано много универсальных языков, в том числе и Эсперанто. Известно, что идея универсального языка для машинного перевода, никак не проявилась на начальных этапах развития этой технологии. Вместо нее рассматривались только пары языков. Однако, в течение 1950-х и 60-х годов, исследователи в Кембридже возглавляемые Маргарет Мастерман, в Ленинграде во главе с Николаем Андреевым и в Милане Сильвио Ceccato начали работу в этой области.

В 1970-х и 1980-x годах были сделаны определенные успехи в этой области и был построен ряд систем машинного перевода.

В этом методе перевода, межъязыковое представление можно рассматривать как способ описания анализа текста, на языке оригинала. При этом, в представлении сохраняются морфологические, синтаксические характеристики текста. Предполагается, что таким образом можно передать «смысл» при создании переводного текста.

При этом иногда используется два межъязыковых представления. Одно из них более отражает характеристики исходного языка. Другое - языка перевода. Перевод в данном случае производится в два этапа.

В некоторых случаях используются два и более представления одного уровня (одинаково близкие к обоим языкам), но разнящиеся по тематике. Это необходимо для повышения качества перевода специфических текстов.

Такой подход не нов для лингвистики. Он основан на идеи близости языков. Для улучшения качества перевода, естественный язык используется в качестве моста между двумя другими языками. Например, при переводе с украинского на английский, иногда используется русский язык.

Для использования системы интерлингвистического машинного перевода необходимы:

·словари для анализа и генерации текстов;

·описание грамматик языков;

·база знаний понятий (для создания межъязыкового представления);

·правила проекции понятий для языков и представления.

Самым сложным моментом при создании такого типа является невозможность построить базу для широких областей знаний. А те базы, которые создаются для очень специфичной тематики, обладают высокой вычислительной сложностью.


2.2.2 Системы машинного перевода основанные на примерах

Перевод основанный на примерах - один из подходов к машинному переводу, при котором используется двуязычный корпус текста. Этот корпус текста во время перевода используется как база знаний. Грубо говоря, это перевод по аналогии.

Если задуматься о том, как человек переводит, то мы вряд ли придем к выводу, что переводчик осуществляет глубокий лингвистический анализ. Предполагается, что люди разлагают исходный текст на фразы, потом переводят эти фразы, а далее составляют переводной текст из фраз. Причем, перевод фраз обычно происходит по аналогии с предыдущими переводами.

Для построения системы машинного перевода, основанной на примерах потребуется языковой корпус, составленный из пар предложений.

Языковые пары - тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком - носителем двух языков, так и набором предложений и их переводов, выполненных человеком.

Перевод, основанный на примерах, лучше всего подходит для таких явлений как фразовые глаголы. Значения фразовых глаголов сильно зависит от контекста. Фразовые глаголы очень часто встречаются в разговорном английском языке. Они состоят из глагола с предлогом или наречием. Смысл такого выражения невозможно получить из смыслов составляющих частей. Классические методы перевода в данном случае неприменимы.

Этот метод перевода можно использовать для определения контекста предложений.

Двуязычные корпуса текста

Возникает ожидаемый вопрос, где брать такие пары. Примерами двуязычных корпусов текстов можно назвать парламентские отчеты в Канаде, Гонконге и других странах. Тексты представляют собой протоколы дебатов в парламенте. Кроме того, хорошим примером являются официальные документы Европейского экономического сообщества. Они издаются на 11 языках. Организация объединенных наций публикует документы на нескольких языках. Эти материалы оказались очень полезными для машинного перевода.


2.2.3 Статистический машинный перевод

Статистический машинный перевод - это метод машинного перевода. Он использует сравнение больших объёмов языковых пар, так же как и машинный перевод основанный на примерах.

Статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучше результат статистического машинного перевода.

Статистический машинный перевод основан на поиске наиболее вероятного перевода предложения с использованием данных из двуязычных корпусов текстов. В результате при выполнении перевода компьютер не оперирует лингвистическими алгоритмами, а вычисляет вероятность применения того или иного слова или выражения. Слово или последовательность слов, имеющие оптимальную вероятность, считаются наиболее соответствующими переводу исходного текста и подставляются компьютером в получаемый в результате текст.

В статистическом машинном переводе ставится задача не перевода текста, а задача его расшифровки. Мы предполагаем, что статья, написанная на английском языке, на самом деле является статьей написанной на английском, но текст зашифрован (или искажен шумом). При таком подходе становится понятно почему, чем дальше языки, тем лучше работает статистический метод, по сравнению с классическими подходами.

Подробнее о математической модели статистического машинного перевода (Модель Шеннона) рассказано далее.

Модель Шеннона

Модель состоит из пяти элементов: источника информации, передатчика, канала передачи, приемника и конечной цели, расположенных линейно.

Передатчик кодирует информацию, полученную от источника, и передает ее на канал. По каналу передачи, на который действует шум - помехи любого рода, искажающие информацию, данные поступают в приемник, где они декодируется и передаются к конечной цели.


Из-за шума полученная приемником информация в общем случае не совпадает с информацией, отправленной передатчиком. Однако, согласно Шеннону, создавая избыточную информацию, исходные данные можно восстановить со сколь угодно высокой вероятностью. Для обнаружения ошибок используются контрольные суммы, для их исправления - специальные корректирующие коды (при условии, что степень шума не превосходит некоторой границы).

Стоит отметить, что любая информация в некотором роде избыточна (Shannon, 1948: 380). Человеческая речь избыточна - чтобы уловить смысл предложения, зачастую необязательно слышать его полностью. Аналогично, письменная речь, тоже избыточна, и при переводе этим можно воспользоваться. Если предложение в целом понятно, но есть несколько незнакомых слов, то обычно не трудно догадаться об их значении.

Таким образом, для перевода текста необходимо найти способ декодирования, использующий естественную избыточность, в связи с чем декодирование должно быть вероятностным.

Задача такого декодирования заключается в том, чтобы, при данном сообщении, найти исходное сообщение, которому соответствует наибольшая вероятность. Для этого же необходимо для любых двух сообщений уметь находить условную вероятность того, что переведенное сообщение, пройдя через канал с шумом, преобразуется в исходное сообщение.

В данном случае нужна модель источника (модель языка) и модель канала (модель перевода). Модель языка дает оценку вероятности фразам переводного языка, а модель перевода оценивает вероятность исходной фразы при условии фразы на переводном языке.

Если нам нужно перевести фразу с русского на английский, то мы должны знать, что именно обычно говорят по-английски и как английские фразы искажаются до состояния русского языка. Сам по себе перевод превращается в процесс поиска такой английской фразы, которая максимизировала бы произведения безусловной вероятности английской фразы и вероятности русской фразы (оригинала) при условии данной английской фразы.



·E - фраза перевода (английская);

·R - фраза оригинала (русская).

В системах статистического перевода, в качестве модели языка используются варианты n-граммной модели (например, в переводчике Google, использутеся 5-граммная модель). Согласно этой модели, правильность выбора того или иного слова зависит только от предшествующих (n-1) слов.

Самой простой статистической моделью перевода является модель дословного перевода. В этой модели, известной как Модель IBM №1, предполагается, что для перевода предложения с одного языка на другой достаточно перевести все слова (создать «мешок слов»), а расстановку их в правильном порядке обеспечит модель языка. Единственным массивом данных, которым оперирует Модель №1, является таблица вероятностей парных переводных соответствий слов двух языков (Рахимбердиев, 2003: 101). Обычно используются более сложные модели перевода. Многие из них являются коммерческими тайнами компаний разработчиков.

Работа статистических систем, так же как и систем основанных на примерах происходит в двух режимах: обучения и эксплуатации.

В режиме обучения просматриваются параллельные корпуса текста и вычисляются вероятности переводных соответствий. Строится модель языка перевода. Тут же определяются вероятности каждого n-грамма.

В режиме эксплуатации, для фразы из исходного текста ищется фраза переводного текста, так, чтобы максимизировать произведение вероятностей.


2.3 ТМ-системы


После работы СМП (трансфертного типа, Example-Based) не опознанные фрагменты текста переводятся на иностранный язык вручную. При этом можно воспользоваться процедурой приближенного поиска этих фрагментов в базе данных, а результаты поиска использовать как подсказку. Результаты ручного перевода новых фрагментов текстов можно снова вводить в базу данных. Тогда, по мере перевода все новых и новых документов, «память переводчика» будет постепенно обогащаться, и ее эффективность будет возрастать. Бесспорным достоинством технологии «памяти переводчика» является высокое качество перевода того класса текстов, для которого она создавалась.

Но базы переводных соответствий, построенные для однородных текстов одного предприятия, пригодны лишь для однородных текстов близких по профилю предприятий, так как предложения и большие фрагменты предложений, извлекаемые из текстов одних документов, как правило, не встречаются или очень редко встречаются в текстах других документов. Практическая реализация связаны с большими трудозатратами на создание «памяти переводчика» или пополнение массивов двуязычных текстов (билингв). По такой системе чаще всего и переводятся научные, технические и математические тексты. Авторам этой работы, в частности, известно, что подобный подход часто используется Курчатовском институте.

2.4 Сравнение различных типов СМП



Рассмотрим кратко преимущества и недостатки существующих систем.

Системы пословного перевода на данный момент используются только для составления подстрочечника, как отмечалось ранее.

Преимущества:

·простота;

·высокая скорость работы;

·не требовательные к ресурсам.

Недостатки: низкое качество перевода.

Ярких представителей на рынке нет, в данном случае удобнее создавать новую систему под конкретную задачу.

Трансфертные системы распространены очень широко.

Наиболее известными представителями являются:

·ImTranslator;

·PROMPT.

Все подобные системы имеют сходные преимущества и недостатки.

Преимущества:

·высокое качество перевода

(при наличие нужных словарей и правил);

·обычно есть выбор тематики текста, который повышает качество перевода;

·возможно уточнение перевода, благодаря внесению изменений в базу данных переводчика (таким образом, пользователь получает потенциально бесконечное множество терминов, с которыми можно свободно оперировать, и можно достигнуть «бесконечного» качества перевода).

Недостатки:

·высокая стоимость и время разработки;

·для добавления нового языка, приходиться переделывать систему заново;

·нужна команда квалифицированных лингвистов, для описания каждого исходного и каждого переводного языка.

·требовательность к ресурсам на этапе составления базы.

Интерлингвистические системы перевода так и не были доведены до уровня промышленных систем.

Предполагаемые преимущества:

·высокое качество перевода, независимо от выбора языка.

·выделение смысла из исходного текста происходит один раз и потом записывается на любой язык, в том числе исходный

(получаем «пересказ текста»);

·низкая стоимость трудозатрат на добавления нового языка в систему.

Недостатки:

·спорность потенциальной возможности;

·высокая сложность разработки;

Количество труда, которое требуется для повышения качества перевода на какой-то процент, увеличивается с тем, какой этот процент по порядку.

·системы не масштабируются.

Модель интерлингвистического привела к тому, что в России стала делаться система машинного перевода ЭТАП, на которую было затрачено огромное количество времени и сил, без какого-либо видимого результата.

В компании Abbyy, в течение десяти лет, под руководством В. П. Селегея, тоже пытаются создать интерлингвистическую систему.

Можно еще упомянуть проект ДИАЛИНГ. Результатом проекта стала только библиотеки машинной морфологии русского языка (сайт aot.ru).

СМП, основанные на примерах, так же не имеют ярких представителей. Существующие прототипы используются в академической среде для иллюстрации самого метода. Часто они поставляются не в виде готового продукта, а в виде набора библиотек:

·Marclator - СМП Дублинского Университета;

·Cunei - гибридная СМП, основанная на переводе по аналогии и на статистическом переводе.

Рассмотрим преимущества и недостатки таких систем:

Преимущества:

·высокое качество перевода

(при наличие достаточно долгой тренировке системы);

·хорошо справляется со многими контекстными задачами

(фразовые глаголы);

·квалифицированные лингвисты не нужны непосредственно для построения системы, нужны только инженеры;

·логическая простота устройства;

·возможно обучение системы во время ее эксплуатации.

Недостатки:

·для обучения системы нужны большие параллельные корпуса текста, размеченные определенным образом.

·перевод сильно зависит от корпусов, которые использовались при обучении;

·для создания подобных систем требуются специализированные языки программирования;

·продолжительное время обучения;

·требовательность к ресурсам на этапе обучения.

Статистические системы машинного перевода активно разрабатывались (и разрабатываются) компанией IBM. Благодаря ее разработкам, были созданы модели перевода IBM Model 1-5. Но наибольшую известность этот метод приобрел благодаря компании Google. Кроме переводчика Google существует еще ряд систем и библиотек, использующих статистический подход:

·Giza++ ;

·Moses;

·Pharaoh;

·Rewrite;

·BLEU scoring tool.

Не очень давно появился статистический переводчик для Яндекса, правда пока он владеет только русским, английским и украинским.

Преимущества:

·высокое качество перевода (для фраз, которые целиком помещаются в n-граммную модель):

§при наличие достаточно долгой тренировке системы.

§при наличие качественных корпусов текста;

·квалифицированные лингвисты не нужны непосредственно для построения системы, нужны только инженеры;

·труд человека минимизирован для создания таких систем;

·не требуется перестраивать систему при добавлении нового языка;

·возможно обучение системы во время ее эксплуатации.

Недостатки:

·для обучения нужны большие параллельные корпуса текста;

·сложный математический аппарат;

·качественный перевод возможен только для фраз, которые целиком помещаются в n-граммную модель;

·перевод сильно зависит от корпусов, которые использовались при обучении.

·при добавлении нового языка приходится анализировать большое количество параллельных корпусов;

·продолжительное время обучения;

·требовательность к ресурсам на этапе обучения.

Преимущества и недостатки СМП, основанных на примерах, и статистических СМП во многом совпадают. Однако огромным преимуществом последних является то, что обучение таких систем происходит без участия человека. Для статистического перевода не нужна дополнительная разметка корпусов текста, это значительно упрощает их построение. С другой стороны для качественного обучения и тех и других нужны значительные объемы параллельных текстов. Потому часто переводчики являются дополнительными сервисами поисковых систем (Google, Яндекс). На данный момент, статистические системы являются лидерами по соотношению цена / качество для всех СМП.

3. Структурно-семантические трансформации в англоязычном научно техническом тексте при машинном переводе


Ниже мы рассмотрим стилистические особенности отрывков из приложений и проведем анализ перевода, выполненного статистической и трансфертной системами машинного перевода. Трансфертная система рассматривается на примере ПРОМПТ 9.0, статистическая - на примере Google Переводчик


.1 Основные особенности


Отрывки в основном написаны в научном стиле. Как и любой реальный текст, обладают стилистической неоднородностью. Безусловно, есть некоторые моменты, которые приближают текст к художественному. Однако, учитывая направленность книги Д. Кнута, приходится говорить исключительно о научном стиле.

Рассматриваемый текст обладает свойствами:

·доходчивости;

·логической последовательности;

·объективности изложения;

·традиционности.

Авторы русского перевода попытались сгладить некоторые традиционные научные штампы, используемые в тексте, что сделало язык отрывка живее, хотя и исказило немного его стилистически. С другой стороны в других частях текста были замечены обратные преобразования. Можно говорить о переводческой компенсации. Рассматривая, машинный перевод отрывка, конечно, ни о какой компенсации не может идти и речи.

Все четыре свойства были переданы, «так как они есть». Правда, некоторое сомнение вызывает свойство доходчивости. На некоторых участках текста оно страдает из-за ошибок согласования. (Важно отметить, что для трансфертной системы количество таких ошибок значительно ниже.) В первом отрывке можно найти описание алгоритма Евклида. Даже без специального анализа не трудно сказать, что стиль алгоритма и стиль основного текста сильно отличаются. Если внимательно посмотреть на англоязычное описание, то можно сделать вывод (отчасти ложный), о том, что изложение ведется на формальном императивном языке обработки данных. В русском варианте алгоритма стилистическая разница немного сглажена. С одной стороны, это облегчает восприятие, но уменьшает необходимую формальность описания.

Тут надо знать, какую цель преследовал автор, приводя описание алгоритма. Варианты: для иллюстрации, для понимания, для последующего воплощения в «истинно формальном» языке.

Все три отрывка обладают свойством логической последовательности.

Сами отрывки между собой не связаны, ибо умышлено, взяты из разных участков текста. Однако внутри отрывка можно видеть последовательное развитие мысли от простого к сложному.

В первом отрывке текста автор хочет показать читателю, что на протяжении всей книги будет называться алгоритмом. Сначала рассказывается об этимологии этого слова, далее приводится пример алгоритма, и только после этого рассказывается о структуре книги и том, как далее будут алгоритмы обозначаться.

Во втором отрывке автор хочет привести пример использования логической структуры связных списков.

Сначала рассказывается о дискретном моделировании вообще и его отличии от непрерывного моделирования и потом приводится описание самой модели. За пределами этого отрывка автор приводит формальное описание модели.

В третьем отрывке автор приводит свои рассуждения по поводу применимости приведенных ранее (за пределами отрывка) логических вычислительных моделей - связывающих автоматов, и машин Тьюринга.

Логическая структура отрывков была легко отражена во всех вариантах их переводов. СМП смогли передать основную мысль отрывков. Несмотря на то, что в случае трансфертной СМП третий отрывок выглядит как набор слов, и требует значительной правки, мысли автора восстановить не сложно. Последний эффект связан с тем, что третий отрывок содержит большое число специфических терминов, которые даже профессиональный переводчик не рискнул переводить.

Стилистически машинный перевод оказался более близок к оригиналу. Например, в следующем отрывке переводчик нарушил свойство традиционности. Двенадцатое предложение третьего отрывка:

Many years have passed since the author wrote most the comments above,

Вариант статистической СМП:

Много лет прошло с тех пор [как] автор написал большую часть комментарии выше,

Вариант переводчика:

Со времени первого написания автором большинства приведенных выше комментариев утекло много воды.

Однако в ряде случаев, отступления от авторского стиля были продиктованы отечественными традициями научно-технической литературы, о которых системам машинного перевода ничего не известно.

Это например относится, к тому что переводчик пытался избежать тавтологий и множественное скромности.

Не всегда перевод выполненный человеком обладает объективностью. При анализе отрывков мы в этом убедились. В ряде случаев, переводчик немного трансформировал мысли автора, подменил собственными суждениями. СМП, особенно статистические, лишены этого недостатка.

Например, в двадцать восьмом предложении второго отрывка

… but it is believed …

Переводчик передал с искажением смысла:

… но автор все же верит …

Примечателен тот факт, что в ряде случаев перевод созданные машиной практически не отличается от варианта переводчика. Например, второе предложение второго отрывка трансфертная СМП как

«Дискретное моделирование» означает моделирование системы, в которой все изменения состояния системы, как может предполагаться, происходят в определенные дискретные моменты времени.

С первого взгляда невозможно понять, что перевод сделала машина. И только после анализа перевода и оригинала текста можно увидеть некоторые стилистические ошибки. Иногда перевод машины оказывался точнее, чем вариант переводчика. С подобным явлением мы столкнулись в семнадцатом предложении первого отрывка.


3.2 Лексические особенности


В тексте встречаются слова общего языка, то есть общеупотребительная лексика:

The notion of an algorithm is basic to all of computer programming ...word did not appear in Websters New World Dictionary as late as 1957 chapters are divided into numbered sections ...

В рамках это лексики осуществлен перевод как СМП, так и человеком. В данном случае машина ошиблась только в согласовании определений. С другой стороны, системы перевода не всегда удачно разрешает омонимию. Потому в машинном переводе текста присутствуют бессмысленные фразы.

Каждый алгоритм рассмотрим было уделено выявлению письмо (E и в предыдущем примере), и шаги алгоритма обозначены этим письмом последовал ряд (El, E2, E3).

В слова, в некоторых случаях переводчик позволил себе вольность, а машина перевела точнее

The format above illustrates the style in which all of the algorithms throughout this book will be presented.

В данном случае, format выступает в значении формат, структура, вид. Однако переводчик-человек это перевел как

Приведенная выше формулировка иллюстрирует стиль, в котором алгоритмы будут представлены на протяжении всей этой книги.

Слово формулировка не обладающим оригиналом читателем может быть воспринято, как утверждение, что, в контексте изложения, является неверным и вызывает непонимание. Машина в этом случае перевела фразу шаблонно. Для статистической СМП:

Формат выше иллюстрирует стиль, в котором все алгоритмы в этой книге будут представлены.

Для трансфертной СМП:

Формат выше иллюстрирует стиль, в котором будут представлены все алгоритмы всюду по этой книге..

Перевод выглядит примитивно, но в этом случае именно такой вариант перевода передает смысл более полно.

В первом отрывке встречаются слова закрепленные за определенными понятиями, но не являющиеся терминами. С другой стороны в рамках конкретной области их не всегда легко отделить от терминов.

... a process for finding the greatest common divisor of two numbers thatin Euclids Elements...two positive integers m and n, find their greatest common divisor, that is, the largest positive integer that evenly divides both m and n.

Подобные термины, которые «выглядят как простые слова» очень характерны для английского языка. В русском языке, в данном случае могут быть иные формулировки, не похожие по структуре на английские. Важно заметит, что в данном случае positive integers это именно натуральные числа. Перевод сделанный машиной оказался более точным.

А вот, например, для наибольшего общего делителя трансфертная СМП допустила искажение термина.

чтобы найти самый большой общий делитель двух чисел,

Нельзя квалифицировать фразу как ошибку, однако при прочтении такого варианта перевода может возникнуть непонимание, что речь идет именно о наибольшем общем делителе.

Во втором отрывке термины встречаются чаще.

As an example of the use of {{doubly linked lists}}, we will now consider the writing of a discrete simulation program.

Термин в фигурных скобках в современной литературе обычно переводится как двунаправленные связанные списки. Термин был переведен корректно только трансфертной СМП. И человек и статическая СМП употребили в данном случае кальку с английского языка.

В качестве примера использования дважды связанных списков ….

Однако в этом же предложении есть термин

a discrete simulation program.

Только человек корректно перевел термин.

программу дискретного моделирования

В то время как СМП перевели фразу соответственно:

отдельной программы моделирования.

дискретной программы моделирования.

В контексте повествования это не является критичным, но термин использован неверно discrete относится именно к simulation. Подобная ситуация встречается несколько раз в этом отрывке. Явление можно объяснить тем, что СМП неверно разрешают препозитивную определительную группы discrete simulation program.

Верную интерпретацию можно изобразить как:

((discrete simulation) program)

В то время как СМП воспринимают это как:

(discrete (simulation program))

Например, в оригинале:

... illustrate typical implementation techniques used with discrete simulation programs.

Статистическая СМП перевела как:

... иллюстрируют типичные методы осуществления использоваться с дискретными программ моделирования.

Трансфертная СМП перевела как:

... иллюстрируют типичные методы реализации, используемые дискретными программами моделирования.

Человек перевел:

... типичные методики, которые используются в программах дискретного моделирования.

Ниже во втором отрывке обе СМП справились с подобной ситуацией, но очень вероятно, что это связано с положением термина в предложении.

Continuous simulation can often be satisfactorily approximated by discrete simulation.

Однако слово approximated было переведено точно только машинами. Человек позволил себе некоторую вольность

Непрерывное моделирование часто можно вполне удовлетворительно имитировать с помощью дискретного моделирования.

Всего скорее, в данном случае это не сильно важно, однако при таком употреблении немного исчезает точность изложения. Непрерывное моделирование именно аппроксимируется, приближается.

Интересно так же рассмотреть иную ситуацию из второго отрывка

Оригинал:floor 2 in NEUTRAL state, the doors will eventually close and the machine {{will wait silently for another command}}.

Статистическая СМП:

На этаже 2 в нейтральном состоянии, двери, в конечном счете закроются и машина {{будет ждать молча для другой команды}}.

Трансфертная СМП:

На полу 2 в нейтральном состоянии, в конечном счете закроются двери, и машина {{будет ожидать тихо другой команды}}.

Переводчик человек:

Если лифт находится на этаже 2 в состоянии NEUTRAL, двери со временем закроются и лифт будет {{ожидать следующей команды}}.

Вообще ожидать следующей команды (wait another command) является термином. Автор в данном случае решил сгладить сухой термин, добавив слово silently. Однако, переводчик решил не передавать шутки автора. Трудно сказать, верно ли он поступил, но СМП передать эту шутку удалось, хотя термин был искажен и повествование получилось не столь строгим.

К сожалению, обе СМП коверкают термины причем там где это имеет значение для правильного понимания текста. Например, фразу elevator {{takes a certain amount of time}}

Трансфертная СМП перевела как

Лифт {{берет определенное количество времени}} …

Может показаться, что это не важно, однако, в контексте повествования слово «берет» может быть воспринято ошибочно, так ранее речь идет о переменных.

Очень интересно рассмотреть выражение home floor с точки зрения термина. Оно не является термином даже в текущем контексте изложения. Но всего скорее автор пытался создать у читателя аналогию с компьютерным термином home folder, home directory. На наш взгляд такая аналогия в примере автора более чем уместна, так как позволяет понять как ведет себя моделируемый объект. Переводчик в данном случае решил отказаться от этой аналогии и употребил фразу «базовый этаж».

В то время, как СМП перевели ее шаблонно на уровне эквивалентных трансформации - домашний пол, домашний этаж.

Третий отрывок с точки зрения терминологии является наиболее сложным. Важно отметить, что он является сложным не только для перевода, но и для восприятия. Такие термины как связывающие автоматы (linking automata), и машины графов (graph machines) были переведены неверно СМП, и без оригинала сложно понять о чем идет речь. Вообще слово linking, на протяжении всего третьего отрывка, СМП перевели как общеупотребительное слово, но ни как термин.

С другой стороны сложные фразы типа

Turing machines having multiple tapes and read/write heads

были переведены СМП как

статистическая СМП:

машин Тьюринга, имеющих несколько лент и головок чтения / записи

трансфертная СМП:

машин Тьюринга, имеющих многократные ленты и комбинированные головки

Причем человек перевел

машин Тьюринга с множеством лент и головок чтения/записи

Интересно заметить, что для трансфертной СМП оказалась известна фраза комбинированные головки. Это говорит о применении вариантных трансформаций в трансфертной СМП - перевод происходит не так примитивно, как это могло бы показаться. С другой стороны примененное обобщение может повлиять на качество восприятия.

Однако, ниже фраза multitape Turing machine (многоленточная машина Тьюринга) была переведена достаточно странно и верно термин был переведен только человеком.

Статистическая СМП поступает очень интересно с таким термином. И фразу multitape Turing machine, и one-tape Turing machine она переводит просто как машина Тьюринга. (Понимая принципы работы статистических машин легко объяснить природу этого эффекта.) С точки зрения научно-технической литературы это совсем не верно, но в рамках иных стилей подобный подход мог быть оправдан.

Так же, достаточно сложным термином является выражение pointer machines. Учитывая, то что переводчик указал в скобках ориганальный термин (на английском языке), можно утверждать что русского устойчивого аналога выражения просто не существует. Не удивительно, что обе СМП не справились с этим термином.

Вариант статистической СМП:

… сейчас он называется указатель машин …

Вариант трансфертной СМП:

… теперь названным машинами указателя …

Вариант переводчика:

… сегодня называемых машинами указателей (pointer machines) …

В тексте можно заметить использование устойчивых выражений, характерных для научной прозы.

Finally, historians of mathematics found the true origin of the word algorism:course, Euclid did not present his algorithm in just this manner.example, we are now in Section 1.1, however, it is unlikely that

Подобные, слова являются обособленными, потому с ними может справится даже самая простейшая система машинного перевода.

Важно, что общелингвистическое и специальное значение таких слов совпадает для русского и английского языков (чего в общем случае утверждать нельзя). Устойчивые фразы из второго отрывка такие как:

The methods to be discussed below …

Были переведены СМП как

Методы, которые будут обсуждаться ниже …

Однако переводчик перевел фразу так же усточивой для русского языка фразой

Рассматриваемые ниже методы…

В большинстве случаем перевод сделанный СМП и человеком таких устойчивых фраз совпадает.

В тексте можно так же заметить логическое подчеркивание. Благодаря своей шаблонности, такие маркеры так же весьма удачно переводятся машиной. В третьем отрывке:of the most interesting problems …

Статистическая СМП:

Некоторые из наиболее интересных задач …

Трансфертная СМП:

Некоторые из самых интересных проблем …

Переводчик:

Самыми интересными проблемами …

Переводчик опять позволил себе вольность, однако это не является критическим в данном случае. Но, это несколько искажает смысл фразы. Переводчик ограничивает круг жестче интересных проблем, в то время как автор этого не делает. Эту же фразу можно классифицировать, как и выражение количественной экспрессивности. Можно утверждать, что переводчик умышленно ее усиливает.

Логическое подчеркивание видно на примере предложения

So far we have described the elevator from a user's point of view; the situation is more interesting as viewed by the elevator.

В данном случае противопоставляются две точки зрения, и на вторую автор хочет обратить особое внимание, потому что далее речь пойдет именно о ней. Статистическая СМП перевела это предложение как:

До сих пор мы описали лифт с точки зрения пользователя, ситуация более интересная, если смотреть на лифте.

Вариант трансфертной системы и вариант переводчика не сильно стилистически отличаются, хотя обе СМП сильно исказили текст, следующий за подчеркиванием

До сих пор мы описали лифт с точки зрения пользователя; ситуация более интересна как просматривающийся лифтом.

До сих пор работа лифта описывалась с точки зрения пользователя, но ситуация станет более интересной, если рассмотреть ее с точки зрения лифта.

В тексте встречается количественная экспрессивность

В конце первого отрывка:

... most frequently associated with Euclid's algorithm,

Статистическая СМП:

... чаще всего связаны с алгоритмом Евклида ...

Трансфертная СМП:

... наиболее часто связывался с алгоритмом Евклида ...

Переводчик:

... чаще всего ассоциировалось с алгоритмом Евклида ...

Интересно заметить, что различные СМП перевели фразы по-разному.

Варианты, сделанные переводчиком и машиной, являются верными и те и другие отражают экспрессивность, но различными средствами. Отдельное внимание стоит обратить на тот факт, что варрант статистической СМП совпал с вариантом переводчика. Это говорит о том, что в русском техническом тексте используется именно этот вариант перевода. Трансфертная СМП действовала в данном случае по заложенным в нее правилам. Она выдала, тоже верный вариант, но он не является устойчивым и в процессе беглого прочтения может быть воспринят неверно.

Сходная ситуация наблюдается и в примере ниже. Вариант трансфертной СМП больше отличается от вариант переводчика, чем вариант статистической. Все три варианта перевода верны.

В конце второго отрывка:

… algorithm below, which is much more precise …

Статистическая СМП:

… алгоритм, который является гораздо более точным ….

Трансфертная СМП:

… в алгоритме ниже, который намного более точен …

Переводчик:

… в алгоритме, который выглядит гораздо более строго …

В первом отрывке встречается большое количество точных дат, которые так же являются показателем научности. В научном тексте, обычно, вся числовая информация передается цифрами, и даты не являются исключением, потому и для машин и для переводчиков «перевод» подобных слов выполняется крайне просто.

Иначе дело обстоит с географическими названиями и именами собственными. В рассматриваемом тексте правильное название городов и других объектов не критичны, но они показывают кругозор автора и его осведомленность. При переводе таких слов надо учитывать именование таких объектов принятое в русской литературе.

В седьмом предложении первого отрывкаAral Sea in Central Asia was once known as Lake Khwarizm …

Статистическая СМП:

Аральское море в Центральной Азии когда-то называлось озером Хорезм …

Трансфертная СМП:

Аральское море в Средней Азии было когда-то известно как Озеро Хваризм, …

Переводчик:

Аральское море в Центральной Азии было когда-то называли озеро Хорезм …

Здесь можно увидеть сразу два географических объекта регион Средней Азии и озеро Хорезм.

Именование первого термина имеет различную географическую и политическую трактовку. Анализируя перевод сделанный человеком, приходится учитывать текущие веяния и, возможно, оказываемое на переводчика давление. В случае СМП дело обстоит не намного проще, ибо ряд фраз мог быть жестко прописан в алгоритме перевода. Аналогичная ситуация касается не только географических объектов, но так же может проявиться при переводе любых названий и именований, особенно если объекты реального мира были названы в честь какого-либо ученого или общественного деятеля.

Еще более интересная ситуация складывается, если в момент написания оригинала и в текущей момент объекты назывались по-разному. В данном случае такая ситуация тоже имеет место быть. Мы считаем, что переводить термин Central Asia в этом предложении следует именно как Средняя Азия. Именно так назывался этот регион, когда Д. Кнут писал свой труд. Однако, в текущий момент регион называется Центральной Азии. Это название было закреплено за регионом, во время работы переводчика. Этим объясняется его вариант перевода.

В случае перевода статистической СМП, то вероятно, что название было переведено как выражение общей лексики, без осознания того, что это имя собственное. Но точно утверждать нельзя. В трансфертную СМП перевод словосочетания был заложен жестко.

Для уменьшения разночтений переводов научно-технической литературы, нам кажется наиболее приемлемым обращаться к оригиналу и уже самостоятельно делать выводы на основе экстралингвистических знаний.

Рассмотрим второй географический объект, который встретился в этом предложении. Правильное русское название Lake Khwarizm - озеро Хорезм. Однако, трансфертная СМП в данном случае использовала транслитерацию. В данном случае - недопустимо, потому что это дает неверные представления и если указанного слово не оказалось в базе данных СМП, то его лучше оставить без перевода и привести оригинальное название из авторского текста. Такой подход был использован в этом же предложении.

В тексте:

... Amu River basin just south of that sea.

Статистическая СМП:

... в бассейне реки Амударьи к югу от этого моря.

Трансфертная СМП:

... в бассейне реки Amu только к югу от того моря.

Переводчик:

... в бассейне реки Амударьи южнее этого моря.

Далее в тексте первого отрывка можно найти (третье предложение):

... did not appear in Webster's New World Dictionary ...

Статистическая СМП:

... не появится в Новом Свете Словарь Вебстера ...

Трансфертная СМП:

... не появлялось в Новом Мировом Словаре Вебстера...

Вариант переводчика:

... не было в издании словаря Websters New World Dictionary …

На наш взгляд, более верным является второй вариант перевода. Перевод был явно калькирован, но он не выглядит бессмысленно как в случае статистической СМП. Вариант, который предложил переводчик тоже верен, однако много слов на иностранном языке вызывает неприятное впечатление. Важно отметить, что официального русскоязычного перевода названия словаря до сих пор нет.


.3 Синтаксические особенности


Стоит сразу сказать, что СМП рассматриваемых типов не могут кардинальным образом влиять на синтаксические особенности текста. Они оставляют структуру сверхфразовых единств и предложений такой, какая она была в оригинальном тексте. Этот факт был нами проверен на исследуемых отрывках.

В некоторых случаях статистическая СМП, в текущей реализации, может менять порядок слов. Но эти изменения маловероятны, и будут происходить только внутри пятерок слов. Нами подобное поведение установлено не было, но это не говорит, о том, что оно не может быть обнаружено на других текстах или при другой исходной базе СМП.

Сохранение оригинальной синтаксической структуры является плюсом систем перевода. Но такой подход не всегда возможен. В научных текстах очень часто встречаются распространенные сложные предложения. Если разбивать такие предложения, то текст будет легче для восприятия. Переводчик-человек может учесть этот факт и упростить авторский текст.

При этом будет потерян авторский стиль. Подобную ситуацию можно наблюдать в пятом и девятнадцатом предложении первого отрывка, во первой части двадцать пятого предложения второго отрывка.

СМП не обладает информацией о мысли, которую хотел донести автор. Она оперирует только лингвистическими знаниями и никакой разбивки предложений не производит.

Возможна и обратная ситуация, когда мысль автора выражена не одним, а несколькими предложениями. В этом случае, переводчик имеет право соединить две части высказывания, чтобы нагляднее донести мысль автора. СМП переведет авторский текст так, как он есть, без каких либо изменений структуры. Подобная ситуация прослеживается в последнем предложении третьего отрывка.

В англоязычной научной прозе для сложносочиненных предложений часто используют знак препинания «точка с запятой». В отечественной литературе знак используется только для маркированных списков.

При анализе оригинального текста на английском языке (особенно математического), заранее не известно, какую функцию несет «точка с запятой». Потому в этом случае, СМП не меняет структуры. Но человек, следуя отечественной традиции, может поменять знаки препинания.

Подобную ситуацию можно наблюдать в третьем и восьмом предложениях первого отрывка, в третьем, шестом, восьмом предложении и в первой части двадцать пятого предложения второго отрывка, в седьмом предложении третьего отрывка.

Рассматриваемый текст имеет четкую структуру. Первый отрывок делится на шесть абзацев и без учета алгоритма содержит двенадцать предложений. Второй отрывок делится на семь абзацев и содержит двадцать восемь предложений. Третий отрывок содержит четыре абзаца и содержит тринадцать предложений.

В каждом абзаце выдвигается определенное предположение, которое в нем же и доказывается. Например, в начале второго отрывкаcontrast, a "continuous simulation" would be simulation of activities that are under continuous changes, such as traffic moving on a highway, spaceships traveling to other planets, etc.

Ниже до начала следующего абзаца рассказывается о непрерывном моделировании и его отличиях от дискретного.

В отрывке можно предложения с прямым порядком слов, которые можно считать определениями.

... algorithm is basic to all of computer programming...

... that [common divisor] is, the largest positive integer that divides both m and n.

... n is the answer ...

В научно-техническом тексте достаточно часто встречаются и обычные «настоящие» определения. В рассмотренных отрывках виде они в явном виде не встретились. Малое количество определений в отрывках еще раз подчеркивает, что реальные научные тексты обладают стилистической неоднородностью. Часто автору проще донести свою мысль косвенно, неприбегая к именованию. Последнее представляет значительную сложность для СМП, так как тут не всегда можно обойтись эквивалентными трансформациями.

Четвертое предложение второго отрывка:a discrete simulation, we proceed by doing whatever is to be done at a certain instant of simulated time …

Переводчик передал фразу как неявное определение:

При этом процесс моделирования заключается в выполнении определенных действий, предусмотренных для данного момента …

Что может быть передано в явном виде как

Процесс моделирования - суть выполнение определенных действий, предусмотренных для данного момента …

Однако СМП передали это предложение с сильным искажением:

Статистическая СМП:

В дискретного моделирования, мы проведем делать то, что должно быть сделано в определенный момент времени моделирования …

Трансфертная СМП:

На дискретном моделировании мы продолжаем, делая независимо от того, что должно быть сделано в определенный момент моделируемого времени …

Машины перевели максимально близко к тексту автора, однако основная идея высказывания была потеряна. Для научного текста - это серьезная проблема. На данном этапе развития технологий не представляется возможным автоматизировано, в общем случае, выделять дефидент и дефиницию для неявных определений.

Существует несколько вариантов решения этой проблемы:

·предобработка исходного текста, на предмет разрешения подобных смысловых групп, и их преобразования в явные;

·чтение машинного перевода текста параллельно с оригиналом;

Однако, ни один из способов не может быть удовлетворителен, так как потребует дополнительных затрат времени и дополнительных знаний.

Методы автоматического построения синонимичных конструкций на данный момент так же требуют доработки. При их применении опять же потребуется проверка результата. И мы придем опять к той же проблеме. Остается надеяться, что проблема разбора неявных определений исчезнет в недалеком будущем.

Следующий пример тоже можно считать определением.

Второе предложение второго отрывка:

"Discrete simulation" means the simulation of a system …

Обе СМП и переводчик

«Дискретное моделирование» означает моделирование системы …

Совпадение всех трех вариантов перевода объясняется логичностью и простотой фразы.

Большая часть предложений имеет прямой порядок слов. В тексте преобладают сложноподчиненные предложения. На шестьдесят одно предложение всех трех отрывков (без учета алгоритма Евклида) было обнаружено двадцать девять сложноподчиненных предложений, что составляет примерно сорок семь процентов.

Большая часть придаточных предложений в рассматриваемых отрывках оказалась индивидуализирующими определительными. Вторыми по частоте оказались придаточные условия. Благодаря своей четкой регулярной структуре такие предложения были корректно переведены обеими СМП.

Сложноподчиненных предложений не абсолютное большинство среди всех рассмотренных предложений, но важно учитывать, что предложения содержат себе более чем одно придаточное. Более того, эти придаточные относятся к разным типам. При переводе таких сложных предложений с помощью СМП лучше производить их предварительную обработку. СМП не всегда могут выявить к кому члену (основного или придаточного предложения) относится то или иное придаточное. Из-за этого многие сложные предложения превратились в набор слов.

Например, к таким предложениям относится седьмое предложение третьего отрывка. Оно содержит семь придаточных: уступки, причины условия и придаточное предложение сказуемое.

Для удобства восприятия предложение каждая основа записана на отдельной строке. Конец каждой распространенной основы обозначим символом конкатенации строк «?».

We must admit that, ?

as the number n of nodes created a linking automaton approaches infinity, ?don't know how to build such a device physically, ?we want ?machine operations to take same amount of time regardless of the size of n; ?linking is represented by using addresses as in a computer memory, ?is necessary to put a bound on the number of nodes, ?the link fields have a fixed size.

Статистическая СМП c таким предложением справилась плохо. Понять смысл высказывания без оригинала текста невозможно. Поведение системы перевода объясняется ее устройством, а именно тем, что вычисляются частоты использования именно для пятерок слов. Для верного перевода данного предложения уместнее было бы анализировать набор слов, в который бы всегда попадали, по крайней мере, две основы.

Статистическая СМП:

Мы должны признать, что, ?

как число n узлов,

созданных по образцы бесконечности автомата подходы, ?

мы не знаем, как построить такие устройства физически, ?

так как мы хотим ?

машинных операций принять

столько же времени, независимо от размера n, ?

если образцы представлены

с помощью адресов, как в памяти компьютера, ?

необходимо поставить оценку числа узлов, ?

так как ссылка поля имеют фиксированный размер.

Кроме того, ошибки связаны с неправильным разрешением омонимии. В результате глаголы были восприняты как существительные, что разрушило структуру предложений. Вариант трансфертной СМП оказался более читаемым. Трансфертная СМП:

Мы должны признать, ?

что, поскольку номер n узлов, создаваемых

соединяющимся автоматом, приближается к бесконечности, ?

мы не знаем,

как создать такое устройство физически, ?

так как мы хотим, ?

чтобы машинные операции заняли

то же самое количество времени независимо от размера n; ?

если соединение представляется

при использовании адресов как в памяти компьютера, ?

необходимо поместить привязанный число узлов, ?

так как у полей ссылки есть фиксированный размер.

Структура предложения изменена не была.

Трансфертная СМП производит подробный синтаксический анализ. Все основы были выделены, ряд оборотов (that as the number n) были верно переведены на русский язык. Из примера можно заключить, что трансфертная машина может обрабатывать предложения любой сложности, максимально сохраняя стилистику авторского текста.

Как и было указано выше в данном случае машина не стала разбивать предложение на две части по символу «;», хотя в данном случае это было бы вполне оправдано. Переводчик поступил иначе.

Более того, он избавился от второй основы, сделав ее обстоятельством условия. На наш взгляд первая часть варианта переводчика воспринимается труднее, чем та же часть, переведенная трансфертной СМП. Обстоятельства условия более характерны для русскоязычной научной прозы, но встречаются крайне редко. Вторая часть текста, которую перевел человек воспринимается проще, чем вариант трансфертной СМП. Вариант переводчика:

Следует признать, ?

что при стремлении количества созданных

связывающим автоматом узлов n к бесконечности

неизвестно,

как построить такое устройство физически, ?

поскольку желательно, ?

чтобы операции машины выполнялись

за одно и то же время независимо от размера n. ?

Если связывание представлено

с использованием адресов в машинной памяти, ?

необходимо определить границу для количества узлов, ?

поскольку поля связей имеют фиксированный размер.


Немногочисленные простые предложения развернуты за счет однородных членов. В первом отрывке - только одно короткое простое предложение (не учитывая алгоритм Евклида).

Of course, Euclid did not present his algorithm in just this manner.

Мысль высказывания, крайне четкая. Она призвана уберечь читателей от ложных выводов.

Во втором отрывке простые предложения содержат перечисления. Это связано с тем, что большую часть отрывка занимает описание модели.


The Mathematics building has five floors: sub-basement, basement, first, second, and third.each floor there are two call buttons, one for UP and one for DOWN.to these buttons, there are ten variables CALLUP [j] and CALLDOWN [j], 0 <= j <= 4.elevator is in one of three states: GOINGUP, GOINGDOWN, or NEUTRAL.


Подобные предложения претерпевают меньше всего трансформаций при переводе. Если все части предложения будут переведены верно и не возникнет проблем с омонимией, то СМП вернет правильный перевод предложений, что мы можем наблюдать для приведенных примеров.

В конце третьего отрывка встречаются еще более короткие простые предложения.

Relevance is more important than realism.of course much still remains to be done.

Важно заметить, что по эти предложения не выражают отдельную мысль и являются. Они дополняют мысли предыдущих фраз.

Оба эти предложения были переведены СМП без изменения структуры.

Во втором случае переводчик решил объединить предложение с предыдущей фразой. Это сделало более очевидным развитие мысли автора, но с другой стороны - несколько исказило текст.

Для передачи логических связей в тексте используется большое число союзов, в том числе и двойных.

Например:

s New World Dictionary as late as 1957 ...

... was once known as Lake Khwarizm ...

... as explained by the Oxford English Dictionary ...

... as invented by Leibniz.

... it is referred to as Algorithm 1.1E. r = 0, the algorithm teminates


Сами по себе союзы были обработаны СМП без ошибок, но вот конструкции с этими союзами в переводном тексте получились достаточно странными.

Третье предложение первого отрывка:word did not appear in Webster's New World Dictionary as late as 1957 ...

Статистическая СМП:

Слово не появится в Новом Свете Словарь Вебстера как в конце 1957 года ...

(Тут важно отметить, что саму по себе фразу «as late as 1957», трансфертная СМП переводит как «еще в 1957 году», что на наш взгляд является наиболее подходящим вариантом.)

Трансфертная СМП:

Слово не появлялось в Новом Мировом Словаре Вебстера уже в 1957 ...

Вариант переводчика СМП:

Этого слова еще не было в издании словаря Websters New World Dictionary, вышедшем в 1957 году.

Переводчик решил обойти фразу стороной, на что имел полное право. Получается, что ни один из вариантов перевода не отражает полностью смысл конструкции.

Специфичными для технических текстов, являются препозитивные определительные группы.

Например:

Turing machinecommon divisor, largest positive integer.


СМП подобные конструкции переводятся верно. Однако стоит напомнить случай описанный выше a discrete simulation program.

Только человек корректно перевел термин - программа дискретного моделирования. В то время как СМП перевели фразу:

отдельная программа моделирования

дискретная программа моделирования

С точки зрения препозиционных конструкций СМП восприняли фразу верно. Модель разбора в данном случае можно представить в виде

(discrete (simulation program))

Такая модель имеет смысл только для трансфертной СМП. Для статистической явление можно объяснить тем, что словосочетание «программа дискретного моделирования» является редким, а то что discrete simulation - является термином учтено не было.

Верную интерпретацию можно изобразить как:

((discrete simulation) program)

Препозитивные определительные группы более характерны для тестов, в которых идет речь о приборах, оборудовании или методах проектирования.

Отдельно стоит сказать про синтаксическую структуру описания алгоритма Эвклида. Предложения краткие и безличные, глаголы стоят в повелительном наклонении. Шаги алгоритма показаны в виде элементов списка, что помогает «пошаговому» восприятию.

Такие синтаксические особенности не требуют трансформационных преобразований текста. С задачей перевода сходным образом справились как человек так и машина.


3.4 Морфологические особенности


Широко распространены пассивные конструкции

Например:


... the Khwarizm region is located ...

... the appropriate section number is attached ...

... algorithm is called Algorithm E ...

... the algorithm are identi?ed ...

... The chapters are divided ...


В тексте используются именные конструкции:

At the time this chapter was first written

И человек и СМП учли эту особенность

Статистическая СМП:

В то время эта глава впервые была написана

Трансфертная СМП:

В то время, когда эта глава была сначала записана

Переводчик:

В то время, когда автор приступил к работе над настоящей главой

Несмотря на то, что машины перевели фразу с ошибками, можно сказать, что цель выражения была достигнута. - Не столь важна точная дата события, как то что оно произошло одновременно с другим событием.

Широко распространены так же безличные и неопределенно-личные конструкции.

В первом отрывке:

... at first glance it may look as though someone intended to write ...

... while in later sections it is referred to as …

Статистическая СМП:

... на первый взгляд это может выглядеть, как будто кто-то собирался ...

... а в последующих разделах это называется …

Трансфертная СМП:

... на первый взгляд может выглядеть, как если бы кто-то намеревался ...

... в то время как в более поздних разделах это упоминается как …

Переводчик-человек:

... На первый взгляд может показаться, будто кто-то собирался ...

... ссылаться на него в последующих разделах мы будем как …

При машинном переводе эти выражения были переведены шаблонно. С одной стороны это сохранило их безличную форму, которая также характерна для русского языка. С другой стороны это отрицательно повлияло на согласование. Человек-переводчик в данном случае предпочел изменить порядок слов. Это немного изменило стилистическую направленность текста, но упростило его восприятие.

Во втором отрывке:

... but it is believed to be the simplest set of rules ...

Статистическая СМП:

... но это, как полагают, простейший набор правил ...

Трансфертная СМП:

... но это, как полагают, самый простой ряд правил ...

Переводчик-человек:

... но автор все же верит, что он является простейшим набором правил ...

Здесь переводчик позволил себе более серьезное отступление от оригинала. При прочтении третьего варианта возникает сомнение в объективности высказывания, а как было сказано в начале текущей главы - объективность одна из важнейших особенностей научно-технического текста. С другой стороны, в анализе мы рассматриваем ограниченные отрывки текста вырванные из контекста - поведение переводчика может быть объяснено компенсацией.

Авторская речь построена в первом лице множественного числа:

... so we should begin with a careful analysis of this concept ...

... We will have 0 6 r < n.example, we are now in Section 1.1 ...

Это «мы» имеет двойное значение:

·вовлечение читателей в процесс рассуждения;

·множественное скромности.

При переводе множественного скромности переводчик применял различные трансформации.

В первом отрывкеalgorithm we consider ...

Статистическая СМП:

Каждый алгоритм, который рассматриваем ...

Трансфертная СМП:

Каждому алгоритму, который мы рассматриваем ...

Переводчик-человек:

Каждому рассматриваемому алгоритму ...

Машина перевела текст, через сложноподчиненное предложение, как было в оригинале. Переводчик воспользовался причастием. Использование причастий тоже характерно для научного русскоязычного текста (что нельзя утверждать про английский), однако во многих случаях они перегружают текст. Решение переводчика может быть объяснено попыткой избежать тавтологий в тексте - в предыдущем предложении тоже использовано слово который. Варианты и СМП и переводчика верны. Но вариант СМП точнее, и более полно отражает стиль автора. Важно понимать, что для СМП в текущей их реализации стилистическая стройность переводного текста не учитывается. Текст создается ни как произведение научно-технической прозы, а как мост между носителями двух различных языков (но не культур). Потому в тексте перевода могут возникать тавтологии и многие другие погрешности, которые не позволительны, если текст создается носителем языка.

Аналогичную ситуацию можно встретить и в десятом предложении второго отрывка. Однако варианты переводчика и вариант трансфертной СМП являются эквивалентными в стилистическом плане.

Рассмотрим другой пример. В шестом предложении второго отрывка:

... however, in such a case we usually have ...

Статистическая СМП:

... в таком случае мы, как правило ...

Трансфертная СМП:

... в таком случае у нас обычно есть ...

Переводчик-человек:

Но в таком случае получится...

Здесь переводчик очередной раз решил избежать местоимения «мы», но причина, возможно, была продиктована личными предпочтениями автора перевода. Отчасти, на решение повлиять переводческая компенсация, о которой мы писали выше.

Если отдельно проанализировать перевод отрывков, выполненный человеком, тоже можно заключить, что переводчик упорно избегал множественного числа, как указания на автора, используя более безличные формы. Во втором отрывке также встречаются:

but we may ignore будут игнорироваться,

we have described работа лифта описывалась

В третьем отрывке:

We must admit that, Следует признать,

we don't know how неизвестно, we wantпоскольку желательно

Достаточно трудно объяснить использование оборотов в каждом случае, не зная личных мотивов автора перевода. Учитывая, что в некоторых местах переводчик использует менее официальные формулировки, то опять можно говорить о компенсации. Но нельзя упускать из внимания и личные предпочтения переводчика. В данном случае СМП любая свободна от таких предпочтений. При использовании машинного перевода с большей вероятностью удастся получить перевод, с учетом стиля автора исходного текста, а не с учетом стиля переводчика.

Стоит так же рассмотреть пример обезличивания предложений на следующем примере. В восемнадцатом предложении второго отрывка:a person presses a button, the appropriate variable is set to 1

Статистическая СМП:

Когда человек нажимает кнопку, соответствующая переменная установлена в 1

Трансфертная СМП:

Когда человек нажимает кнопку, соответствующая переменная устанавливается в 1

Переводчик-человек:

При нажатии кнопки соответствующей переменной присваивается значение 1

Здесь нужно передать мысль словами автора. Из контекста повествования ясно, что кнопку должен нажимать человек. Но чтобы придти к такому выводу приходится задуматься. Поведение объектов рассматривается в двух системах координат - относительно лифта и относительно человека.

Автор умышленно акцентирует внимание, на то, что именно должен нажимать кнопку. С другой стороны - высказать аналогичную мысль красиво и правильно на русском языке нельзя, потому переводчик решил немного пренебречь точностью высказывания.

Вернемся к описанию алгоритма Эвклида. Как было сказано ранее, использованы безличные предложения, глаголы стоят в повелительном наклонении. Интересно заметить, что при машинном переводе императивное наклонение было сохранено (в форме просьбы), в то время как, переводчик привел алгоритм более стилистически приемлемой форме.

Какой из вариантов правильнее, вопрос спорный. В оригинальном тексте, да и в английском языке вообще глаголы в алгоритмах имеют форму повелительного наклонения. Очень часто их переводят на русский в форме приказа («выполнить», «разделить»). В первом пункте алгоритма переводчик вообще не стал использовать императив, сведя фразу к определенно личному предложению. При этом на третьем шаге использована повелительная форма глагола. Можно сказать, что такой прием был вызван предложением в скобках Но использование разных по форме глаголов в шагах алгоритм может сбить читателей с толку. Мы считаем, что в данном случае машина перевела стилистически верно, и, возможно, лучше переводчика-человека.

Согласно одной из морфологических особенностей научно-технического стиля в тексте используется будущее время вместо простого настоящего.

Подобная ситуация отражена и в переводе. Для СМП используется простой перевод фраз, как если бы время означало именно простое будущее время. Но в этом случае перевод получается верным. Отчасти, это происходит от того, что русская и английская традиции для научных текстов совпадают. Последнее имеет большее влияние на статистическую СМП. Отчасти - от того, что подобная ситуация могла быть жестка прописана в алгоритме перевода. Это более относится к трансфертной СМП. В варианте переводчика-человека на временах наиболее видно проявление переводческой компенсации, и замена ряда конструкций на более приемлемые в русском языке.

В конце второго отрывка:algorithm we will now study may not reflect the elevator's true principles of operation ...

Статистическая СМП:

Алгоритм, который изучим теперь может не отражать истинных принципов работы лифта ...

Трансфертная СМП:

Алгоритм, который мы теперь изучим, возможно, не отражает истинные принципы лифта работы ...

Переводчик-человек:

Этот алгоритм может и не отражать истинный принцип действия лифта ...

Для упрощения речи переводчик отказался от фразы «алгоритм, который мы теперь изучим». Момент, хотя и не является критичным, так как есть указательное местоимение, однако переводчик допустил тут некоторое отступление от авторской мысли.

В шестнадцатом предложении второго отрывка можно наблюдать проявление переводческой компенсации в обратную сторону.

Corresponding to these buttons, there are ten variables CALLUP[j] and CALLDOWN[j], 0 <= j <= 4.

Статистическая СМП:

В соответствии с этими кнопками, есть десять переменных CALLUP[J] и CALLDOWN[J], 0 <= J <= 4.

Трансфертная СМП:

Соответствуя этим кнопкам, есть десять переменных CALLUP[j] и CALLDOWN[j], 0 <= j <= 4.

Переводчик-человек:

Соответственно эти кнопки будут обозначаться десятью переменными CALLUP[j] и CALLDOWN[j], 0 <= j <= 4.

В этом отрезке, автор перевода даже не нарушил стиль автора. Варианты СМП и переводчика являются эквивалентными. Причем, вариант предложенный СМП звучит не совсем правильно. В русском научном тексте такие конструкции употребляются очень редко, но с точки зрения понимания исходного текста машинный перевод тоже приемлем.


Заключение


В ходе выполнения работы были рассмотрены основные проблемы стилистики текста, описана одна из классификаций функциональных стилей, представленная в виде схемы, а также выявлены характерные особенности стиля научно-технической литературы. Проведен сопоставительный анализ отрывков научно-технического текста и их переводов на русский язык. Как известно, предназначение научного стиля - научная сфера общественной деятельности. Цель научного стиля - передать информацию «от разума к разуму».

Выявлены общие черты работ, выдержанных в научном стиле:

·предварительное обдумывание высказывания;

·монологический характер высказывания;

·строгий отбор языковых средств;

·превалирование нормированной речи.

В практической части было сопоставлено три текста:

·отрывок научного текста;

·машинный перевод отрывка;

·профессиональный перевод отрывка.

Машинный перевод отрывка был осуществлен с помощью двух различных СМП трансфертной и статистической. Статистическая СМП рассмотрена на примере сервиса Google Переводчик. Трансфертная СМП рассмотрена на примере системы ПРОМПТ 9.0. Из проведенного анализа отрывка можно сделать следующие выводы:

) Текст обладает стилистической неоднородностью. Стиль рассмотренного отрывка варьируется от формального научного до художественного. Экстраполируя этот вывод на огромный массив текстов, и руководствуясь некоторым текстовым опытом, можно утверждать, что любой текст обладает стилистической неоднородностью. Безусловно, такой вывод подлежит дальнейшей тщательной проверке.

) При переводе некоторые стилистические особенности текста теряются. Потеря происходит не на уровне функции текста, а на уровне образных средств. Такие потери представляются естественными из-за различных стилистических традиций разных культур. Научный текст в английском языке обладает меньшей шаблонностью, чем в русском. Потери могут быть объяснены переводческой компенсацией.

) Стилистика отрывка претерпела меньшие изменения при машинном переводе. Что с одной стороны является случайным фактом, а с другой стороны объясняется применением эквивалентных и вариантных переводных преобразований.

) При переводе научного текста значительную роль играют эквивалентные переводные соответствия, в меньшей мере вариантные переводные соответствия. Крайне редко используются трансформационные соответствия. Это обусловлено стилистическими особенностями научного текста. Представляется, что подобное совпадение не является случайным. Машинный перевод изначально создавался для оперативного перевода технической документации, потому именно в этой сфере он проявляет себя лучше всего.

) Основные ошибки, которые совершает СМП, относятся к лексическим особенностям рассматриваемого текста. Но даже при неверном разрешении омонимии в некоторых случаях основной смысл был передан. Учитывая экстралингвистические реалии, не составляет труда догадаться что именно имел в виду автор. Синтаксические и морфологические особенности были переданы корректно. Таким образом, у читателя машинного перевода складывается приемлемое представление о тексте, его структуре и основных идеях. Это очень важно для научных текстов, когда в кратчайшие сроки необходимо получить общее представление о каком-либо явлении или изобретении, при этом можно пренебречь некоторыми деталями и «красотой изложения».

) Для разрешения проблемы омонимии и трансформационных соответствий, перед применением машинного перевода текст должен пройти некоторую предобработку. При этом, безусловно, потеряется колорит текста и любая экспрессивность, которой и так очень мало в научном тексте. На данном этапе развития - такова цена за безупречную ясность научного текста.

) Машинный перевод рассмотренного отрывка требует редакторской правки. Связано это с ошибками согласования членов предложения. Но, полезно отметить, что перевод сделанный человеком тоже должен быть отредактирован. В нашем случае очень важно, что СМП верно перевела термины и научные обороты. Редактору такого текста не обязательно иметь специальную техническую подготовку.

Опираясь на стилистические особенности научно-технического текста, можно сказать, что в этой сфере машинный перевод не только необходим, но и вполне допустим. Если научный текст перед применением машинного перевода и/или после него дополнительно преобразовать, то результат перевода будет значительно лучше. Что дороже: профессиональный переводчик или редактирование текста и машинный перевод? Вопрос сложный и требует подробного анализа. Описать его в рамках данной работы не представляется возможным.

Дальнейшее изучение структурно-семантических преобразований при машинном переводе текстов с иностранного языка на русский может быть полезно:

·для изучения основных принципов работы СМП;

·для улучшения качества существующих СМП;

·для анализа применимости машинного перевода в каждом конкретном случае;

·при построении новых систем перевода, предназначенных в первую очередь для научно-технических текстов на конкретном языке.

Автор данного исследования планирует в дальнейшем углубленно изучать проблемы структурно-семантических трансформаций, возникающих при использовании статистических систем машинного перевода.

технический стиль текст машинный перевод


Библиография


1.Brown R. Adding Linguistic Knowledge to a Lexical Example-Based Translation System, in Proceedings of the Eighth International Conference on Theoretical and Methodological Issues in Machine Translation (TMI-99), Chester, UK, 1999.

2.Brown R., Automated Generalization of Translation Examples, Pittsburg, PA, USA, 2000.

.Evert, S. Statistical Natural Language Processing. The Noisy Channel & Statistical MT, Institute of Cognitive Science, University of Osnabruck, Germany, 2009.

.Hutchins W.J., Somers H.L. An Introduction to Machine Translation. London: Academic Press, 1992.

5.Galperin I.R. Stylistics: Учебник для студентов институтов и факультетов иностранных языков. - M.: Высшая школа, 1981.

6.Knuth D. «The Art Of Computer Programming. Volume 1 / Fundamental Algorithms - 3rd ed» - Stanford University: Addison Wesley Longman, 1997.

.Kracht M. Introduction to Computational Linguistics, UCLA, Los Angeles, 2006.

.Kracht M. Mathematics Structures of Language II, UCLA, Los Angeles, 2007.

.Lehrberger J., Bourbeau L. Machine Translation, Linguistic Characteristics of MT Systems and General Methodology of Evaluation, John Benjamins Publishing Company, New York, 2010.

.Niccolai J. AltaVista Offers Slicker Translations. June 15, 2000, IDG News Service.

.Nirenburg S. Machine Translation: Theoretical and Methodological Issues. Cambridge, Mass, 1987.

.Nirenburg S., Carbonell J., Tomita M., Goodman K. Machine Translation: A Knowledge based Approach. San Mateo, CA, Morgan Kaufinann, 1992.

.Rhoads R. E. miRNA Regulation of the Translational Machinery, Springer, New York, 2010.

.Roukos, S. Survey of the State of the Art in Human Language Technology. Language Represintation, IBM T. J. Watson Research Center, Yorktown Heights, New York, USA, 1996.

.Shannon, C. A mathematical theory of communication. Bell System Technical Journal, 27(3): 379-423, 1948.

16.Slocum J. Machine Translation Systems. Studies in Natural Language Processing. Cambridge, UK: Cambridge University Press, 1988.

.Smith P.D. An Introduction to Text Processing. - Cambridge, MA: The MIT Press. -1990.

.Sparck J.K., Galliers J.R. Evaluating Natural Language Processing Systems: An Analysis and Review, Berlin, Springer, 1995.

.Stone M. L. Web embraces language translation. ZDNN, 21.07.1998

.Sumita E., Iida H. Experiments and prospects of example-based machine translation. In Proceedings of the 29th Annual Conference of the ACL, Berkley, CA, 1991.

.Wilks Y. Machine Translation, Its Scope and Limits, New York: Springer Science+Business Media LLC, 2009

22.Анисимов А.В. Компьютерная Лингвистика для Всех. Мифы. Алгоритмы. Язык - Киев: Наукова думка, 1991.

.Арнольд И.В. Стилистика современного английского языка - М.: Просвещение, 1990.

.Ахманова Г.И., Богомолова О.И. Теория и практика английской научной речи // Под редакцией М. М. Глушко - М.: Изд. МГУ, 1987

.Белоногов Г.Г. Компьютерная лингвистика и перспективные информационные технологии - М.: Русский мир, 2004.

.Гальперин А.И. Очерки по стилистике английского языка - M.: Издательство литературы на иностранных языках, 1958.

.Голуб И.Б. Русский язык и культура речи. Учебное пособие - М.: Логос, 2003.

.Грязнухина Т.А., Дарчук И. П., Клименко Н.Ф. Использование ЭВМ в лингвистических исследованиях / Отв. ред. Перебейнос В.И. - Киев: Наукова думка, 1990.

.Грязнухина Т.А., Дарчук Н.П., Комарова Л.И. Лингвистические проблемы автоматизации редакционно-издательских процессов. - Киев: Наукова Думка, 1986.

.Ершов А.П. Машинный фонд русского языка: внешняя постановка // Машинный фонд русского языка: идеи и суждения, М. - Наука, 1986.

.Караулов Ю.Н. Методология лингвистического исследования и машинный фонд русского языка // Машинный фонд русского языка: идеи и суждения, М. - Наука, 1986.

.Караулов Ю.Н., Молчанов В.И., Афанасьев В.А., Михалев Н.В. Анализ метаязыка словаря с помощью ЭВМ, М. - Наука, 1982.

.Кнут Д. «Искусство программирования. Том 1. Основные алгоритмы. 3-е издание, исправленное и дополненное» - М: Вильямс, 2002.

.Комиссаров В. Н., Коралова А. Л. Практикум по переводу с английского языка на русский - М.: Высшая школа, 1990.

.Марчук Ю.Н. Проблемы машинного перевода - М.: Наука, 1983.

.Марчук Ю.Н. Основы компьютерной лингвистики. Учебное пособие. Издание 2-е дополненное - М.: Изд-во МПУ «Народный учитель», 2000.

.Марчук Ю.Н. Контекстологический словарь для машинного перевода многозначных слов с английского языка на русский, М. - ВЦП, 1976.

.Маслов Ю.С. Введение в языкознание, М. - Высшая школа, 1987.

.Мельчук И.А. Опыт теории лингвистических моделей "СМЫСЛ-ТЕКСТ". М: Наука, 1974.

.Мельчук И.А. Русский язык в модели «смысл-текст». Москва-Вена: Школа: «Языки русской культуры», 1995.

.Мороховский А.Н. Стилистика английского языка, Киев: Вища Школа, 1984.

.Нелюбин Л.Л. Перевод и прикладная лингвистика. М.: Высшая школа, 1983.

.Нелюбин Л.Л. Компьютерная лингвистика и машинный перевод (Методическое пособие). М.; Всесоюзный центр переводов, 1991.

.Нелюбин Л.Л., Хухуни Г.Т. История и теория зарубежного перевода. Учебник, М.: МПУ, Издательство Сигнал, 1999. - 144 с.

.Нелюбин Л.Л., Хухуни Г.Т. История и теория перевода в России. Учебник, М.: МПУ, Издательство Сигнал, 1999а. - 151 с.

.Новиков А.И. Применение денотатной структуры текста для перевода научно-технической литературы.- В кн.: Психолингвистические аспекты грамматики. М. - 1979.

.Пиотровский Р. Г. Текст, машина, человек - Л.: Наука,1975.

.Плещенко Т.П. Стилистика и культуры речи: Учеб. Пособие, - Мн.: ТетраСистемс, 2001.

.Пумпянский A.Л. Информационная роль порядка слов в научной и технической литературе, М.: Наука, 1974.

.Разинкина Н.М. Функциональная стилистика английского языка, М.: Высшая школа, 1989.

.Рассел С. Норвиг П. Искусственный интеллект: современный подход, 2-е изд..: Пер. с англ. - М.: Издательский дом "Вильямc" - 2006.

.Рахимбердиев Б.Н. Эволюция семантики экономической терминологии русского языка в XX веке. Дисс. на соиск. уч. степ. канд. филол. наук. М., 2003.

.Реформатский А.А. Введение в языковедение /Под ред. В.А. Виноградова. - М.: Аспект Пресс, 1996.

.Рецкер Я.И. О закономерных соответствиях при переводе на родной язык. Теория и методика учебного перевода. - М.: 1950.

.Рецкер Я.И. Теория перевода и переводческая практика. Очерки лингвистической теории перевода / Дополнения и комментарии Д.И. Ермоловича. - М.: Р.Валент, 2004.

.Розенталь Д.Э. Практическая стилистика русского языка - М.: Высшая школа,1987.

.Слюсарева Н.А. Проблемы функционального синтаксиса современного английского языка (монография) - М.: Наука, 1981.

.Сошников Д.В. Парадигма логического программирования - М.: Вузовская книга, 2006.

.Суханова М. Кто лучше переводит. Мир ПК, № 1/97.

.Шевченко Т.А. Стилистика современного английского языка - М.: Современный гуманитарный университет, 1998.

.Фатеева Н. Тропы, Онлайн Энциклопедия Кругосвет - 2009.

.Хроменков П.Н. Анализ и оценка эффективности современных систем машинного перевода Диссертация на соискание учёной степени кандидата филологических наук. - М., 2000.

.Швейцер А.Д. Теория перевода - М.: Наука, 1988.


Приложения


Схема 1: основные понятия стилистики

Схема 2: тропы и фигуры

Схема 3: функциональные стили языка

Схема 4: особенности научно-технического стиля



Образцы проанализированных текстов


Отрывок 1

Оригинал

Отрывок из «Искусства программирования» (Knuth, 1997: 1).


The notion of an algorithm is basic to all of computer programming, so we should begin with a careful analysis of this concept. The word algorithm itself is quite interesting; at first glance it may look as though someone intended to write logarithm but jumbled up the first four letters. The word did not appear in Websters New World Dictionary as late as 1957; we find only the older form algorism with its ancient meaning, the process of doing arithmetic using Arabic numerals. During the Middle Ages, abacists computed on the abacus and algorists computed by algorism. By the time of the Renaissance, the origin of this word was in doubt, and early linguists attempted to guess at its derivation by making combinations like algiros [painful] + arithmos [number]; others said no, the word comes from King Algor of Castile. Finally, historians of mathematics found the true origin of the word algorism: It comes from the name of a famous Persian textbook author, Abu Abd Allah Muhammad ibn Musa al-KhwarizmT (c. 825) - literally, Father of Abdullah, Mohammed, son of Moses, native of Khwarizm. The Aral Sea in Central Asia was once known as Lake Khwarizm, and the Khwarizm region is located in the Amu River basin just south of that sea. Al-Khwarizm wrote the celebrated book Kitab aljabr wal-muqabala (Rules of restoring and equating); another word, algebra stems from the title of his book, which was a systematic study of the solution of linear and quadratic equations. [For notes on al-Khwarizmls life and work, see H. Zemanek, Lecture Notes in Computer Science 122 A981), 1-81.] Gradually the form and meaning of algorism became corrupted; as explained by the Oxford English Dictionary, the word passed through many pseudo-etymological perversions, including a recent algorithm, in which it is learnedly confused with the Greek root of the word arithmetic. This change from algorism to algorithm is not hard to understand in view of the fact that people had forgotten the original derivation of the word. An early German mathematical dictionary, Vollstkndiges mathematisches Lexicon (Leipzig: 1747), gave the following definition for the word Algorithmus: Under this designation are combined the notions of the four types of arithmetic calculations, namely addition, multiplication, subtraction, and division. The Latin phrase algorithmus infinitesimalis was at that time used to denote ways of calculation with infinitely small quantities, as invented by Leibniz.1950, the word algorithm was most frequently associated with Euclids algorithm, a process for finding the greatest common divisor of two numbers that appears in Euclids Elements (Book 7, Propositions 1 and 2). It will be instructive to exhibit Euclids algorithm here:E (Euclids algorithm). Given two positive integers and , find their greatest common divisor, that is, the largest positive integer that evenly divides both and .. [Find remainder.] Divide by and let be the remainder. (We will have .). [Is it zero?] If , the algorithm terminates; is the answer.. [Reduce.] Set , , and go back to step E1.course, Euclid did not present his algorithm in just this manner. The format above illustrates the style in which all of the algorithms throughout this book will be presented. Each algorithm we consider has been given an identifying letter (E in the preceding example), and the steps of the algorithm are identified by this letter followed by a number (El, E2, E3). The chapters are divided into numbered sections; within a section the algorithms are designated by letter only, but when algorithms are referred to in other sections, the appropriate section number is attached. For example, we are now in Section 1.1; within this section Euclids algorithm is called Algorithm E, while in later sections it is referred to as Algorithm 1.1E.


Статистика (приводятся цифры для оригинального издания, без учета алгоритма Евклида):

Параметр Значениестроки 50слова 563символы 3649

Перевод, выполненный статистической СМП


Машинный перевод отрывка (на основании веб-сервиса Google Переводчик).

Понятие алгоритма является основой всех компьютерного программирования, поэтому мы должны начать с тщательного анализа этой концепции. Слово «алгоритм» само по себе достаточно интересно, на первый взгляд это может выглядеть, как будто кто-то собирался написать «логарифм», но неясный первых четырех букв. Слово не появлялось в Новом Мировом Словаре Вебстера уже в 1957; мы находим только старую форму «алгоритм» с его древними смысл, процесс выполнения арифметических операций используются арабские цифры. В средние века, abacists вычисляется на счетах и algorists вычисляется алгоритм. К тому времени, эпохи Возрождения, происхождение этого слова было сомнений, и в начале лингвисты пытались угадать его вывод путем комбинации, как algiros [болезненным] + arithmos [число], другие сказали, нет, слово происходит от «короля Algor Кастилии». Наконец, историки математики обнаружили истинное происхождение слова алгоритм: Оно происходит от названия известного персидского автора учебника, Абд Абу Аллаха Мухаммад ибн Муса аль-Хорезм (ок. 825), буквально, «Отец Абдулла Мухаммед, сына Моисея, уроженец Хорезма». Аральского моря в Центральной Азии было когда-то называли озеро Хорезм, и в регионе Хорезма расположен в бассейне реки Амударьи к югу от этого моря. Аль-Хорезм написал знаменитую книгу Китаб aljabr wa1-мукабаля («Правила восстановления и приравнивая»); другое слово, «алгебра» происходит от названия своей книги, которая была систематическое изучение решения линейных и квадратичных уравнений. [Для заметки о жизни аль-Khwarizml и работы, см. Н. Земанек, Лекции по информатике 122 A981), 1-81.]

Постепенно форму и смысл алгоритм была повреждена; как пояснил Оксфордский словарь английского языка, слово «прошла через многие псевдо-этимологический извращений, в том числе последние алгоритма, в котором она знанием путают» с греческого корня слова арифметика. Это переход от «алгоритм» на «Алгоритм» не трудно понять, в силу того, что люди забыли оригинальный вывод слова. Раннего немецкого математический словарь, Vollstkndiges mathematisches Лексикон (Лейпциг: 1747), дал следующее опре- деление слова Algorithmus: «В соответствии с этим обозначением сочетаются понятия четырех типов арифметических расчетов, а именно сложение, умножение, вычитание, и Отдел». Латинская infinitesimalis algorithmus фраза была в это время используется для обозначения «способы расчета с бесконечно малыми величинами, как изобрели Лейбницем».

К 1950 году, слово алгоритм чаще всего связаны с алгоритмом Евклида, процесс для нахождения наибольшего общего делителя двух чисел, который появляется в «Начал» Евклида (книга 7, предложений 1 и 2). Это будет Поучительно выставку алгоритм Евклида здесь:

Алгоритм E (алгоритм Евклида). Даны два натуральных чисел и , найти их наибольший общий делитель, т. е. наибольшее положительное целое число, равномерно делит и .

Е1. [Найти остаток.] Разделите на и быть остаток. (Мы будем иметь .)

Е2. [Это нуль?] Если , алгоритм завершается, является ответом.

E3. [Уменьшить.] Множества , , и вернитесь к шагу Е1.

Конечно, Евклид не представит свой алгоритм именно таким образом. Формат выше иллюстрирует стиль, в котором все алгоритмы в этой книге будут представлены.

Каждый алгоритм рассмотрим было уделено выявлению письмо (E и в предыдущем примере), и шаги алгоритма обозначены этим письмом последовал ряд (El, E2, E3). Главы разделен на пронумерованные разделы, в разделе алгоритмы, обозначенные буквой только, но при алгоритмов, упоминаемые в других разделах, соответствующих номер раздела прилагается. Например, сейчас мы находимся в разделе 1.1, в этом разделе алгоритма Евклида называется алгоритм E, а в последующих разделах это называется алгоритм 1.1e.


Перевод, выполненный трансфертной СМП


Машинный перевод отрывка (на основании СМП Промпт):

Понятие алгоритма является основным ко всему программированию, таким образом, мы должны начать с тщательного анализа этого понятия. Само слово "алгоритм" довольно интересно; на первый взгляд может выглядеть, как если бы кто-то намеревался записать "логарифм", но смешивал первые четыре буквы. Слово не появлялось в Новом Мировом Словаре Вебстера уже в 1957; мы считаем только более старую форму "десятеричной системой счисления" с ее древним значением, процессом выполнения арифметического использования арабских цифр. Во время Средневековья abacists, вычисленный на абаке и algorists, вычислен десятеричной системой счисления. Ко времени Ренессанса вызывал сомнение источник этого слова, и ранние лингвисты попытались предположить его деривацию, делая комбинации как algiros [болезненный] + arithmos [число]; другие сказали не, слово прибывает от Короля Алгора Кастилии. Наконец, историки математики нашли истинный источник десятеричной системы счисления слова: Это прибывает из имени известного персидского автора учебника, Абу Абд Аллах Мухаммед ибн Муса al-KhwarizmT (c. 825) - буквально, Родительский элемент Абдуллы, Мохаммеда, сына Моисея, уроженца Khwarizm. Аральское море в Средней Азии было когда-то известно как Озеро Хваризм, и область Khwarizm расположена в Бассейне реки Amu только к югу от того моря. Аль-Хваризм записал знаменитой книге Kitab aljabr wal-muqabala (Правила восстановления и приравнивания); другое слово, "алгебра" происходит от заголовка его книги, которая была систематическим исследованием решения линейных и квадратных уравнений. [Для примечаний по жизни al-Khwarizml и работе, см. Х. Земэнека, Примечания Лекции в Информатике 122 A981), 1-81.] Постепенно форма и значение десятеричной системы счисления стали поврежденными; как объяснено Оксфордским английским Словарем, слово проходило через многие псевдоэтимологические извращения, включая недавний алгоритм, в котором это со знанием дела перепутано с греческим корнем арифметики слова. Это изменение от "десятеричной системы счисления" до "алгоритма" не трудно понять ввиду факта, что люди забыли исходную деривацию слова. Ранний немецкий математический словарь, Словарь Vollstkndiges mathematisches (Лейпциг: 1747), дал следующее определение для слова Algorithmus: Под этим обозначением объединены понятия четырех типов арифметических вычислений, а именно, дополнения, умножения, вычитания, и подразделения. Латинская фраза algorithmus infinitesimalis тогда использовалась, чтобы обозначить способы вычисления с бесконечно небольшими количествами, как изобретено Лейбницем.

К 1950, алгоритм слова наиболее часто связывался с алгоритмом Евклида, процессом для того, чтобы найти самый большой общий делитель двух чисел, который появляется в Элементах Евклида (Книга 7, Суждения 1 и 2). Это будет поучительно, чтобы показать алгоритм Евклида здесь:

Алгоритм E (алгоритм Евклида). Учитывая два положительных целых числа и , найдите их самый большой общий делитель, то есть, самое большое положительное целое число, которое равномерно делит обоих и .. [Найдите остаток.] Делятся на и позволяют быть остатком. (Мы будем иметь .). [Это - нуль?] Если , алгоритм завершается, ; ответ.. [Уменьшить.] Набор , , и возвращается к шагу E1.

Конечно, Евклид не представлял свой алгоритм только этим способом. Формат выше иллюстрирует стиль, в котором будут представлены все алгоритмы всюду по этой книге. Каждому алгоритму, который мы рассматриваем, дали букву идентификации (E в предыдущем примере), и шаги алгоритма идентифицированы этой буквой, сопровождаемой числом (эль, E2, E3). Главы разделены на пронумерованные разделы; в пределах раздела алгоритмы определяются по буквам только, но когда алгоритмы упомянуты в других разделах, соответствующее число раздела присоединено. Например, мы находимся теперь в Разделе 1.1; в пределах этого раздела алгоритм Евклида вызывают Алгоритмом E, в то время как в более поздних разделах это упоминается как Алгоритм 1.1E.


Перевод, выполненный человеком


Перевод сделанный профессиональным переводчиком (Кнут Д, 2002: 20):

Понятие алгоритм является основным для всей области компьютерного программирования, поэтому начать мы должны с тщательного анализа этого термина. Слово «алгоритм» (algorithm) уже само по себе представляет большой интерес. На первый взгляд может показаться, будто кто-то собирался написать слово «логарифм» (logarithm), но случайно переставил первые четыре буквы. Этого слова еще не было в издании словаря Websters New World Dictionary, вышедшем в 1957 году. Мы находим там только устаревшую форму «algorism» - старинное слово, которое означает «выполнение арифметических действий с помощью арабских цифр». В средние века абакисты считали на абаках (счетных досках), а алгоритмики использовали «algorism». В эпоху Возрождения происхождение этого слова оказалось забытым. Одни лингвисты того времени пытались объяснить его значение путем сочетания слов algiros [больной] и arithmas [число], другие не соглашались с таким толкованием и утверждали, что это слово происходит от «King Algor of Castile». Наконец историки математики обнаружили истинное происхождение слова «algorism»: оно берет начало от имени автора знаменитого персидского учебника по математике, Abu Abd Allah Muhammad ibn Musa al-Khwarizml (Абу Абд Аллах Мухаммед ибн Муса аль-Хорезми) (ок. 825 г.), означающего буквально «Отец Абдуллы, Мухаммед, сын Мусы, уроженец Хорезма»*. Аральское море в Центральной Азии когда-то называлось озером Хорезм, и район Хорезма (Khwarizm) расположен в бассейне реки Амударьи южнее этого моря. Аль-Хорезми написал знаменитую книгу Kitab al-jabr wa1-muqabala (Китаб аль-джебр валь-мукабала «Книга о восстановлении и противопоставлении»). От названия этой книги, которая была посвящена решению линейных и квадратных уравнений, произошло еще одно слово - «алгебра». [О жизни и научной деятельности аль-Хорезми речь идет в работе Н. Zemanek, Lecture Notes in Computer Science 122 (1981), 1-81.]

Постепенно форма и значение слова algorism исказились; как объясняется в словаре Oxford English Dictionary, это слово «претерпело множество псевдоэтимологических искажений, включая последний вариант algorithm, где произошла путаница» с корнем слова греческого происхождения arithmetic. Этот переход от «algorism» к «algorithm» кажется вполне закономерным ввиду того, что происхождение рассматриваемого слова было полностью забыто. В старинном немецком математическом словаре Vollstandiges mathematisches Lexicon (Leipzig, 1747) дается следующее определение слова algorithmus: «Этот термин включает в себя понятие о четырех типах арифметических операций, а именно: о сложении, умножении, вычитании и делении». Латинское выражение algorithmus infinitesimalis в то время использовалось для определения «способов выполнения действий с бесконечно малыми величинами, открытых Лейбницем (Leibniz)».

К 1950 году слово «алгоритм» чаще всего ассоциировалось с алгоритмом Евклида, который представляет собой процесс нахождения наибольшего общего делителя двух чисел. Этот алгоритм приведен в книге Евклида (Euclid) Начала (книга 7, предложения 1 и 2). Думаю, имеет смысл привести здесь описание этого алгоритма.

Алгоритм Е (Алгоритм Евклида). Даны два целых положительных числа и . Требуется найти их наибольший общий делитель, т. е. наибольшее целое положительное число, которое нацело делит оба числа и .. [Нахождение остатка.]

Разделим на ., и пусть остаток от деления будет равен . (где .).

Е2. [Сравнение с нулем.]

Если , то выполнение алгоритма прекращается; - искомое значение.

ЕЗ. [Замещение.]

Присвоить , ,и вернуться к шагу El.

Разумеется, у Евклида этот алгоритм сформулирован не совсем так. Приведенная выше формулировка иллюстрирует стиль, в котором алгоритмы будут представлены на протяжении всей этой книги.

Каждому рассматриваемому алгоритму присваивается идентифицирую- щая буква (в предыдущем примере использовалась буква Е), а шагам алгоритма - эта же буква в сочетании с числом (El, Е2, ЕЗ). Главы книги подразделяются на пронумерованные разделы; внутри раздела алгоритмы обозначаются только буквами. Но когда на эти алгоритмы делаются ссылки из других разделов, то к букве присоединяется номер соответствующего раздела. Например, сейчас мы находимся в разделе 1.1; внутри этого раздела алгоритм Евклида называется «Алгоритм Е», но ссылаться на него в последующих разделах мы будем как на алгоритм 1.1Е.


Статистика (приводятся цифры для оригинального издания, без учета алгоритма Евклида):

Параметр Значениестроки 52слова 480символы 4059

Отрывок 2

Оригинал


Отрывок из «Искусства программирования» (Knuth, 1997: 282).

As an example of the use of doubly linked lists, we will now consider the writing of a discrete simulation program. "Discrete simulation" means the simulation of a system in which all changes in the state of the system may be assumed to happen at certain discrete instants of time. The "system" being simulated is usually a set of individual activities that are largely independent although they interact with each other; examples are customers at a store, ships in a harbor, people in a corporation. In a discrete simulation, we proceed by doing whatever is to be done at a certain instant of simulated time, then advance the simulated clock to the next time when some action is scheduled to occur. contrast, a "continuous simulation" would be simulation of activities that are under continuous changes, such as traffic moving on a highway, spaceships traveling to other planets, etc. Continuous simulation can often be satisfactorily approximated by discrete simulation with very small time intervals between steps; however, in such a case we usually have "synchronous" discrete simulation, in which many parts of the system are slightly altered at each discrete time interval, and such an application generally calls for a somewhat different type of program organization than the kind considered here. program developed below simulates the elevator system in the Mathematics building of the California Institute of Technology. The results of such a simulation will perhaps be of use only to people who make reasonably frequent visits to Caltech; and even for them, it may be simpler just to try using the elevator several times instead of writing a computer program. But, as is usual with simulation studies, the methods we will use are of much more interest than the answers given by the program. The methods to be discussed below illustrate typical implementation techniques used with discrete simulation programs. Mathematics building has five floors: sub-basement, basement, first, second, and third. There is a single elevator, which has automatic controls and can stop at each floor. For convenience we will renumber the floors 0, 1, 2, 3, and 4. each floor there are two call buttons, one for UP and one for DOWN. (Actually floor 0 has only UP and floor 4 has only DOWN, but we may ignore that anomaly since the excess buttons will never be used.) Corresponding to these buttons, there are ten variables CALLUP [ j] and CALLDOWN [ j], 0 <= j <= 4. are also variables CALLCAR[j], 0 <= j <= 4, representing buttons within the elevator car, which direct it to a destination floor. When a person presses a button, the appropriate variable is set to 1; the elevator clears the variable to 0 after the request has been fulfilled. far we have described the elevator from a user's point of view; the situation is more interesting as viewed by the elevator. The elevator is in one of three states: GOINGUP, G0INGD0WN, or NEUTRAL. (The current state is indicated to passengers by lighted arrows inside the elevator.) If it is in NEUTRAL state and not on floor 2, the machine will close its doors and (if no command is given by the time its doors are shut) it will change to GOINGUP or G0INGD0WN, heading for floor 2. (This is the "home floor," since most passengers get in there.) On floor 2 in NEUTRAL state, the doors will eventually close and the machine will wait silently for another command. The first command received for another floor sets the machine GOINGUP or GOINGDOWN as appropriate; it stays in this state until there are no commands waiting in the same direction, and then it switches direction or switches to NEUTRAL just before opening the doors, depending on what other commands are in the CALL variables. The elevator takes a certain amount of time to open and close its doors, to accelerate and decelerate, and to get from one floor to another. All of these quantities are indicated in the algorithm below, which is much more precise than an informal description can be. The algorithm we will now study may not reflect the elevator's true principles of operation, but it is believed to be the simplest set of rules that explain all the phenomena observed during several hours of experimentation by the author during the writing of this section.


Статистика (вместе с математическими символами):

Параметр Значениестроки 57слова 729символы 4400

Перевод, выполненный статистической СМП


Машинный перевод отрывка (на основании веб-сервиса Google Переводчик).

В качестве примера использования дважды связанные списки, мы рассмотрим написание отдельной программы моделирования. "Дискретное моделирование" означает моделирование системы, в которой все изменения в состоянии системы можно считать произойти при определенных дискретные моменты времени. "Система" моделируемой обычно набор отдельных мероприятий, которые в значительной степени независимы, хотя они взаимодействуют друг с другом; примеры клиентов в магазине, корабли в порту, люди в корпорации. В дискретного моделирования, мы проведем делать то, что должно быть сделано в определенный момент времени моделирования, то заранее моделируется часы, чтобы в следующий раз, когда какое-либо действие планируется произойти.

В отличие от этого, "непрерывное моделирование" будет моделирования деятельности, которые находятся под постоянным изменениям, например, трафик, проходящий по шоссе, космические корабли путешествия на другие планеты и т.д. непрерывного моделирования часто может быть удовлетворительно аппроксимируется дискретного моделирования с очень малыми интервалами времени между шагами, однако в таком случае мы, как правило, "синхронные" дискретного моделирования, в котором многие части системы слегка изменен в каждый дискретный интервал времени, и такие приложения обычно требует несколько иной тип организации, чем программы здесь рассматривается.

Программа, разработанная ниже имитирует лифт системы в здании математики из Калифорнийского технологического института. Результаты такого моделирования, возможно, быть полезным только для людей, которые делают достаточно частых визитов в Калифорнийском технологическом институте, и даже для них, это может быть проще, просто попробуйте использовать лифт несколько раз вместо написания компьютерной программы. Но, как обычно, с имитационные исследования, методы, которые мы будем использовать имеют гораздо больший интерес, чем ответов по программе. Методы, которые будут обсуждаться ниже, иллюстрируют типичные методы осуществления использоваться с дискретными программ моделирования.

Здание математики имеет пять этажей: суб-подвал, подвал, первый, второй, и третий. Существует один лифт, который имеет автоматический контроль и может остановиться на каждом этаже. Для удобства мы будем изменить нумерацию этажей 0, 1, 2, 3 и 4.

На каждом этаже Существуют две кнопки вызова, по одному для UP и один для ВНИЗ. (На самом деле слово 0 имеет только вверх и 4 этаж имеет только вниз, но мы можем игнорировать эту аномалию с избыточной кнопки никогда не будет использоваться.) В соответствии с этими кнопками, Есть десять переменных CALLUP [J] и CALLDOWN [J], 0 <= J <= 4.

Есть также переменные CALLCAR [J], 0 <= J <= 4, что составляет кнопки в лифте, которые направляют его на нужный этаж. Когда человек нажимает кнопку, соответствующую переменная установлена ??в 1, лифт очищает переменную в 0 после просьба была выполнена.

До сих пор мы описали лифт с точки зрения пользователя, ситуация более интересная, если смотреть на лифте. Лифт находится в одном из трех состояний: GOINGUP, G0INGD0WN, или нейтральным. (Текущее состояние указывается на пассажиров освещенные стрелками внутри лифта.) Если она находится в состоянии нейтральными и не на этаж 2, машина закроет свои двери и (если команда не дает времени свои двери закрыты) он изменится на GOINGUP или G0INGD0WN, направляясь к этаж 2. (Это "дом этаже", так как большинство пассажиров получить там.) На этаже 2 в нейтральном состоянии, двери, в конечном счете близких и машина будет ждать молча для другой команды. Первая команда получила еще пол множества машин GOINGUP или GOINGDOWN по мере необходимости, она остается в этом состоянии, пока Есть нет команды ожидания в том же направлении, а затем происходит переключение направления или переключается на нейтральной незадолго до открытия двери, в зависимости от того, что другие команды в CALL переменных. Лифт занимает определенное количество времени, чтобы открывать и закрывать свои двери, в целях ускорения и замедления, и чтобы попасть из одного этажа на другой. Все эти величины указаны в ниже алгоритм, который является гораздо более точным, чем неформальное описание может быть. Алгоритм Изучим теперь могут не отражать истинных принципов лифта работы, но это, как полагают, простейший набор правил, которые объясняют все явления, наблюдаемые в течение нескольких часов экспериментов автора во время написания этого раздела.


Перевод, выполненный трансфертной СМП


Машинный перевод отрывка (на основании СМП Промпт):

Как пример использования двунаправленных связанных списков, мы теперь рассмотрим запись дискретной программы моделирования. "Дискретное моделирование" означает моделирование системы, в которой все изменения в состоянии системы, как может предполагаться, происходят в определенные дискретные моменты времени. Моделируемая "система" обычно является рядом отдельных действий, которые в значительной степени независимы, хотя они взаимодействуют с друг другом; примеры - клиенты в хранилище, поставках в гавани, людях в корпорации. На дискретном моделировании мы продолжаем, делая независимо от того, что должно быть сделано в определенный момент моделируемого времени, затем усовершенствовать моделируемые часы к следующему разу, когда некоторое действие, как планируют, произойдет.

В отличие от этого, "непрерывное моделирование" было бы моделированием действий, которые находятся под непрерывными изменениями, такими как трафик, углубляющий магистраль, космические корабли, перемещающиеся в другие планеты, и т.д. Непрерывное моделирование может часто удовлетворительно приближаться дискретным моделированием с очень маленькими временными интервалами между шагами; однако, в таком случае у нас обычно есть "синхронное" дискретное моделирование, на котором много частей системы немного изменены в каждом интервале дискретного времени, и такое приложение обычно призывает к несколько различному типу организации программы чем вид, который рассматривают здесь.

Программа, разработанная ниже, моделирует систему лифта в здании Математики Калифорнийского Технологического института. Результаты такого моделирования будут, возможно, полезны только для людей, которые наносят разумно частые визиты в Калифорнийский технологический институт; и даже для них, может быть более просто только попытаться использовать лифт несколько раз вместо того, чтобы писать компьютерную программу. Но, как обычно с исследованиями моделирования, методы, которые мы будем использовать, имеют намного больше интереса чем ответы, данные программой. Методы, которые будут обсуждены ниже, иллюстрируют типичные методы реализации, используемые с дискретными программами моделирования.

У здания Математики есть пять этажей: подвал, подвал, во-первых, во-вторых, и треть. Есть единственный лифт, который имеет автоматические управления и может остановиться в каждом полу. Для удобства мы перенумеруем этажи 0, 1, 2, 3, и 4.

На каждом полу есть две кнопки вызова, один для и один для ВНИЗ. (Фактически пол 0 имеет только, и пол 4 имеет только ВНИЗ, но мы можем проигнорировать ту аномалию, так как избыточные кнопки никогда не будут использоваться.) Соответствие эти кнопки, есть десять ПРИВЛЕЧЕНИЙ переменных [j] и ВЫГОВОР [j], 0 <= j <= 4. Есть также переменные CALLCAR [j], 0 <= j <= 4, представляя кнопки в пределах автомобиля лифта, которые направляют это к целевому полу. Когда человек нажимает кнопку, соответствующая переменная установлена в 1; лифт очищает переменную к 0 после того, как запрос был выполнен.

До сих пор мы описали лифт с точки зрения пользователя; ситуация более интересна как просматривающийся лифтом. Лифт находится в одном из трех состояний: GOINGUP, G0INGD0WN, или НЕЙТРАЛЬНЫЙ. (Текущее состояние обозначено пассажирам освещенными стрелками в лифте.), Если это находится в НЕЙТРАЛЬНОМ состоянии а не на полу 2, машина закроет свои двери и (если никакая команда не будет дана к тому времени, когда ее двери закрыты), это изменится на GOINGUP или G0INGD0WN, направляясь в пол 2. (Это - "домашний пол,", так как большинство пассажиров входит там.) На полу 2 в НЕЙТРАЛЬНОМ состоянии, в конечном счете закроются двери, и машина будет ожидать тихо другой команды. Первая команда, полученная для другого пола, устанавливает машину GOINGUP или GOINGDOWN как соответствующую; это остается в этом состоянии, пока нет никаких команд, ожидающих в том же самом направлении, и затем это переключает направление или переключается на НЕЙТРАЛЬНЫЙ прежде, чем открыть двери, в зависимости от того, что другие команды находятся в переменных ВЫЗОВА. Лифт берет определенное количество времени, чтобы открыть и закрыть его двери, ускориться и замедлиться, и добраться от одного пола до другого. Все эти количества обозначены в алгоритме ниже, который намного более точен, чем неофициальное описание может быть. Алгоритм, который мы теперь изучим, возможно, не отражает истинные принципы лифта работы, но это, как полагают, самый простой ряд правил, которые объясняют все явления, наблюдаемые в течение нескольких часов экспериментирования автором во время записи этого раздела.


Перевод, выполненный человеком


Перевод сделанный профессиональным переводчиком (Кнут Д, 2002: 317):

В качестве примера использования дважды связанных списков рассмотрим программу дискретного моделирования. "Дискретное моделирование" означает моделирование системы, в которой предполагается, что все изменения состояния системы происходят в некоторые дискретно заданные моменты Моделируемая "система" обычно представляет собой набор отдельных действующих лиц, которые, хотя и могут взаимодействовать друг с другом, в основном, ведут себя независимо.

Например, это могут быть покупатели в магазине, корабли в гавани, сотрудники некоторого предприятия. При этом процесс моделирования заключается в выполнении определенных действий, предусмотренных для данного момента, для перехода к следующему моменту с дальнейшим выполнением других действий, запланированных для нового момента.

И наоборот, "непрерывное моделирование" означает моделирование действий, которые происходят непрерывно, например движение автомобилей по автостраде, полеты космических кораблей к другим планетам и т. д. Непрерывное моделирование часто можно вполне удовлетворительно имитировать с помощью дискретного моделирования с очень малыми временными интервалами между соседними шагами. Но в таком случае получится "синхронное" дискретное моделирование, при котором многие части системы слегка изменяются на каждом дискретном временном интервале, и такое приложение обычно нуждается в организации программы несколько иного типа, чем тот, который рассмотрен здесь.

Приведенная ниже программа моделирует работу лифта в здании факультета математики Калифорнийского технологического института (Калтех). Результаты такого моделирования, вероятно, будут полезны только тем, кому часто приходится посещать Калтех. И даже им, видимо, проще будет всего несколько раз воспользоваться этим лифтом, чем создавать специальную программу. Но, как обычно случается при изучении методов моделирования, используемые методы программирования гораздо интереснее, чем результаты выполнения программ. Рассматриваемые ниже методы иллюстрируют типичные методики, которые используются в программах дискретного моделирования.

Здание факультета математики имеет пять этажей: подвальный, цокольный, первый, второй и третий В нем находится один лифт с автоматическим управлением, который может останавливаться на каждом этаже. Для удобства перенумеруем

этажи в следующем порядке: 0, 1, 2, 3 и 4

На каждом этаже есть две кнопки вызова лифта: одна - для движения вверх (UP), а другая - для движения вниз (DOWN). (На самом деле на этаже 0 имеется только кнопка UP, а на этаже 4 - только кнопка DOWN, но эти особые случаи будут игнорироваться, потому что дополнительные кнопки никогда не будут использоваться)

Соответственно эти кнопки будут обозначаться десятью переменными CALLUP[j] и CALLDOWN[j], 0 <= j <= 4. Кроме того, переменные CALLCAR[j], 0 <= j <= 4, будут представлять кнопки внутри кабины лифта, которые обозначают этаж назначения. При нажатии кнопки соответствующей переменной присваивается значение 1, а после выполнения запроса (т е. после того как лифт достигнет заданного этажа) переменной присваивается значение 0.

До сих пор работа лифта описывалась с точки зрения пользователя, но ситуация станет более интересной, если рассмотреть ее с точки зрения лифта. Лифт может находиться в одном из трех следующих состояний: движение вниз (G0INGUP), движение вверх (G0INGDOWN) или нейтральное состояние (NEUTRAL) (Для человека текущее состояние обозначается светящимися стрелками внутри лифта.) Если лифт находится в нейтральном состоянии (NEUTRAL) и не на этаже 2, механизм лифта закроет двери и (если до закрытия дверей не дана никакая команда) лифт придет в состояние движения (G0INGUP или G0INGD0WN), направляясь к этажу 2. (Это его "базовый этаж", так как большинство людей входят в него именно здесь ) Если лифт находится на этаже 2 в состоянии NEUTRAL, двери со временем закроются и лифт будет ожидать следующей команды. Первая полученная и'м команда для перемещения на другой этаж приведет лифт в состояние движения G0INGUP или G0INGD0WN в зависимости от нажатой кнопки. Лифт будет находиться в этом состоянии, пока не остановится. Тогда, если поступили новые команды, произойдет смена направления или переход в нейтральное состояние (NEUTRAL) непосредственно перед открытием дверей в зависимости от того, какие команды находятся в вызываемой последовательности. Лифту требуется некоторое время для открытия и закрытия дверей, ускорения и замедления, а также для перемещения от одного этажа к другому. Все эти величины указаны в приведенном ниже алгоритме, который выглядит гораздо более строго, чем привычные нам простые правила пользования лифтом. Этот алгоритм может и не отражать истинный принцип действия лифта, но автор все же верит, что он является простейшим набором правил, которые могут объяснить все те явления, которые автор наблюдал в ходе длительных экспериментов с лифтом во время написания этого раздела.


Статистика (вместе с математическими символами):

Параметр Значениестроки 67слова 654символы 5017

Отрывок 3

Оригинал


Отрывок из «Искусства программирования» (Knuth, 1997: 464).

Linking automata can easily simulate graph machines, taking at most a bounded number of steps per graph step. Conversely, however, it is unlikely that graph machines can simulate arbitrary linking automata without unboundedly increasing the running time, unless the definition is changed from undirected to directed graphs, in view of the restriction to vertices of bounded degree. The linking model is, of course, quite close to the operations available to programmers on real machines, while the graph model is not. of the most interesting problems to solve for such devices would be to determine how fast they can solve certain problems, or how many nodes they need to solve certain problems (for example, to translate certain formal languages). At the time this chapter was first written, several interesting results of this kind had been obtained (notably by J. Hartmanis and R. E. Stearns) but only for special classes of Turing machines having multiple tapes and read/write heads. The Turing machine model is comparatively unrealistic, so these results tended to have little to do with practical problems. must admit that, as the number n of nodes created by a linking automaton approaches infinity, we don't know how to build such a device physically, since we want the machine operations to take the same amount of time regardless of the size of n; if linking is represented by using addresses as in a computer memory, it is necessary to put a bound on the number of nodes, since the link fields have a fixed size. A multitape Turing machine is therefore a more realistic model when n approaches infinity. Yet it seems reasonable to believe that a linking automaton as described above leads to a more appropriate theory of the complexity of algorithms than Turing machines do, even when asymptotic formulas for large n are considered, because the theory is more likely to be relevant for practical values of n. Furthermore when n gets bigger than 1030 or so, not even a one-tape Turing machine is realistic: It could never be built. is more important than realism. Many years have passed since the author wrote most of the comments above, and everybody can be glad that substantial progress has indeed been made on the theory of linking automata (now called pointer machines). But of course much still remains to be done.


Статистика:

Параметр Значениестроки 32слова 393символы 2383

Перевод, выполненный статистической СМП


Машинный перевод отрывка (на основании веб-сервиса Google Переводчик).

Образцы автоматы могут легко имитировать графа машин, принимая более ограниченным числом шагов в графе шаг. С другой стороны, однако, маловероятно, что граф машины могут моделировать произвольные Образцы автоматов без неограниченно возрастающая время работы, если определение изменяется от неориентированного на ориентированные графы, в силу ограничения на вершины ограниченной степени. Образцы модель, конечно, совсем близко от операций, доступных для программистов на реальных машинах, а граф модель не является.

Некоторые из наиболее интересных задач для решения таких устройств будет определить, как быстро они могут решить некоторые проблемы, или, как многие узлы им необходимо для решения определенных задач (например, перевод некоторых формальных языков). В то время эта глава впервые была написана, несколько интересных результатов такого рода были получены (в частности, Дж. Хартманис и RE Stearns), но только для специальных классов машин Тьюринга, имеющих несколько лент и головок чтения / записи. Модель машины Тьюринга сравнительно нереально, так что эти результаты как правило, имеют мало общего с практическими проблемами.

Мы должны признать, что, как число n узлов, созданных по Образцы бесконечности автомата подходы, мы не знаем, как построить такие устройства физически, так как мы хотим машинных операций принять столько же времени, независимо от размера n, если Образцы представлены с помощью адресов, как в памяти компьютера, необходимо поставить оценку числа узлов, так как ссылка поля имеют фиксированный размер. Тьюринга машина Поэтому более реалистичной модели, когда n стремится к бесконечности. Однако, как представляется разумным полагать, что связь автомата, как описано выше, приводит к более подходящей теории сложности алгоритмов, чем машины Тьюринга делать, даже если асимптотические формулы при больших n считаются, потому что теория, скорее всего, иметь отношение к практической значениях n. Кроме того, когда n становится больше, чем 1030 или около того, даже не одна машина Тьюринга является реалистичной: она никогда не может быть построена.

Соответствие является более важным, чем реализм. Много лет прошло с тех пор автор написал большую часть комментарии выше, и все может быть рад, что существенный прогресс действительно были сделаны на теории Образцы автоматов (сейчас он называется указатель машин). Но, конечно, многое еще предстоит сделать.


Перевод, выполненный трансфертной СМП


Машинный перевод отрывка (на основании СМП Промпт):

Соединение автоматов может легко моделировать машины графика, беря самое большее ограниченное число шагов на шаг графика. Наоборот, однако, маловероятно, что машины графика могут моделировать произвольные автоматы соединения, неограниченно не увеличивая время выполнения, если определение не изменено от неориентированного до направленных графиков, ввиду ограничения на вершины ограниченной степени. Соединяющаяся модель, конечно, вполне близко к операциям, доступным программистам на реальных машинах, в то время как модель графика нет.

Некоторые из самых интересных проблем решить для таких устройств состояли бы в том, чтобы определить, как быстро они могут решить определенные проблемы, или сколько узлов они должны решить определенные проблемы (например, чтобы преобразовать определенные формальные языки). В то время, когда эта глава была сначала записана, несколько интересных результатов этого вида были получены (особенно Дж. Хартмэнисом и Р. Э. Стернзом), но только для специальных классов Машин Тьюринга, имеющих многократные ленты и комбинированные головки. Модель Машины Тьюринга сравнительно нереалистична, таким образом, эти результаты имели тенденцию иметь мало общего с практическими проблемами.

Мы должны признать, что, поскольку номер n узлов, создаваемых соединяющимся автоматом, приближается к бесконечности, мы не знаем, как создать такое устройство физически, так как мы хотим, чтобы машинные операции заняли то же самое количество времени независимо от размера n; если соединение представлено при использовании адресов как в памяти компьютера, необходимо поместить привязанный число узлов, так как у полей ссылки есть фиксированный размер. Машина Тьюринга мультиленты - поэтому более реалистическая модель, когда n приближается к бесконечности. Все же кажется разумным полагать, что соединяющийся автомат как описано выше приводит к более соответствующей теории сложности алгоритмов, чем Машины Тьюринга, даже когда асимптотические формулы для большого n рассматривают, потому что теория, более вероятно, будет важна для практических значений n. Кроме того, когда n становится больше чем приблизительно 1030, не, даже Машина Тьюринга с одной лентой реалистична: Это никогда не могло создаваться.

Уместность более важна чем реализм. Много лет передали, так как автор записал большинство комментариев выше, и все могут радоваться, что значительный прогресс был действительно сделан на теории соединения автоматов (теперь названным машинами указателя). Но конечно много все еще остается быть сделанным.


Перевод, выполненный человеком


Перевод сделанный профессиональным переводчиком (Кнут Д, 2002:511):

Связывающие автоматы могут легко моделировать машины графов, используя ограниченное сверху количество шагов на один шаг работы графа. Напротив, маловероятно, чтобы машины графов могли моделировать произвольные связывающие автоматы без неограниченного увеличения времени работы, если не перейти от неориентированных графов к ориентированным, чтобы работать с вершинами с ограниченной степенью. И, конечно, связывающая модель гораздо ближе к операциям, доступным программисту на реальной машине, в отличие от модели с использованием графа.

Самыми интересными проблемами, которые предстоит решить для такого рода устройств, являются определение скорости решения поставленных ими задач, т. е. подсчет количества узлов, требуемых для решения той или иной задачи (например, для трансляции какого-либо формального языка). В то время, когда автор приступил к работе над настоящей главой, были получены интересные результаты такого рода (отметим работы Ю. Хартманиса (J. Hartmanis) и Р.Э. Стирнса (R.Е. Stearns)), но только для специальных классов машин Тьюринга с множеством лент и головок чтения/записи. Модель машины Тьюринга сравнительно нереальна, а потому полученные результаты имеют мало общего с решением практических задач.

Следует признать, что при стремлении количества созданных связывающим автоматом узлов n к бесконечности неизвестно, как построить такое устройство физически, поскольку желательно, чтобы операции машины выполнялись за одно и то же время независимо от размера n. Если связывание представлено с использованием адресов в машинной памяти, необходимо определить границу для количества узлов, поскольку поля связей имеют фиксированный размер.

Многоленточная машина Тьюринга поэтому представляет собой более реалистичную модель при стремлении n к бесконечности. Представляется также обоснованной уверенность в том, что описанные выше связывающие автоматы приведут к созданию более приемлемой теории сложности алгоритмов, чем машина Тьюринга, даже при рассмотрении асимптотических формул для больших n, так как эта теория больше подходит для практических значений n. Кроме того, когда n становится больше, чем 1030 или около того, даже одноленточная машина Тьюринга не является реалистичной: она никогда не будет построена. Принципы важнее реалий. Со времени первого написания автором большинства приведенных выше комментариев утекло много воды, и можно порадоваться, что в теории связывающих автоматов (сегодня называемых машинами указателей (pointer machines)) достигнут определенный прогресс, хотя, конечно же, предстоит еще немало сделать в этой области.


Статистика:

Параметр Значениестроки 37слова 338символы 4489

Таблицы анализа

Ниже приведены таблицы анализа всех трех отрывков для каждой СМП. Строки таблицы имеют нумерацию в виде (n.m), где n - номер отрывка, m - номер предложения.









Список сокращений


ФС - функциональный стиль.

СМП - системы машинного перевода.


Условные обозначения


Условные обозначения, используемые в таблицах аналитической части.

·НА - начало абзаца;

·/* комментарий */ - комментарии к отдельным участкам;

·*** - линейки таблицы, которые хотелось бы обратить особое внимание;

·{{Термин}} - обозначаются термины;

·{{Термин}} - обозначаются термины, переведенные с недочетами;

·Участки, стилистически характерные для научного стиля;

·Участки, которые стилистически нельзя отнести к научному стилю;

·Участки, на которые хотелось бы обратить особое внимание;

·Участки, на в которых имеются недочеты;


ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ (ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ) ИНСТИТУТ ИНОСТРАННЫХ ЯЗЫКОВ МАИ

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ