Особенности машинного перевода

 













Курсовая работа

Особенности машинного перевода


Введение

перевод языковой машинный

Для того чтобы хорошо переводить, знания двух языков недостаточно. Чтобы в полной мере выполнить коммуникативную функцию перевода, достичь того, чтобы текст перевода произвел на получателя то впечатление, какое производит исходный текст, необходимо знать законы перевода, четко представлять его требования, предъявляемые обществом к переводу и к переводчику.

B XXI веке роль перевода в жизни человека неуклонно возрастает. Переводимые тексты весьма разнообразны по тематике, языку, жанровой принадлежности. Переводы выполняются в письменной или устной форме, к переводчикам предъявляются неодинаковые требования в отношении точности и полноты перевода и т.д. Все это обуславливает существование разных видов перевода, каждый из которых, оставаясь, перевод в своей общелингвистической основе, может иметь существенные особенности, что в свою очередь, вызывает необходимость научной классификации видов перевода.

В настоящее время имеется достаточно широкий выбор программ, облегчающих труд переводчика, среди которых особое место занимают системы машинного перевода. Системы машинного перевода обеспечивают связный перевод текстов, учитывающий морфологические, синтаксические и семантические связи членов предложения.

Сегодня программы-переводчики способны строить осмысленные фразы, и за последние несколько лет качество перевода улучшилось. Однако компьютер еще плохо разбирается в грамматических нюансах, поэтому его главное назначение - переводы деловых бумаг, руководств, писем из электронной почты, страничек из Интернета (Web-страниц). Другое применение систем - облегчение рутинной работы переводчиков, выполнение за них подстрочного перевода, который можно легко подправить.

Актуальность выбранной нами темы обусловлена необходимостью классифицировать виды перевода и рассмотреть особенности машинного перевода.

Целью работы является описание понятия «перевод» и ознакомиться с видами, формами и жанрами перевода, а так же особенностями машинного перевода.

Чтобы достичь этой цели, нам необходимо выполнить следующие задачи:

1.найти определение понятия «перевод»

2.классифицировать виды перевода

.рассмотреть проблемы переводимости на примере машинного перевода

.обобщить полученные результаты и сделать вывод

Объектом работы является перевод, а предметом - особенности машинного перевода.

Выбранные нами методы исследования - анализ литературы и обобщение полученных данных.


1. Теоретические основы исследования


.1 Перевод и другие виды языкового посредничества


Слово «перевод» принадлежит к числу общеизвестных и общепонятных, но и оно, как обозначение специального вида человеческой деятельности и ее результата, требует уточнения и терминологического определения.

Перевод как один из видов языковой деятельности представляет собой процесс адекватной и полноценной передачи мыслей, высказанных на одном языке, средствами другого языка [Нелюбин 2009:138].

Перевод - это сложный и многогранный вид человеческой деятельности. Хотя обычно говорят о переводе «с одного языка на другой», но, в действительности, в процессе перевода происходит не просто замена одного языка другим. В переводе сталкиваются различные культуры, разные личности, разные склады мышления, разные литературы, разные эпохи, разные уровни развития, разные традиции и установки. Переводом интересуются культурологи, этнографы, психологи, историки, литературоведы, и разные стороны переводческой деятельности могут быть объектом изучения в рамках соответствующих наук. В то же время в науке о переводе - переводоведения - могут выделяться культурологические, когнитивные, психологические, литературные и прочие аспекты [Комиссаров 2002: 22].

Л.С. Бархударов, один из основоположников отечественной теории перевода, дает следующее определение: «Переводом называется процесс преобразования речевого произведения на одном языке в речевое произведение на другом языке при сохранении неизменного плана содержания, то есть значения» [Бархударов 1975: 11].

Согласно О.С. Ахмановой, перевод - это «передача информации, содержащейся в данном произведении речи, средствами другого языка» [Семко 1988: 9].

В представлении И.Р. Гальперина «перевод - это передача смыслового содержания и стилистических особенностей высказывания на одном языке средствами другого языка» [Семко 1988: 9].

Г.В. Колшанский считает, что «перевод как один из важнейших видов коммуникативной деятельности ориентируется прежде всего на полную и адекватную передачу языка-оригинала, содержащего всю совокупность импликаций языкового, социального и культурного плана» [Семко и др. 1988: 10].

Обращает на себя внимание и определение А.В. Федорова: «Перевести - значит выразить верно и полно средствами одного языка то, что уже выражено ранее средствами другого языка» [Федорова 1983: 10].

Л.К. Латышев дает следующее определение перевода: «Перевод - вид языкового посредничества, общественное предназначение которого заключается в том, чтобы в максимально возможной мере приблизить опосредованную двуязычную коммуникацию по полноте, эффективности и естественности общения к обычной одноязычной коммуникации» [Латышев 1988: 7].

Не случайно Ю. Найда иронично заметил, что «определений правильного перевода почти так же много, как и авторов, занимающихся обсуждением предмета». Предлагаемый Ю. Найдой обзор множества определений перевода свидетельствует о том, что большей частью исследователи определяют перевод либо через требования, предъявляемые переводчику (1. «Он должен понимать слово в оригинале и по смыслу, и по стилю», 2. «Он должен преодолеть различия между двумя лингвистическими структурами», 3. «Он должен в своем переводе воссоздать стилистическую структуру оригинала»), либо через требования, которым должен удовлетворять сам текст перевода. Ю. Найда формулирует четыре требования к переводу: 1) передавать смысл, 2) передавать дух и стиль оригинала, 3) обладать легкостью и естественностью изложения, 4) вызывать равнозначное впечатление [Найда 1978: 121].

Тем не менее, в некоторых работах предпринимались попытки преодолеть этот недостаток предлагаемых определений. Так, Питер Ньюмарк писал: «Если я определю акт перевода как перенос значения единицы языка, всего текста или его части из одного языка в другой, то, возможно, мне удастся должным образом решить проблему, сделав акцент на содержании понятия значения, нежели на содержании понятий «эквивалентность», «идентичность», «сходство», «похожесть», «одинаковость», «соответствие» и т.п.» [Newmark Peter 1980: 27].

Перевод может определяться как передача мыслей (чувств, эмоций), высказанных на одном языке, средствами другого языка, или как замена текстового материала на одном языке (языке источнике - ИЯ) эквивалентным текстовым материалом на другом языке (языке перевода - ПЯ), или как процесс речеязыковой коммуникации, протекающей в двуязычном ситуации, т.е. такой ситуации, когда коммуникативная деятельность протекает (осуществляется) в кодах двух разных знаковых систем.

В этой связи следует отметить, что в настоящее время, как мы знаем, естественный язык рассматривается как какая-то знаковая система, в которой языковой знак представляет собой знак особой природы. Он отличается от других знаков тем, что производится человеком и служит средством общения, людей между собой, являясь такой языковой смысловой или смыслоразличительной единицей, которая производится в целях речеязыковой коммуникации. Совокупность языковых смысловых (смыслоразличительных) единиц, находящихся в определенных отношениях друг к другу, составляет систему. Язык - это упорядоченная совокупность или система языковых смысловых или смыслоразличительных единиц - суть языковых знаков.

Осуществляя коммуникативную деятельность в двуязычной ситуации, переводчик одновременно кодирует и декодирует обрабатываемую им информацию в кодах двух разных знаковых систем. Поэтому процесс перевода можно считать сложным видом психолингвистической деятельности в условиях двуязычной ситуации [Нелюбин 2009: 17].


.2 Виды, формы и жанры перевода


Реальная переводческая деятельность осуществляется переводчиками в различных условиях; переводимые тексты весьма разнообразны по тематике, языку, жанровой принадлежности; переводы выполняются в письменной или устной форме, к переводчикам предъявляются неодинаковые требования в отношении точности и полноты перевода и т.д. [Комиссаров 1990: 94]. Все это обусловливает существование разных видов перевода, каждый из которых, оставаясь переводом в своей общелингвистической основе, может иметь существенные особенности, что, в свою очередь, вызывает необходимость научной классификации видов переводческой деятельности [Сдобников, Петрова 2006: 96].

Понятие видов перевода связано, прежде всего, с жанровыми особенностями материала, являющегося объектом межъязыковой передачи. Выделяют два основных вида перевода: перевод художественный и перевод специальный.

Художественный перевод, или перевод литературоведческий, функционирует в сфере художественной литературы. Его теоретической базой является литературоведческая теория перевода, направленная также и на решение историко-литературных задач.

Для художественного текста основной является художественно-эстетическая, или поэтическая функция. Для специальных текстов основной является функция сообщения, информирования.

Художественным переводом называется перевод произведений художественной литературы, основная задача которого заключается в порождении на ПЯ речевого произведения, способного оказывать художественно-эстетическое воздействие на получателя перевода [Сдобников, Петрова 2006: 97].

В указанных двух видах перевода различают также жанры перевода. В литературоведении и лингвистике жанр определяется как исторически сложившийся ряд художественных произведений и произведений специальных отраслей знаний, характеризующихся определенными композиционными (архитектурными), стилистическими и другими признаками, а также отдельные разновидности этого ряда, относящиеся к разным функциональным стилям и подсистемам языка. Соответственно, в художественном переводе - это проза, драматургия, поэзия и другие подстили, в специальном переводе - это подъязыки (подстили, языки официальных документов (дипломатических, юридических, военных, коммерческих и др.)), научно-технических по предметным областям знания (химии, физики, математики, электроники и т.д.), публицистических (газетных сообщений, газетных статей, журнальных статей, эссе, ораторской речи, заголовков, объявлений, рекламы и других СМИ), повседневного общения (литературно-фамильярный и фамильярно-разговорный).

Формы перевода определяются способом, которым перевод осуществляется. С этой точки зрения различают письменный и устный переводы, а так же их разновидности (переводы двусторонний, последовательный, синхронный).

Письменный перевод - наиболее распространенная профессиональная форма перевода, когда объем памяти, неограничен Его называют также письменно-письменным.

В письменном переводе переводчик не ограничен жесткими временными рамками, он может в любой момент прервать перевод, вернуться к уже переведенному отрезку речи, потратить дополнительное время на обдумывание варианта перевода. В устном переводе действия переводчика строго ограничены по времени темпом ораторской речи, необходимостью выдавать перевод одновременно созвучанием ораторской речи или сразу же после произнесения соответствующего текста (или его части) оратором [Бархударов 1975:46-49].

Устный перевод - понятие объединяет все формы перевода, предполагающие устное оформление. Его разновидности:

·Зрительно - устный перевод или перевод с листа, т.е. устный перевод, осуществляемый одновременно со зрительным восприятием исходного письменного текста. Устный перевод на слух включает последовательный перевод и синхронный перевод.

·Последовательный перевод - устный перевод сообщения с одного языка на другой после его прослушивания, осуществляемый в конце всего сообщения. Он включает: последовательный перевод с записью, когда перевод во время восприятия фиксируется переводчиком с использованием системой записей в последовательном переводе.

·Абзацно-фразовый перевод - упрощенная форма последовательного перевода, когда текст переводится после прослушивания его не целиком, а по частям.

Письменный и устный перевод различаются также и «направлением» перевода, то есть характером соотношения участвующих в акте коммуникации языков. В письменном переводе соотношение языков постоянное, перевод осуществляется всегда «в одну сторону» (например, с английского языка на русский), в то время как в устном переводе это соотношение языков и «направление» перевода могут меняться, как в случае двустороннего перевода беседы (каждый из коммуникантов последовательно выступает то в роли Источника, то в роли Рецептора).

Как уже было сказано, это две основные классификации видов переводческой деятельности. Использование иных критериев может привести к созданию других классификаций перевода. Виды перевода можно классифицировать по следующим критериям:

  • по участию человека в процессе перевода («машинный перевод» в противопоставлении переводу участием человека);

- по типу и однородности использованных в процессе коммуникации семиотических систем (межсемиотический перевод и внутрисемиотический перевод, в рамках внутрисемиотического перевода различают межъязыковой перевод и внутриязыковой перевод) [Сдобников, Петрова 2006: 101].

Данная классификация, вовсе не претендуя на полноту описания и абсолютную логичность построения, тем не менее, позволяет более точно описать виды переводческой деятельности с учетом их особенностей. В этом описании сомнение может вызвать соотнесение жанрово-стилистической и психолингвистической классификаций. Например, традиционно художественный перевод представлялся как перевод, осуществляемый в письменной форме (письменно-письменный перевод). Вместе с тем, есть все основания считать, что синхронный перевод кинофильмов также относится к художественному переводу, однако, осуществляемому в устной форме (устно-устный перевод). Официально-деловой, научно-технический переводы могут осуществляться как в традиционной письменной, так и в устной форме (перевод устных выступлений на конференциях, в ходе официальных переговоров и т.п.) [Сдобников, Петрова 2006:103].


.3 Место машинного перевода в общей классификации


Перевод (по определению) - это деятельность, заключающаяся в передаче содержания текста на одном языке средствами другого языка, а также результат такой деятельности. Особое место в теории перевода занимает машинный перевод (МП) - научная и одновременно технологическая дисциплина, связанная с наукой о переводе, а так же с компьютерной лингвистикой. Машинный перевод - это выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия [Фролов, Паньков 2008: 127].

Толковый переводоведческий словарь Л.Л. Нелюбина определяет машинный перевод следующим образом: - 1. Автоматический перевод текста на основе заданной программы, осуществляемой ЭВМ. 2. Отрасль языкознания, разрабатывающая теорию такого перевода на основе коренного пересмотра основных положений и методов лингвистики. 3. Автоматизированная обработка информации в условиях двуязычной ситуации - передача текста с одного человеческого (естественного) языка на другой. 4. Перевод с использованием машин (ЭВМ, компьютера). 5. Общий процесс переработки информации в условиях двуязычной ситуации на любом этапе использования (и развития) технических средств. 6. Процесс перевода текста с одного языка (естественного или искусственного) на другой (естественный или искусственный), осуществляемый на электронной цифровой вычислительной машине [Нелюбин 2009:107].

Идея машинного перевода, т.е. мысль поручить машине работу по переводу с одного естественного языка на другой, насчитывает к настоящему времени уже около пятидесяти лет существования. Примерно столько же лет ведутся научно-исследовательские и опытно-конструкторские работы по машинному (автоматическому) переводу во многих странах мира [Марчук 2007: 245].

Говоря о машинном переводе, следует, прежде всего, помнить, что компьютер не наделен сознанием. Он не понимает языковых нюансов, намеков в тексте, того, что называется тонкой игрой слов. Мышления как такового при машинном переводе не происходит: предложение расчленяется на части речи, в нем выделяются стандартные конструкции, слова и словосочетания переводятся по находящимся в памяти машины словарям. Затем переведенные части речи собираются по правилам другого языка.

Но этого недостаточно для полноценного перевода. В зависимости от того или иного стиля и назначения текста одно и то же слово нередко имеет разные значения. В какой-то мере эта особенность учитывается в системах машинного перевода: предусмотрены сменные словари, иногда для каждого вида текста предусмотрен свой словарь. Если лексики одного машинного словаря не хватает и применяются несколько словарей одновременно, можно указать системе, из какого словаря нужно брать слово, если есть несколько вариантов его перевода. Наконец, программа сама может предлагать на выбор пользователю несколько вариантов перевода, и он сам выбирает подходящий вариант [Пиотровский 1979: 58].

При нынешнем уровне машинного перевода без участия человека не обойтись. Чтобы компьютер мог перевести текст, ему нужна помощь предредактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интерредактора, который участвует в процессе перевода, и постредактора, который исправляет ошибки и недочеты в переведенном машиной тексте [Рябцева 1986: 167].

В основе работы программы-переводчика лежит алгоритм перевода - последовательность однозначно и строго определенных действий над текстом для нахождения соответствий в данной паре языков L1 - L2 при заданном направлении перевода (с одного конкретного языка на другой).

Чтобы успешно работать, система машинного перевода включает в себя, во-первых, двуязычные словари, снабженные необходимой информацией (морфологической, относящейся к формам слова, синтаксической, описывающей способы сочетания слов в предложении, и семантической, т.е. отвечающей за смысл), а во-вторых - средства грамматического анализа. Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:

. На первом этапе осуществляется ввод текста и поиск входных словоформ во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы, например, каким членом предложения может быть данное слово. Для машины совмещение двух операций - и грамматического разбора, и обращения к смыслу слов - задача трудная. Поэтому машина осуществляет синтаксический анализ предложения без опоры на значения слов, с использованием информации только об их грамматических свойствах. В результате синтаксического анализа возникает синтаксическая структура, которая изображается в виде дерева зависимостей: «корень» - сказуемое, а «ветви» - синтаксические отношения его с зависимыми словами. Каждое слово предложения записывается в своей словарной форме, а при ней указываются те грамматические характеристики, которыми обладает это слово в анализируемом предложении.

. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, их роли в данном предложении и пр.), производимое в рамках входного языка; разрешение неоднозначности (например, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом).

. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка.

. Синтез выходных словоформ и предложения в целом на выходном языке. Синтаксис каждого языка устроен на свой лад: то, что в русском предложении - подлежащее, в другом языке может (или должно) быть выражено дополнением, а дополнение, наоборот, должно преобразоваться в подлежащее; то, что в одном языке обозначается группой слов, переводится на другой всего одним словом и т.д. В связи с этим в машинную память помимо наборов синтаксических правил для каждого языка «вкладывают» и правила преобразования синтаксических структур. К этому добавляют правила перехода от уже преобразованной структуры к предложению того языка, на который делается перевод. Такой переход от структуры к реальному предложению называется синтаксическим синтезом.

В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны [Марчук 1985: 202].


.4 Машинный перевод: краткая история


Еще выдающийся математик XIX века Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследования по разработке «вычислительной машины». В числе прочих благ он обещал, что когда-нибудь эта машина сможет автоматически переводить разговорную речь. Однако эта идея так и осталась нереализованной [Шаляпина 1996: 105].

Датой рождения машинного перевода как исследовательской области обычно считают март 1947 г. Именно тогда специалист по криптографии Уоррен Уивер в своем письме Норберту Винеру впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки.

Тот же Уивер после ряда дискуссий составил в 1949 г. меморандум, в котором теоретически обосновал принципиальную возможность создания систем машинного перевода. У. Уивер писал: «I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text» («У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все, что мне нужно, - это взломать код, чтобы извлечь информацию, заключенную в тексте») [Слокум 1989: 56-58].

Идеи Уивера легли в основу подхода к МП, основанного на концепции interlingva: стадия передачи информации разделена на два этапа. На первом этапе исходное предложение переводится на язык-посредник (созданный на базе упрощенного английского языка), а затем результат этого перевода представляется средствами выходного языка.

В те времена немногочисленные компьютеры использовались в основном для решения военных задач, поэтому неудивительно, что в США основное внимание уделялось русско-английскому, а в СССР - англо-русскому направлению перевода. К началу 50-х годов над проблемой автоматического перевода бился целый ряд исследовательских групп.

В 1952 г. состоялась первая конференция по МП в Массачусетском технологическом университете, а в 1954 г. была представлена первая полноценная система машинного перевода - IBM Mark II, разработанная компанией IBM совместно с Джорджтаунским университетом (это событие вошло в историю как Джорджтаунский эксперимент). Очень ограниченная в своих возможностях система великолепно переводила 49 специально подобранных предложений с русского языка на английский с использованием словаря на 250 слов и шести грамматических правил.

Одной из новых разработок 70-80-х годов стала технология TM (translation memory), работающая по принципу накопления: в процессе перевода сохраняется исходный сегмент (предложение) и его перевод, в результате чего образуется лингвистическая база данных; если идентичный или подобный исходному сегмент обнаруживается во вновь переводимом тексте, он отображается вместе с переводом и указанием совпадения в процентах. Затем переводчик принимает решение (редактировать, отклонить или принять перевод), результат которого сохраняется системой.

С начала 80-х годов, когда персональные компьютеры уверенно и мощно начали завоевывать мир, время их работы подешевело, и доступ к ним можно было получить в любую минуту. МП стал экономически выгодным. К тому же в эти и последующие годы совершенствование программ позволило достаточно точно переводить многие виды текстов, однако некоторые проблемы МП остались нерешенными и по сей день.

-е годы можно считать подлинной эпохой возрождения в развитии МП, что связано не только с высоким уровнем возможностей персональных компьютеров, но и с распространением Интернет, что обусловило реальный спрос на МП. Он вновь стал привлекательной областью вложения капиталов, как для частных инвесторов, так и для государственных структур [#"justify">С начала 1990-х годов на рынок систем ПК выходят российские разработчики.

В июле 1990 г. на выставке PC Forum в Москве была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammers Machine Translation). В 1991 г. было создано ЗАО «ПРОект МТ», и уже в 1992 г. компания ПРОМТ выиграла конкурс NASA на поставку систем МП (ПРОМТ была единственной неамериканской фирмой на этом конкурсе) [Кулагин 1979: 324].

Что же касается самих систем машинного перевода, то следует отметить, что они прошли три стадии своего развития:

. «Электронные переводчики» первого поколения - системы прямого перевода (СПП) - представляли собой программно-аппаратные комплексы и анализировали текст «слово за словом» (смысловые связи и нюансы при этом практически не учитывались). Возможности СПП определялись доступными размерами словарей, прямо зависящими от объема памяти компьютера. Именно к категории СПП относилась IBM Mark II, сделавшая принципиально возможным Джорджтаунский эксперимент.

. На смену СПП со временем пришли Т-системы (от английского Transfer - «преобразование»), в которых перевод осуществлялся на уровне синтаксических структур (так учат языку в средней школе). Они выполняли набор операций, позволяющих путем анализа переводимой фразы определять ее синтаксическую структуру по правилам грамматики входного языка, а затем преобразовывать ее в синтаксическую структуру выходного предложения и синтезировать новую фразу, подставляя нужные слова из словаря выходного языка. Работы в этом направлении сейчас уже не ведутся: практикой доказано, что реальная система соответствий сложнее и адекватный перевод требует принципиально иного алгоритма действий.

. Немногим позднее становящиеся все более многочисленными системы машинного перевода в зависимости от принципа их работы стали подразделять на МТ-программы (от Machine Translation - «машинный перевод») и ТМ-комплексы (от Translation Memory - «память переводов»). В качестве реально успешного примера МТ-программы назовем знаменитую канадскую систему METEO, выполняющую перевод метеопрогнозов с французского языка на английский и обратно (она была создана почти тридцать лет назад и эксплуатируется по сей день). Разработчики METEO сделали ставку на то, что действительно автоматизированный машинный перевод возможен только в условиях искусственно ограниченного (как по словарному запасу, так и по грамматике) языка. И добились успеха. Наиболее популярным в мире профессиональным TM-инструментом является пакет Translations Workbench фирмы TRADOS. Подобные программы используют в основном профессиональные переводчики, осознавшие выигрыш от частичной автоматизации своей работы с помощью компьютера при переводе повторяющихся текстов, сходных по тематике и структуре.

Основная идея Translation Memory - не переводить один и тот же текст дважды. Эта технология базируется на сравнении документа, который нужно перевести, с данными, хранящимися в предварительно созданной «входной» базе. Когда система находит фрагмент, соответствующий заранее определенным критериям, то его перевод берется из «выходной» базы. Получаемый в итоге текст подлежит интенсивному постредактированию человеком [Марчук 1997: 21-22].



2. Анализ некоторых особенностей машинного перевода


2.1 Проблема переводимости при машинном переводе


Проблема переводимости связана с тем, что действительность по-разному членится разными языками. Именно исходя из этого факта, многие лингвисты ставили под сомнение возможность перевода текстов с одного языка на другой. Наиболее ярко идея несводимости друг к другу двух картин мира, описываемых разными языками, была высказана в лингвистике В. Гумбольдтом: «Каждый язык описывает вокруг народа. Которому он принадлежит, круг, из пределов которого можно выйти только в том случае, если вступаешь в другой круг». Изучение иностранного языка можно было бы поэтому уподобить приобретению новой точки зрения в прежнем миропонимании; только потому, что в чужой язык мы в большей или меньшей степени переносим свое собственное миропонимание и свое собственное языковое воззрение, мы не ощущаем с полной ясностью результатов этого процесса [Ревзин, Розенцвейг 1964: 243].

Разработка правил машинного перевода с одного языка на другой поставила перед лингвистами ряд проблем, которые относятся как к переводу с различных языков и на различные языки, так и к принципам анализа текста на некотором данном языке.

  • проблемы неоднозначности;
  • проблемы структурного и лексического различия между языками;
  • грамматические конструкции, состоящие из нескольких слов, такие как идиомы и словосочетания.

Проблема неоднозначности. В самом лучшем для переводчика случае, каждое слово языка имело бы одно и только одно значение. Но это далеко не так. Когда одно слово имеет несколько значений, говорят, что присутствует лексическая неоднозначность. Если же предложение может иметь несколько разных структур, говорят о структурной неоднозначности.

Случай, когда предложение может иметь несколько значений - это скорее правило, чем исключение. Усложняет работу и то, что неоднозначности могут накапливаться. Например, если предложение состоит из двух слов и каждое может иметь два значения, в худшем случае его можно перевести четырьмя разными способами. Естественно, может понадобиться рассмотреть все возможные случаи перевода, чтобы выбрать только один из них. Единственное подходящее решение - сделать процесс перевода интерактивным. При появлении такого рода неоднозначности придется спросить человека, сидящего за компьютером, какой из вариантов перевода он считает наиболее осмысленным.

Грамматические различия в языках

Различие в типе грамматического (и именно морфологического) строя языка обуславливает некоторые различия в характере переводческих правил для данного языка. Необходимость таких различий была обнаружена уже при разработке правил перевода с английского на русский, поскольку в английском языке отсутствует ряд форм, вследствие чего гораздо уже представлено согласование как форма связи между членами словосочетания.

Лингвистической задачей машинного перевода является выработка такой системы правил, которая позволила бы, имея некоторый текст на данном языке, однозначно определить, какой текст другого языка должен быть адекватен по смыслу данному тексту. Любой язык имеет словарный состав и грамматический строй. Поэтому любой текст любого языка содержит слова, связанные между собой по нормам грамматического строя данного языка. Различные грамматические связи служат для выражения различных отношений между понятиями, выражаемыми словами. Поэтому правила перевода с одного языка на другой должны содержать, как правила перевода слов, так и правила передачи грамматических средств одного языка, выражающих некоторые отношения, грамматическими средствами другого языка, выражающими те же отношения [Кузнецов, Ляпунов, Реформатский 1956: 108].

Сложные конструкции - идиомы и словосочетания. Идиома - это набор слов, который имеет собственное значение, не зависящее от значения составных частей.


If Jim mends the bucket, his children will be rich.Jim kicks the bucket, his children will be rich.

Если Джим сыграет в преферанс, его дети будут богатыми.

Если Джим сыграет в ящик, его дети будут богатыми.


Если пользоваться любыми другими правилами, первое предложение можно перевести правильно, а второе нельзя, так как «kick the bucket» - идиома. Есть, конечно, исключения. Например, «to take bull by the horns» можно совершенно свободно перевести на русский («взять быка за рога»).

Идиомы похожи на языковые пробелы, и, вероятно, решение этой проблемы должно быть одинаковым. Идиомы должна выявляться на одном из начальных этапов перевода, чтобы избежать их потери, и обрабатываться системой как одно слово. Трудность возникает только в вопросе привязки идиомы к слову, по которому будет производиться ее поиск. В предыдущем примере можно задать условие поиска идиомы по глаголу «to kick», чтобы искать ее окончание, или по существительному «buсket». Проблема в том, что идиомы могут быть записаны в нескольких формах и эти формы могут не всегда образовываться по обычным грамматическим правилам.

Словосочетания отличаются от идиом. Их смысл полностью исходит из смысла составных частей, но только не всегда можно узнать, какие слова следует употреблять:

This butter is rancid (неправильно - sour, rotten, stale).

То есть тот факт, что англичане говорят «rancid butter», но не «sour butter», нельзя угадать только по слову «butter» и тем более по слову «rancid» [Марчук 1983: 231].

Однако общее значение в разных языках могут иметь не только отдельные слова, но и словосочетания, поэтому простейший переводящий автомат ищет соответствия не только для отдельных слов, но и для словосочетаний, выполняя так называемый пословно-пооборотный перевод.

Кроме того, соответствие слов разных языков друг другу не является однозначным, т.е. одному слову языка А может соответствовать несколько слов языка В и наоборот. Следовательно, в переводящем автомате необходимо предусмотреть программу выбора правильного эквивалента.

Такие программы обычно основываются на двух принципах:

. На принципе выбора эквивалента по синтаксической модели входного текста, чаще всего по синтаксической модели предложения. Таким образом, например, автомат может различить эквиваленты глагола «to book» и существительного «book» (соответственно, «резервировать» и «книга»).

. На принципе выбора эквивалента по семантической модели. По разным семантическим моделям автомат, например, может различать такие эквиваленты слова «solution» как «решение» и «раствор». Обе модели обычно применяют в комплексе. И сами модели, и процедуры выбора эквивалентов довольно сложны.

В некоторых более сложных системах в дополнение к этим двум принципам выбора эквивалента применяют также и принцип выбора на основе внелингвистической (фоновой) информации. Модели для выбора эквивалентов, работающие по этому принципу, еще сложнее: их относят к разряду моделей искусственного интеллекта.

В зависимости от сложности выбора правильного значения слов и, соответственно, правильного переводного эквивалента модели и системы машинного перевода можно разделить на три уровня.

К первому, низшему уровню относятся простейшие модели пословно-пооборотного перевода, в которых выбор эквивалентов не производится и на выход системы перевода поступают все переводные эквиваленты, имеющиеся в словаре.

Системы второго уровня, к которым относятся почти все так называемые «электронные переводчики», имеющиеся на современном рынке программного обеспечения, используют ту или иную комбинацию синтаксических и семантических моделей для выбора правильного эквивалента и преобразования структуры входного текста в структуру текста перевода.

Наконец, модели третьего уровня в дополнение к грамматике и семантике применяют для синтеза текста перевода также и фоновые знания [Мирам 1999: 130].

хороший перевод текста - это не только творческая, но и достаточно трудоемкая работа. Что касается творческой части, то в обозримом будущем в соревновании компьютер-человек всегда победит «живой» переводчик. Однако для решения проблем, обусловленных трудоемкостью процесса перевода, системы МП могут оказаться хорошим подспорьем. Для того чтобы это лучше понять, перечислим достоинства программ машинного перевода:

. Высокая скорость. Всего несколько секунд и Вы получаете перевод многостраничного текста. Это позволяет быстро понять смысл текста.

. Низкая стоимость. Если вы обращайтесь к профессиональным переводчикам, приходиться платить за каждую страницу переведенного текста, либо вы нанимаете штатного переводчика, которому приходится платить зарплату. В случае с системой машинного перевода, вы платите деньги только один раз - при покупке программы.

. Доступ к услуге. Программа-переводчик всегда под рукой, а обращаться в переводческое бюро во многих случаях связано с дополнительными затратами времени и сил.

. Конфиденциальность. Системе МП вы можете доверить любую информацию. Программа-переводчик сохранит в тайне любые тексты, которые Вы ей доверите.

. Универсальность. Любой переводчик всегда имеет специализацию, т.е. переводит тексты по той теме, которой он хорошо владеет. Система МП выгодно отличается тем, что она универсальна. Нужно только грамотно подключить специализированный словарь по соответствующей тематике.

. Перевод информации в Интернете. В большинстве случаев переводить информацию в Интернете, если Вы, конечно, сами не знаете нескольких языков, можно только с помощью программ-переводчиков. Только благодаря онлайновым системам МП появилась возможность просматривать иностранные сайты, не затрудняясь с их переводом [Марчук 1996:187].


.2 Переводческий эксперимент


Чтобы лучше понять принципы действия систем МП и их методы использования словарей и анализа грамматики, равно как и синтеза структур на выходном языке, системами машинного перевода была переведена пара текстов. Перевод производился с английского языка на русский (системы переводили небольшой текст объемом в 67 слов). При анализе мы использовали 2 критерия: 1) правильность подбора системой значения слов (уровень лексики), 2) правильность согласования слов в предложении (уровень грамматики).

К лексическим ошибкам мы отнесли, кроме неправильно подобранных системой значений слов при переводе, также и случаи, когда система не может по каким-либо причинам перевести то или иное слово.

К грамматическим ошибкам отнесли случаи неправильного согласования слов в предложении в роде, числе, лице, падеже, нарушения пунктуации и неправильного построения синтаксических конструкций.

Возьмем в качестве примера:

«You are given 12 identical-looking coins, one of which is counterfeit and weighs slightly more or less (you don't know which) than the others. You are given a beam balance which lets you put the same number of coins on each side and observe which side (if either) is heavier. How can you identify the counterfeit and tell whether it is heavy or light, in 3 weighings?»

Вот ее перевод на русский язык, выполненный человеком:

«У вас есть 12 одинаковых по виду монет, одна из которых - фальшивая и весит немного больше или меньше, чем остальные (вы не знаете, какая именно). Имеются рычажные весы, на чаши которых вы можете класть равное число монет и смотреть, какая из чаш перевесила (или весы остались в равновесии). Как за 3 взвешивания определить фальшивую монету и узнать, легче она или тяжелее остальных?»

При переводе переводчику пришлось поменять порядок слов в нескольких предложениях.

Перевод, выполненный онлайн-переводчиком Google:

«Вы получите 12 идентичных перспективных монет, одна из которых является контрафактной и весит чуть более или менее (Вы не знаете, какой), чем другие. Вам предоставляется рычажные весы, которые можно положить такое же количество монет на каждой стороне и наблюдать, какая сторона (если любой) тяжелее. Как можно определить поддельные и рассказать ли тяжелые или легкие, в 3 weighings?»

Обнаружено 6 ошибок: 2 лексические (не нашлось верного перевода английскому «identical-looking», а также «weighings») и 4 грамматические (неверное согласование в роде слов «монета» (ж.р.) и «какой» (ср. р.), неверное согласование в числе слов «предоставляется» (ед. ч.) и «весы «(мн. ч.), неверное согласование в роде слов «сторона» (ж.р.) и «любой» (ср. р.), неверное согласование в числе слов «монета» (ед. ч.) и «поддельные» (мн. ч.)


Заключение


История машинного перевода насчитывает немногим более 50 лет. За это время сменилось несколько поколений систем машинного перевода - от первых программ, использовавших ограниченные ресурсы универсальных компьютеров первого поколения до современных коммерческих продуктов, использующих мощные ресурсы серверов и персональных компьютеров, включая ПК, в которых можно размещать карманные словари.

До уровня полной автоматизации перевода человечество еще не дошло. Причиной этому является, недостаточный уровень развития наук, работающих над созданием подобных систем.

Подтверждением этому являются результаты проведенного нами исследования. Рассмотрев проблемы машинного перевода, мы пришли к следующим выводам:

.На данном этапе развития машинного перевода пока еще остались не разрешенными его основные проблемы.

.Наибольшее число трудностей при переводе и соответственно ошибок при переводе относится к уровню грамматики.

.Средства машинного перевода пока не могут улавливать все смысловые нюансы оригинального текста.

Как видно из всего сказанного выше, практические проблемы, возникающие при применении автоматического оборудования для перевода с одного языка на другой разнообразны и сложны. Однако это ни в какой мере не должно снижать интереса к развитию данной области техники.

Прогресс не стоит на месте, и с увеличением быстродействия процессоров и ростом объема оперативной памяти постепенно повышается и качество машинного перевода.

Конечная цель - создать такую машину, которая давала бы достаточно правильный перевод, не нуждающийся в последующем редактировании. А пока еще машинный перевод нуждается в обязательном редактировании.

Наиболее перспективным направлением развития систем машинного перевода является совершенствование подсистем грамматического анализа и синтеза, а также увеличение объема контекстуального охвата текста и совершенствование семантических цепочек с целью более точного подбора значений слов.

В заключение подчеркнем, что программа-переводчик - это, прежде всего, инструмент, который позволяет решить проблемы перевода или повысить эффективность труда переводчика только в том случае, если он используется грамотно.


Библиографический список


1.Бархударов Л.С. Язык и перевод. М.: Международные отношения, 1975. - 240 с.

2.Кулагин О.В. Исследования по машинному переводу. М.: Наука, 1979. - 376 с.

3.Комиссаров В.Н. Современное переводоведение. Учебное пособие. М.:ЭТС, 2002. - 413 с.

4.Комиссаров В.Н. Теория перевода (лингвистические аспекты) М.: Высшая школа, 1990. - 253 с.

.Кузнецов П.С., Ляпунов А.А., Реформатский А.А. Основные проблемы машинного перевода. Вопросы языкознания, 1956, №5.

.Латышев Л.К. Перевод: проблемы теории, практики и методики преподавания. М.: Просвещение, 1988. - 160 с.

.Миньяр-Белоручев Р.К. Общая теория перевода и устный перевод. М.: Воениздат, 1980. - 237 с.

.Марчук Ю.Н. Проблемы машинного перевода. М.: Наука, 1983. - 232 с.

.Марчук Ю.Н. Методы моделирования перевода. М.: Наука, 1985. - 202 с.

.Марчук Ю.Н. Модель «текст-текст» и переводные соответствия в теории машинного перевода. Проблемы компьютерной лингвистики // Минск, МГЛУ. 1997. - 202 с.

.Марчук Ю.Н. Компьютерная лингвистика: учебное пособие. М.: Восток-Запад, 2007. - 319 с.

12.Мирам Г.Э. Профессия переводчик. М.: Ника-центр, 1999. - 145 с.

13.Найда Юджин А. К науке переводить. Принципы соответствий // Вопросы теории перевода в зарубежной лингвистике: Сб. статей. М.: Международные отношения, 1978.

14. Нелюбин.Л.Л. Толковый переводческий словарь. М.: Флинта, 2009. - 306 с.

. Нелюбин Л.Л. Введение в технику перевода. М.: Флинта, 2009. - 209 с.

16. Нелюбин Л.Л. Компьютерная лингвистика и машинный перевод. М.: ВЦП, 1991. - 198 с.

17. Ревзин И.И., Розенцвейг В.Ю. Основы общего и машинного перевода. М: Высшая школа, 1964. - 255 с.

. Сдобников В.В., Петрова О.В. Теория перевода. М.: АСТ Восток-Запад, 2006. - 425 с.

19. Семко С. И др. проблемы общей теории перевода. М.: Валгус, 1988.

. Слокум Дж. Обзор разработок по машинному переводу. Новое в зарубежной лингвистике. М.: Наука, 1989. - 134 с.

. Федорова А.В. Основы общей теории перевода 4-е издание. М: Высшая школа, 1983. - 416 с.

. Фролов С.В., Панькова Д.А. Проблемы построения машинного перевода 2008. -130 с.

. Шаляпина З.М. Автоматический перевод: Эволюция и современные тенденции // Вопросы языкознания, 1996. №2. - 213 с.

24. Швейцер А.Д. Перевод и лингвистика. М.: Воениздат, 1973. - 580 с.

25. Newmark Peter. About Translation. Multilingual Matters Ltd., Clevedon, 1980.


Курсовая работа Особенности машинного перевода Введение перевод языковой машинный Для того чтобы

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ