https://engames.eu/
Переводческая компетентность и компетенция
Проблемой выявления компонентного состава профессиональной компетентности переводчика занимались как отечественные ученые (И. С. Алексеева, В. Н. Комиссаров, Д. К. Латышев, Р. К. Миньяр-Белоручев, Е. Р. Поршнева), так и зарубежные (Р. Белл, В. Вилсс, Д. Каирали, А. Ним, X. Риску, Г. Хансен). Всеми исследователями признается многокомпонентность состава переводческой компетентности, хотя их представления о наборе компонентов существенно различаются.
Как отмечают А. С. Мещеряков и А. К. Косникова, в научном мире не существует единого мнения по поводу компонентного состава как переводческой, так и других компетенций, собственно как и четкого разделения понятий «компетенция» и «компетентность». На основе определений, приведенных в педагогических словарях, под компетенцией исследователи понимают заранее заданное требование к подготовке учащегося, совокупность профессиональных полномочий, необходимых для выполнения определенного вида деятельности, а компетентность понимается как субъективное качество личности, отражающее его способность к выполнению той или иной деятельности [1].
Важнейшим компонентом переводческой компетентности остается лингвистическая составляющая, которая подразумевает под собой знания в области грамматической, лексической, стилистической и фонетической стороны языка, а также умение применять их на практике в различных профессиональных коммуникативных ситуациях.
Компенсаторная составляющая переводческой компетентности – это умение использовать все возможные средства общения (вербальные и невербальные) с целью компенсации возможных пробелов в знании иностранного языка, а также в знании ситуации общения или особенностей поступков собеседника.
Важной частью переводческой компетентности является культурная составляющая в единстве социокультурного и социолингвистического подкомпонентов, так как взаимодействие с представителями другой культуры невозможно без знаний об языковых, общественных и культурных особенностях своей собственной страны и страны изучаемого языка, без овладения определенными фоновыми знаниями [1].
Как отмечает И. Г. Игнатьева, Причинами неудачных переводов могут оказаться: отсутствие фоновых знаний, не очень хорошее знание политической жизни (англоязычных) стран, узкий кругозор, незнание общественно-политических реалий, недостаточное знание современной ситуации в мире. Профессионально компетентному переводчику необходимо обладать фоновыми экстралингвистическими знаниями, в первую очередь, относительно реальной действительности (персоналий, принципов функционирования политических партий и институтов общества, движений, общественно-политических течений, последних событий, происшедших в мире, и т. п. [2].
Собственно переводческая составляющая – способность учитывать особенности реципиента, избирать оптимальную стратегию перевода, уметь создавать тексты на языке перевода в соответствии с переводческой концепцией, стилями и жанрами текста.
Информационно-технологическая составляющая переводческой компетентности (медиакомпетентность), включает в себя умение найти информацию и обработать ее, навыки работы с компьютером, в частности с сетью интернет.
В структуре переводческой компетентности особую роль играют личные качества переводчика, его навыки и умения: переводчик обязан соблюдать определенную этику, включающую в себя моральные принципы, нормы профессионального поведения, требования профессиональной пригодности [1].
Понятие медиакомпетентности
Главный редактор журнала
Медиакомпетентность личности это совокупность ее мотивов, знаний, умений, способностей (показатели: мотивационный, контактный, информационный, перцептивный, интерпретационный / оценочный, практико-операционный / деятельностный, креативный), способствующих выбору, использованию, критическому анализу, оценке, созданию и передаче медиатекстов в различных видах, формах и жанрах, анализу сложных процессов функционирования медиа в социуме. [3]
А. В. Федоров приводит следующие трактовки понятий «медиа», «медиатекст», «медиакультура» и «медиатворчество»:
Медиа (media, mass media) – средства (массовой) коммуникации – технические средства создания, записи, копирования, тиражирования, хранения, распространения, восприятия информации и обмена ее между субъектом (автором медиатекста) и объектом (массовой аудиторией).[4]
Медиатекст (media text, media construct) – сообщение, изложенное в любом виде и жанре медиа (газетная статья, телепередача, видеоклип, фильм и проч.) [4]
Медиакультура (media culture) – совокупность материальных и интеллектуальных ценностей в области медиа, а также исторически определенная система их воспроизводства и функционирования в социуме; по отношению к аудитории «медиакультура» может выступать системой уровней развития личности человека, способного воспринимать, анализировать, оценивать медиатекст, заниматься медиатворчеством, усваивать новые знания в области медиа. Близкие понятия: информационная культура, (information culture), видеокультура (video culture), аудиовизуальная культура (audiovisual culture). [4]
Медиатворчество (media creation) – процесс созидательной деятельности в медийной сфере и его предметные результаты; взаимосвязанные процессы проективной деятельности и производства медиатекстов [Н.Ф. Хилько, 2000, цит по: 4]
Как отмечает А. В. Федоров, для личности, обладающей высоким уровнем медиакомпетентности присущи следующие показатели:
1) мотивационный: широкий комплекс жанровых, тематических, эмоциональных и проч. мотивов с медиа и медиатекстами, включающих:
- выбор разнообразного жанрового и тематического спектра медиатекстов при обязательном включении неразвлекательных жанров;
- стремление получить новую информацию;
- стремление к рекреации, развлечению (в умеренных дозах);
- стремление к идентификации, сопереживанию;
- стремление к подтверждению собственной компетентности в различных сферах жизни и медиакультуры;
- стремление к поиску материалов для учебных, научных, исследовательских целей;
- стремление к художественным впечатлениям;
- стремление к философскому / интеллектуальному, этическому, эстетическому спору / диалогу с создателями медиатекста, к критике их позиции;
- стремление научиться создавать медиатексты самому, изучая конкретные примеры творчества профессионалов;
2) контактный: частые контакты с различными видами медиа и медиатекстов;
3) информационный: знание большинства базовых терминов, теорий, основных фактов истории развития медиакультуры, творчества деятелей медиакультуры, ясное понимание процесса массовой коммуникации и медийных воздействий в контексте реального мира;
4) перцептивный: отождествление с автором медиатекста, способность соотнесения с авторской позицией, которая позволяет предугадать ход событий медиатекста на основе эмоционально-смыслового соотнесения элементов сюжета, восприятия авторской мысли [3].
5) интерпретационный / оценочный: умение критически анализировать процесс функционирования медиа в социуме с учетом разнообразных факторов на основе высокоразвитого критического мышления. Понимание, интерпретация, предполагающая критическую оценку авторской концепции в контексте структуры произведения, историческом и культурном контекстах. При этом выражается аргументированное согласие или несогласие с авторской позицией создателей медиатекста,
6) практико-операционный: практические умения самостоятельного выбора, создания (лично или в составе группы людей) / распространения медиатекстов различных видов и жанров, умения активного самообразования в медийной сфере;
7) креативный: ярко выраженный уровень творческого начала в различных видах деятельности (перцептивной, игровой, художественной, исследовательской и др.), связанной с медиа [3].
Таким образом, исходя из определений А. В. Федорова, можно сделать вывод, что человек, обладающий высоким уровнем медийной компетентности,
1) имеет мотивацию для обращения к медиатекстам,
2) часто к ним обращается,
3) понимает суть процесса массовой коммуникации,
4) может воспринимать авторский замысел, основываясь на своих знаниях, предугадывать ход событий медиатекста,
5) умеет критически рассматривать медиатексты, логически обосновывать собственную точку зрения,
6) способен самостоятельно выбрать тот или иной медиатекст, исходя из своих целей,
7) способен творчески подходить к чужому медиатексту и заниматься собственным медиатворчеством.
Медийная концепция М. Маклюэна
В силу более высокой степени развития медиа, проблемы медиаобразования и медиакомпетенции изначально более подробно рассматривались зарубежными (западными) исследователями.
Анализируя работы теоретика массовых коммуникаций М. Маклюэна (M. McLuhan), учредившего в 1953 г. журнал «Эксплорейшнз» (Explorations), разъяснявшего роль печати и медиаграмотности в формировании общественного сознания, В. Л. Колесниченко отмечает, что исследователь был убеждён в том, что одной из задач образования должно быть не только формирование основных навыков восприятия информации, но также и развитие суждения и установления различий между истинной и мнимой информацией. Маклюэн говорил и о том, что средства массовой коммуникации располагают неограниченными возможностями манипулирования сознанием аудитории. Исследователь полагал, что с помощью медиа под контролем можно держать «эмоциональный климат» целых культур [5].
Маклюэн считал просвещение и знакомство с основами медиаграмотности идеальными средствами гражданской защиты от побочных последствий медиа. Он отмечал способность телевидения пропагандировать определённые типы социальных отношений, моделировать соответствующие поведение и оказывать большое психологическое давление. По мнению исследователя, изучение медиа может сформировать у аудитории умения осмысливать большой объём получаемой информации [6].
В период интенсивного развития телевидения (1962) учёный разработал теорию «глобальной информационной деревни», отмечая, что глобализация коммуникаций, связывая людей во всём мире, приведёт к созданию единого коммуникационного пространства и превратит нашу планету в одну «глобальную деревню». По образному выражению Маклюэна, «глобальная информационная деревня» объединит всех жителей планеты «неотрайбалистским» погружением в мифы телевизионной сверхреальности [7].
Образованный человек должен критически подходить к воспринимаемой в медиа среде информации, поскольку медиатексты могут содержать ложные данные, вводить в заблуждение, как намеренно, с ведома их автора (пропаганда), так и случайно, по ошибке. Также важно видеть различие между фактами и мнениями («солнце светит» - факт, «хорошая погода» - мнение). Вопрос доверия к источнику информации особенно актуален, когда речь идет о сети Интернет.
Источники:
1. Мещеряков А. С. Косникова А. К, О выявлении компонентного состава переводческой компетентности // Среднее профессиональное образование. - №12. – 2011. – с.5-8.
2. Игнатьева И. Г.Фоновые знания как составляющая компетенции переводчика медиа текстов www.mgimo.ru
3. Федоров А. В. Медиакомпетентность современной молодежи: проблемы и тенденции URL: http://sorokinfond.ru/index.php?id=642
4. Федоров А. В. Словарь терминов по медиаобразованию, медиапедагогике, медиаграмотности, медиакомпетентности URL: http://narod.ru/text23/0013.htm
5. Колесниченко В. Л. Медийная концепция М. Маклюэна – методологическая основа канадского медиаобразования // Медиаобразование и медиакомпетентность: слово экспертам / Под ред. А.В.Федорова. Таганрог: Изд-во Таганрог. гос. педаг. ин-та, 2009 - С. 43, 45.
6. Там же, С. 46.
7. Там же, С. 44.
браузер (browser) - компьютерная программа, позволяющая просматривать веб-страницы и обеспечивающая доступ к ряду других ресурсов (ftp-серверы, чаты и др.)
всемирная паутина, веб (World Wide Web, WWW) - наиболее популярная часть Интернета, позволяющая использовать возможности гипертекста и встраивать в текстовые документы графику, аудио- и видеоматериалы. Состоит из веб-страниц, связанных между собой системой гиперссылок
гипертекст (hypertext) - текст, включающий в себя перекрестные ссылки (гиперссылки), активировав которые щелчком мышки можно быстро перейти к другому фрагменту того же документа, открыть новый документ или переместиться на другой сайт
домен, доменное имя (domain, domain name) - имя, идентифицирующее отдельный Интернет-сайт и играющее роль его адреса. Вводится в окно поиска браузера для установления связи и получения информации с данного сайта. Пример: study-english.info: адреса всех страниц, входящих в состав данного сайта, начинаются с его доменного имени
доменная область - последняя часть доменного имени (.com, .gov, .edu, .ru, .info, .su, .net, .org, .de), обозначающая его организационную или национальную принадлежность (.com - коммерческое предприятие, .gov - государственная организация, .edu - учебное заведение и т.д.)
индексация (indexing) - формирование алфавитного перечня (индекса) всех слов (понимаемых как последовательность символов между пробелами), содержащихся в некоей совокупности текстовых файлов (корпусе текстов, веб-сайте и т. п.). Для каждого элемента индекса указываются точные координаты его местонахождения в исходном тексте (файл-строка-позиция)
интерфейс (interface) - система, обеспечивающая взаимодействие человека и компьютера. Различают графический интерфейс (мышка, меню, пиктограммы), используемый в Windows, и интерфейс "командной строки" (для выполнения любой операции необходимо вводить команды с клавиатуры)
ключевое слово (key word) - слово, используемое при обращении к базе данных или поисковой системе, чтобы извлечь из нее записи или документы, содержащие данное слово
конкорданс (concordance) - перечень всех контекстов, в которых какое-либо слово или словосочетание встречается в исследуемом тексте. Обычно формируется в виде вертикального столбца, выровненного по искомому слову/словосочетанию, справа и слева от которого приводится контекст
конкордансер (concordancer) - программа для формирования конкорданса
корпус текстов (text corpus) - репрезентативная совокупность текстов определенного типа (или типов), хранящихся в электронном виде и предназначенных для извлечения лингвистической информации при помощи компьютера
корпусная лингвистика (corpus linguistics) - лингвистические исследования, основанные на использование корпусов текстов (применяется в лексикографии, машинном переводе, анализе литературных текстов, определении авторства, анализе частотности, преподавании иностранных языков и многих других областях)
кэширование (cashing) - автоматическое сохранение просмотренных интернет-страниц на сервере провайдера, поисковой системы или на жестком диске компьютера пользователя на случай повторного обращения
логический оператор (Boolean operator) - AND, OR, NOT, NEAR и другие - определяют соотношения между ключевыми словами при формировании запроса
локализация (localization) - перевод программного продукта или вэб-сайта на иностранный язык с одновременной его адаптацией к особенностям культуры той страны, для которой он предназначен
маска (wildcard) - символ (обычно * или %), заменяющий собой фрагмент ключевого слова и означающий, что на его месте может стоять любой другой символ (или любое количество других символов) и что любое слово, удовлетворяющее этому требованию, следует рассматривать как ключевое
метапоиск (metasearch) - поиск с одновременным обращением к нескольким базам данным или поисковым системам
модерируемый (moderated) список, форум или телеконференция - имеющий модератора, то есть человека, просматривающего все сообщения перед их публикацией
нечеткий поиск (fuzzy search) - поиск, при котором слово, отличающееся от ключевого одним или несколькими символами, рассматривается как соответствующее ему. Удобен при поиске похожих слов или при поиске слова, орфография которого точно не известна.
онлайн (on-line) - через сеть, с подключением к сети
оффлайн (off-line) - без подключения к сети
оффлайновый браузер (off-line browser) - программа, позволяющая создать на жестком диске компьютера точную копию какого-либо сайта для его последующего просмотра в режиме оффлайн, либо скачать с данного сайта файлы определенного типа, исходя из заданных пользователем параметров. Работает автоматически и позволяет за ночь загрузить на жесткий диск несколько сотен мегабайтов данных
подсветка (highlighting) - выделение результатов поиска с помощью цветного фона
портал (portal) - крупный информационный сайт. Универсальный портал (Yahoo, Rambler) обычно рассчитан на регулярное посещение пользователями, предлагает множество самой разнообразной информации и услуг, включая систему поиска и классификатор ресурсов, бесплатный почтовый ящик и т.д., и играет роль отправной точки, своего рода "входа" в Сеть. Специализированный портал выполняет ту же функцию в рамках более узкой области (финансы, право, музыка, автомобили, спорт и т.д.)
программа докачки, менеджер закачек (download manager) - программа, позволяющая возобновлять загрузку файла после обрыва связи без потери ранее скаченной информации. Запоминает адрес, с которого необходимо скачать файл, и может проделать это автоматически в указанное вами время. Незаменима для загрузки больших файлов или большого числа мелких файлов
профиль пользователя (user profile) - индивидуальные характеристики пользователя, зафиксированные в системе
https://study-english.info/
|
| ||
|
|
|
| ||
|
|
|
| ||
|
|
|
|
T
tail off - уменьшаться; исчезать вдали; убывать; замирать; ухудшаться; ослабевать
take after - походить на (кого-л.)
take apart - разбирать(на части)
take away - убирать; уносить
- возвращать(на прежнее место); принимать обратно (товар); отрекаться, отказываться (от сказанного, написанного, предложенного); признавать свою неправоту
take down - сносить, разрушать; разбирать(машину или какое-л. устройство на составные части); снимать со стены (что-л.)
take in - включать, содержать; понять; разобраться
take off - снимать, сбрасывать; взлететь (авиа); отдохнуть; стать популярным за короткий период времени
take on - брать, (работу); браться (за дело); принимать на службу; давать работу (кому-л.); бросать вызов
take out - брать с собой; вынимать; получать(права и т. п.)
take over - принимать(должность, обязанности) от другого; захватить власть;
take up - отнимать, (время и т. п.); занимать (место); браться, (за что-л.); заниматься (чем-л.); укорачивать, убирать
talk back - возражать, дерзить; спорить
talk down to - говорить снисходительно с (кем-л.); показывать своё превосходство над (кем-л.)
talk into - переубеждать кого-л. сделать что-л.
talk out of - отговорить от (чего-л.), разубедить
talk over - обсудить (подробно); дискутировать
talk round - уговорить (кого-л.) изменить точку зрения
talk up - хвалить, расхваливать, выступать в поддержку (чего-л.)
tear apart - рвать, разрывать, разбивать
tear down - сносить(постройку)
tear up - порвать, разорвать (контракт, соглашение)
tell apart - отличать, различать
tell off - ругать; отчитывать, бранить, разносить
think back - помнить, вспомнить
think of - думать, полагать, считать; иметь (какое-л.) мнение
think over - oбдумывать, размышлять, продумывать, взвешивать, оценивать
think up - придумывать, выдумывать
throw away - выбрасывать
throw off - отделываться, избавляться
throw out - выбрасывать, (что-л.); отказываться (от чего-л.); выгонять(кого-л.)
throw up - страдать рвотой, блевать
tidy up - убирать, делать уборку
tie up - завязывать, связывать; загружать работой (кого-л.); быть задействованным (в чем-л.)
tip off - намекать, предупреждать, предостерегать (кого-л.);предоставлять частную или конфиденциальную информацию (о возможном победителе, о выгодной сделке и т. п.)
top up - докладывать; досыпать (доверху); доливать; дозаправлять
touch on - затрагивать, касаться (вопроса)
toy with - подумывать; думать о чем-л. но несерьезно
track down - выслеживать
try on - примерять(одежду)
try out - опробовать
turn around - улучшаться, меняться к лучшему
turn away - прогонять; не пускать
turn back - возвращаться, поворачиваться назад; возвращать, заставлять повернуть назад
turn down - убавить, уменьшить (свет, газ и т. п.); отвергать, (предложение); отказывать (кому-л.)
turn in - лечь спать; выдавать(полиции)
turn into - превращаться; обменивать на что-либо
turn off - выключать, (радио, газ); гасить (свет); закрывать (кран, воду); заглушать (мотор)
turn on - включать, (газ, радио, рубильник); зажигать, включать (свет); открывать (кран); пускать (воду)
turn out - гасить(свет); заканчиваться(чем-л.); оказываться
turn over - переворачивать; перелистывать; переворачиваться
turn up - прибавлять, (газ, свет), усиливать (звук); неожиданно появляться, обнаруживаться
U
urge on - приободрять
use up - израсходовать, использовать; истратить; истощать
usher in - возвещать (наступление, приход чего-л.)
V
veg out - расслабиться, не принимать близко к сердцу
verge on - граничить с, быть соизмеримым с
vie for - соперничать за (что-л.)
vote in - избрать голосованием (куда-л.)
vote off - не набрать достаточное количество голосов
vouch for - ручаться
accountant | бухгалтер |
actor /actress | актер / актриса |
architect | архитектор |
astronomer | астроном |
author | автор (писатель) |
baker | пекарь |
bricklayer | каменщик |
bus driver | водитель автобуса |
butcher | мясник |
carpenter | плотник |
chef / cook | шеф-повар / повар |
cleaner | уборщик |
dentist | дантист |
designer | дизайнер |
doctor | врач |
dustman / refuse collector | мусорщик |
electrician | электрик |
engineer | инженер |
factory worker | заводской рабочий |
farmer | фермер |
fireman / fire fighter | пожарный |
fisherman | рыбак |
florist | флорист |
gardener | садовник |
hairdresser | парикмахер |
journalist | журналист |
judge | судья |
lawyer | адвокат |
lecturer | преподаватель |
librarian | библиотекарь |
lifeguard | спасатель (на водах) |
mechanic | механик |
model | модель |
newsreader | диктор |
nurse | медсестра |
optician | оптик, офтальмолог |
painter | художник / маляр |
pharmacist | фармацевт |
photographer | фотограф |
pilot | пилот |
plumber | водопроводчик |
politician | политик |
policeman / policewoman | полицейский (м. р. / ж. р.) |
postman | почтальон |
real estate agent | агент по недвижимости |
receptionist | регистратор / портье / секретарь |
scientist | ученый |
secretary | секретарь |
shop assistant | продавец |
soldier | солдат |
tailor | портной |
taxi driver | таксист |
teacher | учитель |
translator | переводчик |
traffic warden | инспектор дорожного движения |
travel agent | турагент |
veterinary doctor (vet) | ветеринарный врач (ветеринар) |
waiter / waitress | официант / официантка |
window cleaner | мойщик окон |
actress | актриса |
add | надбавка |
additional payment | доплата |
administrator; manager | администратор |
advance | аванс |
agent | агент |
agronomist | агроном |
analyst | аналитик |
announcer | диктор |
anthropologist | антрополог |
application | заявление |
appointment | назначение |
archaeologist | археолог |
artist | художник |
autobiography | автобиография |
baker | пекарь |
banker | банкир |
bankrupt | банкрот |
bookbinder | переплетчик |
book-keeper | бухгалтер |
boycott | бойкот |
bribe | взятка |
bribery | взяточничество |
bricklayer | каменщик |
brigade-leader | бригадир |
brigade; team | бригада |
builder | строитель |
careerist | карьерист |
carpenter | плотник |
cash | наличность |
cashier | кассир |
charity | благотворительность |
chemist | аптекарь |
clerk | конторщик |
decree | декрет |
demotion | понижение по службе |
depositor; investor | вкладчик |
discharge pay | выходное пособие |
discharge; retiring | увольнение |
dismiss; discharge | увольнять |
(to) earn | зарабатывать |
earnings | заработок |
editor | редактор |
employer | работодатель |
employer tenant | наниматель |
enclosure; investment | вложение |
exchange | биржа |
ferryman | паромщик |
form | бланк |
gas-man; gasfilter | газовщик |
geologist | геолог |
guard (watchman) | сторож; (ночн. сторож) |
gynaecologist | гинеколог |
head physician | главный врач |
(to) hire | нанимать |
hired | наемный |
invent | изобретатель |
janitor | дворник |
journalist | журналист |
lawyer | адвокат, юрист |
leave; vacation; sale; supply; allotment | отпуск |
librarian | библиотекарь |
loader | грузчик |
maternity leave | декретный отпуск |
midwife | акушерка |
milkmaid | доярка |
permanent | бессрочный |
pilot | пилот |
porter | носильщик |
postman | почтальон |
potter | гончар |
rent | аренда |
(to) rent | арендовать |
reprimand | выговор |
rеsume | резюме |
revolt; riot | бунт |
salary | жалование |
singer | певец |
shareholder | акционер |
shepherd | пастух |
shoemaker | сапожник |
short-term | краткосрочный |
stock exchange | фондовая биржа |
strike | забастовка |
(to) strike; be on strike | бастовать |
tenant; renter | арендатор |
trainer | дрессировщик |
translator; interpreter | переводчик |
vacancy | вакансия |
vacant | вакантный |
vice-; deputy | заместитель |
wage | заработная плата |
waiter | официант |
(to) work off | отрабатывать |
unemployment | безработица |
unemployed | безработный |
1. Прочитайте текст, предложите свой перевод. Составьте аннотацию, подготовьте устное сообщение.
In the early hours of May 16, 1990, after a week spent watching old video footage of man on the Moon, a thought was turning into an obsession in the mind of Ralph Rene.
"How can the flag be fluttering?" the 47 year old American kept asking himself when there's no wind on the atmosphere free Moon? That moment was to be the beginning of an incredible Space odyssey for the self- taught engineer from New Jersey.
He started investigating the Apollo Moon landings, scouring every NASA film, photo and report with a growing sense of wonder, until finally reaching an awesome conclusion: America had never put a man on the Moon. The giant leap for mankind was fake.
It is of course the conspiracy theory to end all conspiracy theories. But Rene has now put all his findings into a startling book entitled NASA Mooned America. Published by himself, it's being sold by mail order - and is a compelling read.
The story lifts off in 1961 with Russia firing Yuri Gagarin into space, leaving a panicked America trailing in the space race. At an emergency meeting of Congress, President Kennedy proposed the ultimate face saver, put a man on the Moon. With an impassioned speech he secured the plan an unbelievable 40 billion dollars.
And so, says Rene (and a growing number of astro-physicists are beginning to agree with him), the great Moon hoax was born. Between 1969 and 1972, seven Apollo ships headed to the Moon. Six claim to have made it, with the ill fated Apollo 13 - whose oxygen tanks apparently exploded halfway being the only casualties. But with the exception of the known rocks, which could have been easily mocked up in a lab, the photographs and film footage are the only proof that the Eagle ever landed. And Rene believes they're fake.
For a start, he says, the TV footage was hopeless. The world tuned in to watch what looked like two blurred white ghosts throw rocks and dust. Part of the reason for the low quality was that, strangely, NASA provided no direct link up. So networks actually had to film man's greatest achievement from a TV screen in Houston - a deliberate ploy, says Rene, so that nobody could properly examine it.
By contrast, the still photos were stunning. Yet that's just the problem. The astronauts took thousands of pictures, each one perfectly exposed and sharply focused. Not one was badly composed or even blurred.
As Rene points out, that's not all: The cameras had no white meters or view ponders. So the astronauts achieved this feet without being able to see what they were doing. There film stock was unaffected by the intense peaks and powerful cosmic radiation on the Moon, conditions that should have made it useless. They managed to adjust their cameras, change film and swap filters in pressurized suits. It should have been almost impossible with the gloves on their fingers.
Award winning British photographer David Persey is convinced the pictures are fake. His astonishing findings are explained alongside the pictures on these pages, but the basic points are as follows: The shadows could only have been created with multiple light sources and,in particular, powerful spotlights. But the only light source on the Moon was the sun.
The American flag and the words "United States" are always Brightly lit, even when everything around is in shadow. Not one still picture matches the film footage, yet NASA claims both were shot at the same time.
The pictures are so perfect, each one would have taken a slick advertising agency hours to put them together. But the astronauts managed it repeatedly. David Persey believes the mistakes were deliberate, left there by "whistle blowers" who were keen for the truth to one day get out.
If Persey is right and the pictures are fake, then we've only NASA's word that man ever went to the Moon. And, asks Rene, "Why would anyone fake pictures of an event that actually happened?"
The questions don't stop there. Outer space is awash with deadly radiation that emanates from solar flares firing out from the sun. Standard astronauts orbiting earth in near space, like those who recently fixed the Hubble telescope, are protected by the earth's Van Allen belt. But the Moon is to 240,000 miles distant, way outside this safe band. And, during the Apollo flights, astronomical data shows there were no less than 1,485 such flares.
John Mauldin, a physicist who works for NASA, once said shielding at least two meters thick would be needed. Yet the walls of the Lunar Landers which took astronauts from the spaceship to the moons surface were, said NASA, about the thickness of heavy duty aluminum foil.
How could that stop this deadly radiation? And if the astronauts were protected by their space suits, why didn't rescue workers use such protective gear at the Chernobyl meltdown, which released only a fraction of the dose astronauts would encounter? Not one Apollo astronaut ever contracted cancer - not even the Apollo 16 crew who were on their way to the Moon when a big flare started. "They should have been fried", says Rene.
Furthermore, every Apollo mission before number 11 (the first to the Moon) was plagued with around 20,000 defects a-piece. Yet, with the exception of Apollo 13, NASA claims there wasn't one major technical problem on any of their Moon missions. Just one effect could have blown the whole thing. "The odds against these are so unlikely that God must have been the co-pilot," says Rene.
Several years after NASA claimed its first Moon landing, Buzz Aldrin "the second man on the Moon" was asked at a banquet what it felt like to step on to the lunar surface. Aldrin staggered to his feet and left the room crying uncontrollably. It would not be the last time he did this. "It strikes me he's suffering from trying to live out a very big lie," says Rene. Aldrin may also fear for his life.
Virgil Grissom, a NASA astronaut who baited the Apollo program, was due to pilot Apollo 1 as part of the landings build up. In January 1967, he hung a lemon on his Apollo capsule (in the US, unroadworthy cars are called lemons) and told his wife Betty: "If there is ever a serious accident in the space program, it's likely to be me."
Nobody knows what fuelled his fears, but by the end of the month he and his two co-pilots were dead, burnt to death during a test run when their capsule, pumped full of high pressure pure oxygen, exploded.
Scientists couldn't believe NASA's carelessness - even a chemistry students in high school know high pressure oxygen is extremely explosive. In fact, before the first manned Apollo fight even cleared the launch pad, a total of 11 would be astronauts were dead. Apart from the three who were incinerated, seven died in plane crashes and one in a car smash. Now this is a spectacular accident rate.
"One wonders if these 'accidents' weren't NASA's way of correcting mistakes," says Rene. "Of saying that some of these men didn't have the sort of 'right stuff' they were looking."
NASA wont respond to any of these claims, their press office will only say that the Moon landings happened and the pictures are real. But a NASA public affairs officer called Julian Scheer once delighted 200 guests at a private party with footage of astronauts apparently on a landscape. It had been made on a mission film set and was identical to what NASA claimed was they real lunar landscape. "The purpose of this film," Scheer told the enthralled group, "is to indicate that you really can fake things on the ground, almost to the point of deception." He then invited his audience to "Come to your own decision about whether or not man actually did walk on the Moon."
A sudden attack of honesty? You bet, says Rene, who claims the only real thing about the Apollo missions were the lift offs. "The astronauts simply have to be on board," he says, "in case the rocket exploded. It was the easiest way to ensure NASA wasn't left with three astronauts who ought to be dead." he claims, adding that they came down a day or so later, out of the
public eye (global surveillance wasn't what it is now) and into the safe hands of NASA officials, who whisked them off to prepare for the big day a week later.
And now NASA is planning another giant step - Project Outreach, a 1 trillion dollar manned mission to Mars. "Think what they'll be able to mock up with today's computer graphics," says Rene Chillingly. "Special effects was in its infancy in the 60s. This time round will have no way of determining the truth."
1. Apollo 14 astronaut Allen Shepard played golf on the Moon. In front of a worldwide TV audience, Mission Control teased him about slicing the ball to the right. Yet a slice is caused by uneven air flow over the ball. The Moon has no atmosphere and no air.
2. A camera panned upwards to catch Apollo 16's Lunar Landerlifting off the Moon. Who did the filming?
3. One NASA picture from Apollo 11 is looking up at Neil Armstrong about to take his giant step for mankind. The photographer must have been lying on the planet surface. If Armstrong was the first man on the Moon, then who took the shot?
4. The pressure inside a space suit was greater than inside a football. The astronauts should have been puffed out like the Michelin Man, but were seen freely bending their joints.
5. The Moon landings took place during the Cold War. Why didn't America make a signal on the moon that could be seen from earth? The PR would have been phenomenal and it could have been easily done with magnesium flares.
6. Text from pictures in the article said that only two men walked on the Moon during the Apollo 12 mission. Yet the astronaut reflected in the visor has no camera. Who took the shot?
7. The flags shadow goes behind the rock so doesn't match the dark line in the foreground, which looks like a line cord. So the shadow to the lower right of the spaceman must be the flag. Where is his shadow? And why is the flag fluttering if there is no air or wind on the moon?
8. How can the flag be brightly lit when its side is to the light? And where, in all of these shots, are the stars?
9. The Lander weighed 17 tons yet the astronauts feet seem to have made a bigger dent in the dust. The powerful booster rocket at the base of the Lunar Lander was fired to slow descent to the moons service. Yet it has left no traces of blasting on the dust underneath. It should have created a small crater, yet the booster looks like it's never been fired.
Представители старшего поколения наверняка помнят, сколько времени нам приходилось возиться с домашними заданиями по иностранному языку в общеобразовательной школе. Конечно, были среди нас отличники, которым языки, да и прочие предметы, давались легко. Вот к ним-то и подходили на переменке с просьбой перевести заданный на дом текст на иностранном языке, потому что большинству было лень, да и качество перевода в случае, если вы не занимались языком дополнительно, тоже изрядно хромало.
То ли дело сейчас! Загрузил текст в Google переводчик, выбрал язык, и дальше остается лишь слегка отредактировать результат, чтобы не «спалиться» с изрядно топорным компьютерным переводом. Конечно, лучше бы знать языки самому, в чем вам поможет наша программа «Эффективное изучение иностранного языка». Но во многих случаях компьютерные словари и системы машинного перевода текстов могут очень сильно выручить, даже если вы владеете языком в совершенстве. Давайте посмотрим, что это такое и как это работает.
Машинным переводом называют перевод текстов при помощи компьютерной программы, онлайновой или же инсталлированной на компьютере. Сегодня с помощью специальных программ можно перевести текст на самые разные языки: для машинного перевода практически не существует языковых барьеров.
Так, вышеупомянутый и наиболее популярный для быстрых подручных операций Google переводчик предлагает перевод более чем с сотни различных языков, от английского до малоизвестного нам хмонга.
Для справки: хмонг – это группа диалектов, на которых говорит народность мяо в Китае, Таиланде, Лаосе и северном Вьетнаме. Эта справка нужна для того, чтобы показать, сколь дальние «лингвистические дали» захватил процесс машинного перевода.
Идея задействовать компьютер для перевода родилась практически одновременно с появлением первых электронно-вычислительных машин в 40-е годы 20 века. К 1954 году корпорации IBM совместно с Джорджтаунским университетом удалось «научить» компьютер переводить простейшие тексты.
В «распоряжении» самого первого машинного переводчика было 250 слов и всего 6 правил (мечта каждого школьника!) из всего богатства грамматики английского языка. Эта первая публичная презентация возможностей перевода при помощи компьютера вошла в историю как «Джорджтаунский эксперимент».
Всего в ходе эксперимента с русского на английский перевели более 60 предложений, преимущественно на тему органической химии. Подробности эксперимента можно узнать из пресс-релиза корпорации IBM, вышедшего на следующий день после эксперимента [IBM, 1954].
Уже в 1960-х годах в Штатах функционировали 2 системы перевода с русского на английский. Это MARK, которая использовалась в ВВС США, и GAT, собственная разработка того самого Джорджтаунского университета, где состоялся исторический эксперимент. GAT, помимо США, применяли и в Европе. В частности, в Европейском сообществе по атомной энергии в Италии.
Качество первых машинных переводов было не слишком высоким, что регулярно порождало сомнения в перспективности разработок, и приводило к снижению объемов финансирования на исследования.
Тем не менее, невзирая на все сомнения и преграды, машинный компьютерный перевод прошел путь от трудностей понимания элементарных печатных фраз до технологий аудиоперевода, когда можно просто нажать на значок микрофона и сказать «в смартфон», что именно нужно перевести. К слову, большинство людей инстинктивно стараются говорить в микрофон, изображенный на экране, а не в микрофонный выход смартфона.
Больше о развитии систем машинного перевода можно узнать из статьи «Русский не родной: как США узнавали научные и военные тайны Советского Союза» [А. Космарский, 2016].
У нас в стране большая часть работ в области компьютерного перевода сконцентрировались в педагогическом университете имена А. И. Герцена в Санкт-Петербурге. Исследования вела научная группа под руководством профессора Раймунда Пиотровского (1922-2009).
Это был небольшой исторический экскурс, а сейчас обратимся к технической сути вопроса и посмотрим, как это все работает.
В самом общем виде системы машинного перевода (Machine Translation, МТ) развиваются по трем основным направлениям: SMT, RBMT, HMT [Linguis, 2015].
Направления Machine Translation:
Теперь вкратце о каждом из направлений.
Статистический машинный перевод – это, по сути, самообучающаяся система. Это постоянный анализ огромного массива идентичных текстов на разных языках, поиск основных лингвистических закономерностей, перевод программы в машинный код и, как итог, способность к переводу с высоким уровнем точности и учетом языковых нюансов.
Базовым условием для успешного анализа big data (больших объемов данных) и точного перевода в машинный код является наличие соответствующих вычислительных мощностей. Это доступно лишь самым крупным корпорациям, лидерам рынка, давно работающим на данном поприще, потому что для анализа больших объемов данных нужно достаточно много времени.
Основными примерами реализации технологии SMT являются такие сервисы, как Google Translator, Яндекс.Переводчик, Bing Translator от Microsoft.
Технология RBMT предполагает, что все правила для последующего перевода создаются людьми. Эффект, достигаемый в SMT за счет самообучения, в RBMT напрямую зависит от человеческого фактора. Специалисты непрерывно мониторят ситуацию, адаптируют и детализируют правила для максимально более точного машинного перевода текстов.
Уровень точности перевода зависит от того, насколько глубокого лингвисты проработали языковые нюансы для переводчика по технологии RBMT и насколько регулярно поддерживают актуальность базы данных. Процесс требует высокой квалификации и больших затрат человеческих ресурсов, зато в RBMT можно обойтись гораздо меньшими вычислительными мощностями, нежели при работе по технологии SMT.
В качестве примеров реализации технологии RBMT можно привести такие системы, как Linguatec и Multillect.
Гибридный машинный перевод призван соединить в себе все преимущества SMT и RBMT. Разумеется, это не так просто, и мало, кто берется за реализацию столь амбициозной задачи. Наиболее удачным примером может служить программная система машинного перевода Systran, созданная одноименной компанией в США и выкупленная затем корейской компанией CSLi. А также такие разработки Hybrid MT, как TranSphere, Carabao Machine Translation engine, PROMT DeepHybrid.
Теперь, когда мы вникли в основные технические нюансы и понимаем общие принципы работы машинного перевода, самое время изучить подробнее, как мы всем этим можем воспользоваться.
В принципе, если ничего длиннее трех абзацев вам переводить не приходится, с этим вполне справится Google Translator, так что эту статью дальше можно не читать. А вот менеджерам совместных предприятий, международных корпораций, ученым, читающим научные статьи на языке оригинала, профессиональным переводчикам и всем, кому приходится иметь дело с огромными массивами данных на иностранных языках, нужны инструменты посерьезнее.
Уточним, что при всех перспективах машинного перевода без людей не обойтись. Отличаться может лишь степень вмешательства человека в процесс. Различают разные форматы участия человека в Machine Translation:
Иногда в качестве синонима понятия «машинный компьютерный перевод» употребляется словосочетание «машинный автоматический перевод» или просто «автоматический перевод». Это полностью корректно, но, если встречается термин «автоматизированный перевод», тут обычно имеются в виду случаи, когда человек максимально вовлечен в процесс «помощи» компьютерной программе.
Или даже точнее будет сказать, что это программа помогает человеку справиться с переводом, потому что основной массив работы – адаптация текста для перевода, упрощение лингвистических конструкций и прочее – выполняет как раз человек.
Так или иначе, для реализации сценариев машинного перевода в большинстве случаев используются CAT tool программы. Это комплексное решение по автоматизации перевода с набором дополнительных функций. В частности, CAT tool (Computer-assisted translation tool) умеют подставлять готовые фрагменты теста из банка готовых переводов там, где это уместно, что заметно сокращает общее время перевода [Roi4cio, 2019].
На небольших фрагментах текста, которые любой онлайн-сервис переводит за считанные доли секунды, такая экономия не заметна. Однако когда речь заходит о больших массивах теста, CAT tool является настоящим спасением. Кроме того, CAT tool позволяет проверить правописание, правомерность употребления того или иного слова в том или ином контексте, использовать базы данных узкоспециальных терминов, пользоваться индексаторами текстов и управлять памятью переводов.
Какой конкретно софт сегодня можно задействовать для перевода больших объемных текстов? Тут можно посоветовать изучить, пожалуй, наиболее полный обзор доступных на сегодня инструментов машинного перевода «24 полезные программы для переводчиков» [Н. Самойленко, 2017]. Со своей стороны обратим особое внимание на Trados, позволяет сделать машинный перевод документа практически любого формата, в том числе HTML-документов и презентаций PowerPoint.
В обзор «24 полезные программы для переводчиков» включены собственно программы машинного перевода, словари, программы распознавания текста, сервисы подсчета статистики и локализации приложений.
Уточним, что локализация приложения – это перевод, включающий полную адаптацию контента в плане культурных особенностей страны, города, региона с учетом всех особенностей языка.
По поводу подсчета статистики скажем, что это очень важная функция для профессиональных переводчиков и копирайтеров, получающих оплату по количеству знаков без пробелов. В обычном вордовском документе при объемах в сотни страниц использование встроенной функции затруднено, поэтому специальные сервисы совсем не лишние.
Будет интересно изучить и более свежий обзор «Какие инструменты могут ускорить работу переводчиков: обзор сервисов» [А. Лещинский, 2018]. В числе прочего, стоит обратить внимание на представленный в этом обзоре онлайн-сервис SmartCAT с очень простым для освоения интерфейсом и достаточно широким функционалом.
И, наконец, «Лучшее программное обеспечение для машинного перевода, которое вы можете попробовать в 2022 году» [affdu, 2022]. Из достойного внимания можно назвать сервис нейронного машинного перевода Amazon Translate. Независимое рейтинговое агентство Intento признало Amazon Translate по итогам 2020 года лучшим поставщиком машинного перевода в 14 языковых парах, 16 отраслях промышленности и 8 типах контента [Amazon Web Services, 2021].
К слову, на сайте Intento вы можете не только следить за рейтингами, но и опробовать различные программные продукты в сфере машинного перевода [Intento, 2022]. Теперь давайте подытожим, какие наиболее полезные и практичные инструменты можно сегодня использоваться для машинного перевода. Для удобства ориентирования сразу будем давать ссылку на сайт и скриншот интерфейса.
Топ-10 самых полезных инструментов машинного перевода:
Trados – возможность работать с файлами самых разных форматов плюс функция ведения глоссариев. Доступная бесплатная пробная версия Trados.
SmartCAT – помимо собственно функции машинного перевода, доступна база профессиональных переводчиков, если вы не справляетесь даже с помощью сервиса, и база для поиска заказов, если вы переводчик. Онлайн сервис SmartCAT – полностью русскоязычный ресурс.
OmegaT – полностью бесплатный сервис. Не поддерживает наиболее ходовые форматы MS Word и Excel, но текст всегда можно конвертировать в другой формат из числа поддерживаемых. Скачать OmegaT можно на официальном сайте.
Wordfast – есть несколько версий программы, в том числе бесплатная онлайн-версия Wordfast Anywhere. Судя по информации на официальном сайте, продуктами Wordfast пользуются Sony, Coca-Cola, McDonald’s и другие известные корпорации.
MemoQ – работает с мультиязычными файлами, обеспечивает локализацию контента при переводе текстов медико-биологической направленности, тематики игровой индустрии, пригодна для учебных заведений и научных организаций. Доступны разные версии MemoQ.
Amazon Translate – нейронный машинный перевод, локализация приложений, много других достоинств. До 2 миллионов знаков в месяц Amazon Translate позволяет переводить бесплатно.
WordFisher – поддерживает пакет макросов до Word 2003, поэтому является отличным вариантом для тех, у кого старый компьютер. Программа WordFisher доступа на английском языке, однако обратите внимание, что весь исходный текст на сайте написан на венгерском языке. Это большое подспорье для тех, для кого венгерский является родным, потому что венгреский язык весьма специфичен и его носители с трудом осваивают еще какие-либо языки.
XTM Cloud – предназначена для крупного и среднего бизнеса, промышленных предприятий и сферы услуг. Покупателям XTM Cloud обещают доступные цены и соответствие сделки правилам бухгалтерского и налогового учета для предприятий всех форм собственности в Российской Федерации.
SYSTRAN Translate – онлайн-переводчик с 50 языков. Визуально интерфейс похож на Google Translator, и принцип работы точно такой: в левое окошко грузится исходный текст, в правом появляется готовый перевод. Systran Translate использует готовые модели перевода для каждой области контента: финансы, юриспруденция, здравоохранение, IT-технологии, образование, производство. Есть платные и бесплатные версии.
Итак, мы вкратце разобрали основные аспекты машинного перевода текстов. А что же у нас с машинным переводом устной речи? Давайте посмотрим!
В принципе, функция устного машинного перевода знакома всем, у кого есть смартфон и встроенный Google переводчик. Помимо собственно перевода, изначально включается функция распознания текста. Примерно как в голосовом навигаторе в автомобиле. Насколько удобно пользоваться всеми этими техническими средствами и сервисами?
Тут очень много зависит от простоты формулировки, окружающего шумового фона, темпа речи, дикции, наличия акцента. Наиболее наглядно процесс машинного распознания речи презентован в известном клипе группы «Ленинград» на композицию «В Питере пить», когда таксист «общается» с навигатором:
Жесткий акцент выходца из дружественной нам республики мешает голосовому помощнику распознать запрос, а в разразившемся далее потоке негодования наиболее бдительные и хорошо образованные зрители распознали аварский язык.
Заметим, что большинство обзоров, посвященных устному машинному переводу, более сосредоточены на изъянах сервисов, нежели на их достоинствах. Самым настойчивым и заинтересованным можем рекомендовать статью «Машинный перевод становится синхронным», посвященную устному переводчику STACL [sysblok, 2019].
Кроме того, достаточно интересен обор «Translatotron – машинный перевод устной речи на новом уровне» с разбором достоинств и отличий относительно прочих разработок [В. Кобальчинский, 2019]. На этом, пожалуй, можно остановиться, потому что более ранние разработки дают не слишком высокую точность распознания и перевода устной речи, в чем могли убедиться лично все, кто пытается быть «на острие» инновационных технологий.
Какой из всего вышеизложенного вывод? Иностранные языки нужно изучать и знать, независимо от того, что нам предлагают технологии машинного перевода. Во-первых, у вас не всегда может быть «под рукой» доступное интернет-соединение. Во-вторых, за рубежом вас может подвести акцент и ваш текст для перевода останется для онлайн-переводчика тайной, покрытой мраком. В-третьих, пока никто не отменил зачеты и экзамены в школах и вузах, где ни смартфоном не воспользуешься, ни одноклассника-отличника на помощь не призовешь. И тогда вы можете «погореть» даже на самом элементарном задании.
Классика жанра для технических вузов – это просьба перевести несложное во всех смыслах предложение Silver is a good conductor of electricity («Серебро хорошо проводит электричество»). Люди, напрочь игнорирующие лекции по английскому, предлагают свою версию, которая звучит как «Сильва хороший кондуктор в электричке». Как говорится, «занавес», и результат экзамена исключительно в зависимости от чувства юмора преподавателя.
Автор: Ольга Обломова
https://bitly.ws/3djrW
Материал подготовил А. А. Тараскин
Осуществление перевода компьютером – сложная, но интересная научная задача. Основная ее сложность состоит в том, что естественные языки плохо поддаются формализации. Отсюда и невысокое качество получаемого с помощью систем МП текста, содержание и форма которого служит неизменным объектом шуток. Однако идея машинного перевода уходит корнями далеко в прошлое. Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж, разработавший в 1836-1848 гг. проект цифровой аналитической машины. Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить.
А через 100 лет, в 1947 году, У. Уивер (директор отделения естественных наук Рокфеллеровского фонда) написал письмо Норберту Винеру. В этом письме он предлагал использовать технику дешифрования для перевода текстов. Этот год считается годом рождения машинного перевода. В этом же году был разработан алгоритм осуществления пословного перевода, а в 1948 году Р. Риченс предложил правило разбиения слова на основу и окончание. В последующие два десятилетия системы машинного перевода бурно развивались. В январе 1954 года на машине IBM – 701 была продемонстрирована первая система машинного перевода IBM Mark II. Но в 1967 году специально созданная Комиссия Национальной Академии Наук США признала машинный перевод нерентабельным, что существенно затормозило исследования в этой области. Новый подъем машинный перевод переживает в 70-е годы, а в 80-е становится экономически выгодным за счет сравнительной дешевизны машинного времени.
Однако в СССР исследования в области машинного перевода продолжались. После демонстрации системы IBM Mark II группа ученых ВИНИТИ начала разработку системы машинного перевода для машины БЭСМ. Первый образец перевода с английского на русский язык был получен к концу 1955 года.
Другое направление работ возникло в Отделении прикладной математики Математического института АН СССР (ныне ИПМ им. М. В. Келдыша РАН) по инициативе А. А. Ляпунова. Первые программы машинного перевода, разработанные этим коллективом, были реализованы на машине "Стрела". Благодаря работе над созданием систем МП оформилось такое направление, как прикладная лингвистика.
В 70-е годы над созданием систем МП трудилась группа разработчиков ВИНИТИ РАН под руководством проф. Г.Г. Белоногова. Первая их система МП была разработана в 1993 году, а в 1996 году после ряда доработок была зарегистрирована в РОСАПО под названием Retrans. Эта система использовалась министерствами обороны, путей сообщения, науки и технологии.
Параллельные исследования велись в лаборатории Инженерной Лингвистики ЛГПИ им. А. И. Герцена (ныне Педагогический Университет). Именно они и легли в основу наиболее популярной сейчас системы МП “PROMT”. Последние версии этого программного продукта используют наукоемкие технологии и построены на основе технологии расширенных сетей переходов и формализма нейронных сетей.
Новые члены форума по иностранным языкам компании CompuServe зачастую задают вопрос о том, не мог ли бы кто-нибудь посоветовать им хорошую программу машинного перевода за умеренную цену.
Ответом на этот вопрос неизменно является "нет". В зависимости от отвечающего, ответ может содержать два основных аргумента: либо о том, что машинам перевод не под силу, либо, что машинный перевод стоит слишком дорого.
Оба эти аргумента в определенной степени справедливы. Однако ответ далеко не так прост. Изучая проблему машинного перевода (МП), следует рассмотреть отдельно различные подразделы этой проблемы. Следующее разделение основано на лекциях Лари Чайлдса, проведенных в рамках Международной Конференции по Техническим Коммуникациям 1990 года:
- полностью автоматический перевод;
- автоматизированный машинный перевод при участии человека;
- перевод, осуществляемый человеком с использованием компьютера.
Этот вид машинного перевода и подразумевается большинством людей, когда они говорят о машинном переводе. Смысл здесь прост: в компьютер вводится текст на одном языке, этот текст обрабатывается и компьютер выводит этот же текст на другом языке. К сожалению, реализация такого вида автоматического перевода сталкивается с определенными препятствиями, которые еще предстоит преодолеть.
Основной проблемой является сложность языка как такового. Возьмем, к примеру, значения слова "can". Помимо основного значения модального вспомогательного глагола, у слова "can" имеется несколько официальных и жаргонных значений в качестве существительного: "банка", "отхожее место", "тюрьма". Кроме этого, существует архаичное значение этого слова - "знать или понимать". Если предположить, что у выходного языка для каждого из этих значений имеется отдельное слово, каким образом может компьютер их различить?
Как оказалось, определенные успехи были достигнуты в сфере разработки программ перевода, различающих смысл основываясь на контексте. Более поздние исследования при анализе текстов опираются больше на теории вероятности. Тем не менее, полностью автоматизированный машинный перевод текстов с обширной тематикой все еще является невыполнимой задачей.
Этот вид машинного перевода теперь вполне осуществим. Говоря о машинном переводе при участии человека, обычно подразумевают редактирование текстов как до, так и после их обработки компьютером. Люди-переводчики изменяют тексты так, чтобы они были понятны машинам. После того, как компьютер сделал перевод, люди опять-таки редактируют грубый машинный перевод, делая текст на выходном языке правильным. Помимо такого порядка работы, существуют системы МП, во время перевода требующие постоянного присутствия человека-переводчика, помогающего компьютеру делать перевод особенно сложных или неоднозначных конструкций.
Машинный перевод с помощью человека применим в большей степени к текстам с ограниченным вокабуляром узко-ограниченной тематики.
Экономичность использования машинного перевода с помощью человека - вопрос все еще спорный. Сами программы обычно достаточно дорогостоящи, а для работы некоторых из них требуется специальное оборудование. Предварительному и последующему редактированию необходимо обучаться, да и работа эта не из приятных. Создание и поддержание в рабочем состоянии баз данных слов - процесс трудоемкий и зачастую требует специальных навыков. Однако для организации, переводящей большие объемы текстов в четко-определенной тематической сфере, машинный перевод с помощью человека может оказаться достаточно экономичной альтернативой традиционному человеческому переводу.
При этом подходе человек-переводчик ставится в центр процесса перевода, в то время как программа компьютера расценивается в качестве инструмента, делающего процесс перевода более эффективным, а перевод - точным. Это обычные электронные словари, которые обеспечивают перевод требуемого слова, возлагая на человека ответственность за выбор нужного варианта и смысл переведенного текста. Такие словари значительно облегчают процесс перевода, но требуют от пользователя определенного знания языка и затрат времени на его осуществление. И все же сам процесс перевода значительно ускоряется и облегчается.
Среди систем, помогающих переводчику в работе, важнейшее место занимают так называемые системы Translation Memory (TM). Системы ТМ представляют собой интерактивный инструмент для накопления в базе данных пар эквивалентных сегментов текста на языке оригинала и перевода с возможностью их последующего поиска и редактирования. Эти программные продукты не имеют целью применение высокоинтеллектуальных информационных технологий, а наоборот, основаны на использовании творческого потенциала переводчика. Переводчик в процессе работы сам формирует базу данных (или же получает ее от других переводчиков или от заказчика), и чем больше единиц она содержит, тем больше отдача от ее использования.
Вот список наиболее известных систем ТМ:
- Transit швейцарской фирмы Star,
- Trados (США),
- Translation Manager от IBM,
- Eurolang Optimizer французской фирмы LANT,
- DejaVu от ATRIL (США),
- WordFisher (Венгрия).
Системы ТМ позволяют исключить повторный перевод идентичных фрагментов текста. Перевод сегмента осуществляется переводчиком только один раз, а затем каждый следующий сегмент проверяется на совпадение (полное или нечеткое) с базой данных, и, если найден идентичный или похожий сегмент, то он предлагается в качестве варианта перевода.
В настоящее время ведутся разработки по усовершенствованию систем ТМ. Например, ядро системы Transit фирмы Star реализовано на основе технологии нейронных сетей.
Несмотря на широкий ассортимент систем TM, они имеют несколько общих функций:
- Функция сопоставления (Alignment). Одно из преимуществ систем ТМ – это возможность использования уже переведенных материалов по данной тематике. База данных ТМ может быть получена путем посегментного сопоставления файлов оригинала и перевода.
- Наличие фильтров импорта – экспорта. Это свойство обеспечивает совместимость систем ТМ с множеством текстовых процессоров и издательских систем и дает переводчику относительную независимость от заказчика.
- Механизм поиска нечетких или полных совпадений. Именно этот механизм и представляет собой основное достоинство систем ТМ. Если при переводе текста система встречает сегмент, идентичный или близкий к переведенному ранее, то уже переведенный сегмент предлагается переводчику как вариант перевода текущего сегмента, который может быть подкорректирован. Степень нечеткого совпадения задается пользователем.
- Поддержка тематических словарей. Эта функция помогает переводчику придерживаться глоссария. Как правило, если в переводимом сегменте встречается слово или словосочетание из тематического словаря, то оно выделяется цветом и предлагается его перевод, который можно вставить в переводимый текст автоматически.
- Средства поиска фрагментов текста. Этот инструмент очень удобен при редактировании перевода. Если в процессе работы был найден более удачный вариант перевода какого-либо фрагмента текста, то этот фрагмент может быть найден во всех сегментах ТМ, после чего в сегменты ТМ последовательно вносятся необходимые изменения.
Конечно, как и любой программный продукт, системы ТМ имеют свои достоинства и недостатки, и свою область применения. Однако в отношении систем TM, основным недостатком является их дороговизна.
Особенно удобно использовать системы ТМ при переводе таких документов, как руководства пользователя, инструкции по эксплуатации, конструкторская и деловая документация, каталоги продукции и другой однотипной документации с большим количеством совпадений.
В соответствии с указанной выше классификацией, целью данной работы является исследование и анализ систем МП второй группы, поскольку систем МП первой группы еще не существует в природе, а системы третьей группы в сущности не являются системами МП, а более напоминают электронные словари.
Системы МП осуществляют автоматизированный перевод текста. Единицами перевода при этом служат слова или словосочетания, причем последние разработки позволяют учитывать морфологию переводимого слова. Развитые системы МП осуществляют перевод по заданным разработчиком и/или корректируемым пользователем алгоритмам перевода.
Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков L1 – L2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик. Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.
Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:
1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы.
2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, синтаксических функций словоформ в данном тексте и пр.), производимое в рамках входного языка; разрешение омографии (конверсионной омонимии словоформ – скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); лексический анализ и перевод лексем. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.
3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, несмотря на то, что в оригинале может быть и единственное число).
4. Синтез выходных словоформ и предложения в целом на выходном языке.
В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера; в последнем случае алгоритм перевода предусматривает определение так называемых анафорических связей (такова, например, связь местоимения с замещаемым им существительным – скажем, местоимения им со словом местоимения в самом этом пояснении в скобках).
В настоящее время существует две концепции развития систем МП:
1. Модель «большого словаря со сложной структурой», которая заложена в большинство современных программ-переводчиков;
2. Модель «смысл-текст», впервые сформулированная А.А. Ляпуновым, но пока что не реализована ни в одном коммерческом продукте.
На сегодняшний день наиболее известны такие системы машинного перевода, как
- PROMT 2000/XT компании PROMT;
- Retrans Vista компаний Vista и Advantis;
- Сократ – набор программ компании Арсеналъ.
В настоящее время качество машинного перевода оставляет желать много лучшего, и само наличие таких систем пока правильнее воспринимать как предмет научных исследований. В большинстве случаев при работе над проектом применение систем МП не оправдано, поскольку:
- Системы МП не дают приемлемого качества выходного текста. Более высокого качества можно добиться с помощью предварительной настройки системы (продукты серии PROMT XT предоставляют пользователю множество возможностей для этого), что совершенно неприемлемо при небольших объемах переводимого текста, и/или путем последующего редактирования, а это только замедляет работу, если переводчик использует слепой метод печати.
- Системы МП не гарантируют соблюдения единства терминологии, особенно при работе коллектива переводчиков над большим проектом. Вернее, могут гарантировать при условии очень внимательного обращения с пользовательскими словарями, а на это не всегда стоит рассчитывать.
Однако в некоторых случаях использование систем МП все же помогает сократить временные затраты. Это происходит, если текст достаточно объемный и содержит однообразную терминологию, что позволяет сравнительно быстро настроить под него систему МП. Тогда редактирование текста не займет слишком много времени. Однако в этом случае следует особенно внимательно отнестись к стилю текста перевода. Машинный перевод формален, поэтому высока вероятность калькирования синтаксических структур языка оригинала, которое характерно для перевода вообще, а потому вполне может быть пропущено при редактировании.
Вообще говоря, системы МП вполне могут применяться там, где используется максимально стандартизованный язык с простой грамматикой и сравнительно небольшим запасом слов. Довольно успешным проектом системы МП считается немецкая программа Meteo, выполняющая перевод метеопрогнозов с французского языка на английский и обратно. Для облегчения работы переводчиков и технических писателей компанией Boeing в свое время был разработан стандарт языка для написания технической документации, который известен как Boeing English.
Системы машинного перевода текстов с одних естественных языков на другие моделируют работу человека-переводчика. Их эффективность зависит, прежде всего, от того, в какой степени в них учитываются объективные законы функционирования языка и мышления. К сожалению, эти законы пока еще недостаточно изучены. Решая проблему машинного перевода, необходимо учитывать богатый опыт межнационального общения и опыт переводческой деятельности, накопленный человечеством. А этот опыт свидетельствует о том, что в процессе перевода в качестве основных единиц смысла рассматриваются, прежде всего, фразеологические словосочетания, выражающие целостные понятия, а не отдельные слова. Именно понятия являются теми элементарными мыслительными образами, используя которые можно строить более сложные мыслительные образы, соответствующие переводимому тексту.
Условимся называть системы машинного перевода, в которых в качестве основных минимальных единиц смысла рассматриваются не отдельные слова, а фразеологические словосочетания, системами фразеологического машинного перевода. В этих системах отдельные слова также могут использоваться, но они рассматриваются как вспомогательные единицы смысла, к которым приходится прибегать за неимением лучших.
Система фразеологического машинного перевода должна включать в свой состав базу знаний, содержащую переводные эквиваленты для наиболее часто встречающихся фраз, фразеологических сочетаний и отдельных слов, и программные средства для морфологического и синтаксического анализа и синтеза текстов и для их редактирования человеком. В процессе перевода текстов система использует хранящиеся в ее базе знаний переводные эквиваленты в следующем порядке: сначала делается попытка перевести всю фразу как целостную единицу; далее, в случае неудачи, входящие в ее состав словосочетания; и, наконец, осуществляется пословный перевод тех фрагментов текста, которые не удалось перевести первыми двумя способами. Фрагменты выходного текста, полученные всеми тремя способами, должны грамматически согласовываться друг с другом (с помощью процедур морфологического и синтаксического синтеза).
Принципы построения систем фразеологического машинного перевода текстов были впервые сформулированы в 1975 году в предисловии к книге Д. Жукова "Мы переводчики". В более полном виде они были изложены в 1983 году в книге Г. Г. Белоногова и Б. А. Кузнецова "Языковые средства автоматизированных информационных систем". Наконец, в 1993 году были опубликованы две статьи, в которых были описаны система машинного перевода, построенная на этих принципах, и методы автоматизированного составления двуязычных словарей по параллельным (русских и английским) текстам. Важнейшими среди этих принципов являются следующие:
1. Основными единицами языка и речи, которые, прежде всего, следует включать в машинный словарь, должны быть фразеологические единицы (словосочетания, фразы). Отдельные слова также могут включаться в словарь, но они должны использоваться только в тех случаях, когда не удается осуществить перевод, опираясь только на фразеологические единицы.
2. Наряду с фразеологическими единицами, состоящими из непрерывных последовательностей слов, в системах машинного перевода следует использовать и так называемые "речевые модели" - фразеологические единицы с "пустыми местами", которые могут заполняться различными словами и словосочетаниями, порождая осмысленные отрезки речи.
3. Реальные тексты, независимо от их принадлежности к той или иной тематической области, обычно бывают политематическими, если они имеют достаточно большой объем. Поэтому машинный словарь, предназначенный для перевода текстов даже только из одной тематической области, должен быть политематическим, а для перевода текстов из различных предметных областей - тем более. Он должен создаваться, прежде всего, на основе автоматизированной обработки двуязычных текстов, являющихся переводами друг друга, и в процессе функционирования систем перевода.
4. Наряду с основным политематическим словарем большого объема, в системах фразеологического машинного перевода целесообразно использовать также набор небольших по объему дополнительных тематических словарей. Дополнительные словари должны содержать только ту информацию, которая отсутствует в основном словаре (например, информацию о приоритетных переводных эквивалентах словосочетаний и слов для различных предметных областей).
На основе описанных принципов в ВИНИТИ РАН (см. выше) были построены две системы фразеологического машинного перевода:
1) система русско-английского перевода (RETRANS)
2) система англо-русского перевода (ERTRANS).
Обе системы имеют одинаковую структуру и примерно одинаковые объемы машинных словарей. Поэтому мы рассмотрим только первую систему.
Система RETRANS имеет следующие характеристики:
1. Область применения, назначение, функциональные возможности. Система предназначена для автоматизированного перевода научно-технических текстов с русского языка на английский. Русско-английский политематический машинный словарь системы содержит терминологию по естественным и техническим наукам, экономике, бизнесу, политике, законодательству и военному делу. В частности, он содержит термины и фразеологические единицы по следующим тематическим областям: Машиностроение, Электротехника, Энергетика, Транспорт, Аэронавтика. Космонавтика, Робототехника, Автоматика и Радиоэлектроника, Вычислительная Техника, Связь, Математика, Физика, Химия, Биология, Медицина, Экология, Сельское Хозяйство, Строительство и Архитектура, Астрономия, География, Геология, Геофизика, Горное Дело, Металлургия и др.
Перевод текстов может осуществляться в автоматическом и в диалоговом режимах.
2. Объем политематического машинного словаря: более 1.300.000 словарных статей; 77 процентов из них составляют словосочетания длиной от двух до семнадцати слов. Объем дополнительных машинных словарей (для настройки системы на различные тематические области) - более 200.000 словарных статей.
В основу программных продуктов компании PROMT поставлено решение следующих фундаментальных проблем:
Во-первых, всем ясно, что чем больше словарь, тем лучше перевод, значит, первая проблема - проблема создания больших словарей для систем.
Во-вторых, ясно, что система должна переводить такие предложения: ПРИВЕТ, КАК ДЕЛА? Значит, еще одна проблема - научить систему распознавать устойчивые обороты.
В-третьих, понятно, что предложение для перевода пишется по определенным правилам, по определенным правилам переводится, а значит есть еще одна проблема: записать все эти правила в виде программы. Вот, собственно, и все.
Самое интересное, что эти проблемы действительно являются основными при разработке систем машинного перевода, другое дело, что методы их решения известны далеко не всем и отнюдь не так просты, как может показаться.
Методы организации больших баз данных достаточно хорошо разработаны, но для перевода не менее, а может быть, и более важно правильно структурировать информацию, которая приписывается элементу базы, правильно выбрать этот самый элемент. Сколько, например, записей в словаре должно соответствовать обыкновенному русскому слову "программа"? И, вообще, большой словарь - это словарь, который содержит много словарных статей, или словарь, который позволяет распознать много слов из текста? Очевидно, более верно второе. Поэтому для описания и входного, и выходного языка в системе должен существовать некоторый формальный метод описания морфологии, на котором основывается выбор единицы словаря.
Практически во всех системах, которые претендуют на то, чтобы считаться системами перевода, проблема представления морфологических моделей так или иначе решается. Но одни системы могут распознать миллион словоформ при объеме словаря в пятьдесят тысяч словарных статей, а другие при объеме словаря в сто тысяч словарных статей могут распознать именно эти сто тысяч.
В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться. Оно содержит 800 типов словоизменений для русского языка, более 300 типов, как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.
Кроме того, используемая модель морфологии позволила разработать экспертную систему для пользователя - создателя словаря. Эта система фактически автоматизирует процедуру выделения основы и определения типа словоизменения при вводе новых словарных статей.
Такой возможности нет ни в одной из существующих систем машинного перевода, даже в таких распространенных системах как Power Translator (Globalink, США), Language Assistant (MicroTac, США), TRANSEND (Intergaph,США), где пользователям приходится вручную спрягать и склонять слова для задания морфологической модели.
Однако разработка описания морфологии позволяет решить только проблему того, что является заголовком словарной статьи, по которому происходит идентификация единицы текста и единицы словаря. Но ведь идентификация слова из текста со словарной статьей происходит не ради идентификации, как это требуется в спеллерах или электронных словарях, она необходима для выполнения программой собственно процедур перевода. Какая же нужна информация в словарной статье и как должны быть описаны правила перевода для того, чтобы программа переводила?
Во многих системах МП в прошлом (как, впрочем, и сейчас) словарное описание и описание алгоритмов рассматривались как стороны одной проблемы, но решение, как правило, искалось в ограничении рассматриваемого мира, либо грамматического, либо семантического. Например, на основе признака "принадлежность к части речи" описывалась грамматика такого типа:
именная группа - это существительное
именная группа - это прилагательное + именная группа
глагольная группа - это глагол + именная группа
предложение - это именная группа + глагольная группа
Понятно, что некоторая часть предложений естественного языка описывается такой грамматикой, но эта часть очень незначительна, и на ее основе нельзя правильно анализировать и переводить хоть сколько-нибудь реальный текст. Но зато можно использовать эффективные методы построения преобразователя по заданной грамматике или, на худой конец, написать программу, которая путем перебора построит древа зависимостей для ограниченного множества предложений. Такие системы точно так же получали определения "экспериментальные".
Так или иначе, но именно из таких проектов появились системы перевода, которые сейчас предлагаются конечному пользователю. Это и Power Translator (компания Globalink) и Language Assistant (компания MicroTac) и TRANSEND (компания Intergraph).
Системы семейств STYLUS и PROMT - не исключение, поскольку многие специалисты компании PROMT имели опыт работы в такого типа проектах. Однако при разработке систем PROMT впервые был применен фактически революционный подход, который и позволил получить впечатляющие результаты. Системы перевода семейства PROMT - это системы, спроектированные на основе не лингвистических, а кибернетических методов.
Оказалось, что очень продуктивно рассматривать систему перевода не как транслятор, задачей которого является перевод текста, допустимого с точки зрения входной грамматики, а как некоторую сложную систему, задачей которой является получение результата при произвольных входных данных, в том числе и для текстов, которые не являются правильными для грамматики, с которой работает система.
Вместо принятого лингвистического подхода, предполагающего выделение последовательных процессов анализа и синтеза предложения, в основу архитектуры систем было положено представление процесса перевода как процесса с "объектно-ориентированной" организацией, основанной на иерархии обрабатываемых компонентов предложения. Это позволило сделать системы PROMT устойчивыми и открытыми.
Кроме того, такой подход дал возможность применения различных формализмов для описания перевода разных уровней. В системах работают и сетевые грамматики, близкие по типу к расширенным сетям переходов, и процедурные алгоритмы заполнения и трансформаций фреймовых структур для анализа сложных предикатов.
Описание лексической единицы в словарной статье, которое фактически не ограничено по размерам и может содержать множество различных признаков, тесно взаимосвязано со структурой алгоритмов системы и структурировано не на основе извечной антитезы синтаксис - семантика, а на основе уровней компонентов текста.
При этом системы могут работать и с не полностью описанными словарными статьями, что является важным моментом при открытии словарей для пользователя, от которого нельзя требовать тонкого обращения с лингвистическим материалом.
Первая система машинного перевода, выпущенная компанией PROMT в 1991 году, переводила с английского языка на русский специализированные тексты по программному обеспечению. Она использовала небольшой словарь - около 17 тыс. слов и выражений, работала в среде ДОС и не имела средств настройки для пользователя. Но уже эта первая система была правильно устроена, и нынешняя технология разработки алгоритмов машинного перевода, применяемая в компании PROMT, не претерпела значительных изменений. Напротив, найденный тогда подход оказался очень плодотворным для самых разных языков.
Сначала поясним некоторые определения: вместе с развитием машинного перевода как области прикладной лингвистики появились и классификации систем, и стало принято делить системы перевода на системы типа TRANSFER и системы типа INTERLINGUA. Это разделение основано на особенностях архитектурных решений для лингвистических алгоритмов.
Алгоритмы перевода для систем типа TRANSFER строятся как композиция трех процессов: анализ входного предложения в терминах структур входного языка, преобразование этой структуры в аналогичную структуру выходного языка (TRANSFER) и затем синтез выходного предложения по полученной структуре.
Системы типа INTERLINGUA предполагают априори наличие некоторого метаязыка структур (INTERLINGUA), на котором можно описать все структуры как входного, так и выходного языков в общем случае; поэтому алгоритм перевода в системе типа INTERLINGUA предполагается как более простой: анализ входного предложения в терминах метаязыка и затем синтез из метаструктуры соответствующего предложения выходного языка. "Единственная" сложность в этом случае - разработать сам метаязык и описать естественный язык в соответствующих терминах.
Несмотря на то, что эта классификация существует, и в среде разработчиков машинного перевода считается хорошим тоном спросить, к какому типу относится система PROMT, не было разработано еще не одной реальной системы, основанной на принципе INTERLINGUA.
Система PROMT не является исключением, и на этот вопрос мы отвечаем: наша система выполняет перевод типа TRANSFER. Но это очень простой ответ, он практически не отражает особенностей архитектуры системы PROMT. А особенности состоят в том, что этот метод (TRANSFER) применен в системе не в соответствии с лингвистическим стандартным подходом.
Дело в том, что система перевода, как правило, работает в условиях не полностью описанных данных, ведь в язык - это живая система, которая развивается очень быстро: постоянно появляются новые слова, новые функции старых слов, и, вместе с новыми сущностями, новые значения. В этих условиях определяющим структурным свойством алгоритмов перевода становится их устойчивость к произвольным входным данным, и в основу алгоритмов, выполняющих перевод в системе PROMT, вместо последовательного TRANSFER'а был заложен иерархический подход, разделяющий процесс перевода на взаимосвязанные TRANSFER'ы для разных единиц анализа.
В системе выделяется уровень лексических единиц, уровень групп, уровень простых предложений и уровень сложных предложений. Все эти процессы связаны и взаимодействуют иерархически в соответствии с иерархией текстовых единиц, обмениваясь синтезируемыми и наследуемыми признаками. Такое устройство алгоритмов позволяет использовать разные формальные методы для описания алгоритмов разных уровней.
Рассмотрим уровень лексических единиц: лексическая единица - это слово или словосочетание, которое является единицей самого низкого уровня. И в случае входного, и в случае выходного языка слово описывается как совокупность основы и окончания. Это обеспечивает возможность, с одной стороны, распознавания входных слов и анализа входной морфологии и, с другой стороны, удобного синтеза выходных слов по их морфологической информации (основа, тип словоизменения и адрес окончания в массиве окончаний этого типа). Таким образом, если ввести правила преобразования входной морфологической информации в выходную морфологическую информацию, осуществляется TRANSFER на морфологическом уровне.
Уровень групп рассматривает структуры более сложные: группы существительных, прилагательных, наречий и сложные глагольные формы. Этот уровень при анализе, основываясь на формальных сетевых грамматиках, умеет соединять группы в синтаксические единицы, каждая из которых характеризуется синтезированной структурной информацией и главным элементом группы. По входной структуре, полученной в терминах непосредственных составляющих, вместе с синтезированными признаками формируется выходная группа как набор лексических единиц со значениями морфологических признаков, которые могут наследоваться исходя из результатов анализа группы. Таким образом, реализуется TRANSFER на уровне групп.
Анализ простых предложений как структур, состоящих из синтаксических единиц, выполняется на основе фреймовых предикатных структур, которые позволяют эффективно выполнять преобразования. Глагол считается для простых предложений главным элементом и его валентности определяют заполнение соответствующего фрейма. Для каждого типа фреймов существует некоторый закон преобразования в выходной фрейм и оформление актантов. Таким образом, осуществляется TRANSFER на уровне предложений. Анализ сложных предложений требуется в случае формирования согласования времен и правильного перевода союзов.