Тема: «Компьютерные переводчики. Системы распознавания текста».

Цели урока:

    помочь учащимся получить представление об компьютерных словарях и системах машинного перевода текста, познакомиться с возможностями данных программ, научить использовать эти программы. помочь учащимся получить представление об OCR – программах распознавания текста, познакомиться с возможностями данных программы, научить распознавать отсканированный текст, передавать и редактировать его в Word. воспитание информационной культуры учащихся, внимательности, аккуратности, дисциплинированности, усидчивости. развитие познавательных интересов, навыков работы на компьютере, самоконтроля, умения конспектировать.

Оборудование:
доска, компьютер, компьютерная презентация.

План урока:

1) Организационный момент. (1 мин)

2) Актуализация знаний. (5 мин)

3) Теоретическая часть. (10 мин)

4) Практическая часть. (15 мин)

5) Домашнее задание (2 мин)

6) Вопросы учеников. (5 мин)

7) Итог урока. (2 мин)

Ход урока:

I. Организационный момент.

Приветствие, проверка присутствующих. Объяснение хода урока.

II. Актуализация знаний.

Как видим, для того, чтобы получить электронную, готовую к редактированию копию любого печатного текста, программе OCR необходимо выполнить «цепочку» из множества отдельных операций.

Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и так далее. Далее выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст.

Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном. Сначала растровое изображение страницы разделяется на изображения отдельных символов. Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством отличных от входного изображения точек.

При распознавании документов с низким качеством печати (машинописный текст, факс и так далее) используется метод распознавания символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.).

Любой символ можно описать через набор значений параметров, определяющих взаимное расположение его элементов. Например, буква «Н» и буква «И» состоят из трех отрезков, два из которых расположены параллельно друг другу, а третий соединяет эти отрезки. Различие между данными буквами - в величине углов, которые образует третий отрезок с двумя другими.

При распознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего соответствует распознаваемому символу.

Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader и CuneiForm от Cognitive, используют как растровый, так и структурный методы распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

Программы для распознавания текста вы можете приобрети отдельно или получить бесплатно вместе с купленным вами сканером.

Возможно, самая известная программа для распознавания текстов – это FineReader от компании ABBYY. Именно эту программу чаще всего вспоминают, когда речь заходит о системах распознавания.

FineReader позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии "целостного целенаправленного адаптивного распознавания".

FineReader имеет массы дополнительных функций, которые простому пользователю, возможно, и без надобности, но зато производят впечатление на определенные группы покупателей. Так, одним из козырей FineReader является поддержка неимоверного количества языков распознавания - 176, в числе которых вы найдете экзотические и древние языки, и даже популярные языки программирования.

Но далеко не все возможности включены в самую простую модификацию программы, которую вы можете получить бесплатно вместе со сканером. Пакетное сканирование, грамотная обработка таблиц и изображений - для всего этого стоит приобрести профессиональную версию программы.

Все версии FineReader, от самой простой до самой мощной, объединяет удобный интерфейс. Для запуска процесса распознавания вам достаточно просто положить документ в сканер и нажать единственную кнопку (мастер Scan & Read) на панели инструментов программы. Все дальнейшие операции - сканирование, разбивку изображения на «блоки» и, наконец, собственно распознавание программа выполнит автоматически. Пользователю останется только установить нужные параметры сканирования.

Качество распознавания во многом зависит от того, насколько хорошее изображение получено при сканировании. Качество изображения регулируется установкой основных параметров сканирования: типа изображения, разрешения и яркости.

Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости. Если Вы хотите, чтобы содержащиеся в документе цветные элементы (картинки, цвет букв и фона) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения. В других случаях используйте серый тип изображения.

Оптимальным разрешением для обычных текстов является - 300 dpi и 400-600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов).

После завершения распознавания страницы FineReader предложит пользователю выбор: сканировать и распознавать дальше (для многостраничного документа) или сохранить полученный текст в одном из множества популярных форматов - от документов Microsoft Office до HTML или PDF. Можно, впрочем, сразу же перебросить документ в Word или Excel, и уже там исправить все огрехи распознавания (без ни обойтись просто невозможно). При этом FineReader полностью сохраняет все особенности форматирования документа и его графическое оформление.

    Зачем нужны программы распознавания текста? Как происходит распознавание текста? Какие программы распознания текста вы знаете? Какими пользовались? Какое разрешение является оптимальным для сканирования текста, изображений?

III. Практическая часть.
1. Работа с переводчиком текста (по катрочкам)
2. Теперь потренируемся работать с программой ABBYY FineReader. Будем использовать упрощенную версию программы, поставляемую со сканером.

IV. Домашнее задание
Знать, что такое программы автоматического перевода текста, уметь работать с этими программами. Дополнительное задание: соединиться с Интернетом и используя какой-либо on-line переводчик перевести текст.
Знать, что такое программы распознавания текста, уметь работать с этими программами. Дополнительное задание: установить дома программу OCR и подготовить реферат по какому-либо предмету. Текст распознать в OCR, редактирование и форматирование провести в Word.

V. Вопросы учеников.
Ответы на вопросы учащихся.

VI. Итог урока.
Подведение итога урока. Выставление оценок.

На уроке мы познакомились с программами компьютерного перевода текстов, научились переводить слова и текст с помощью программы-переводчика.

На уроке мы познакомились с программами OCR, научились распознавать отсканированное изображение с помощью программы ABBYY FineReader 5.0.

    Перевести предложения на русский язык:

    Операционная система обычно хранится во внешней памяти компьютера .

    Словари необходимы для перевода текстов с одного языка на другой.

    Информация должна быть достоверной, актуальной и полезной.

    The teacher’s computer is placed on the table in the corner of the classroom.

    Instrumental system programs facilitate process of creation of new programs for a computer.

    Universal arrangement of processing of the information is the computer.

1.Перевести предложения на английский язык:

    Операционная система обычно хранится во внешней памяти компьютера .

    Словари необходимы для перевода текстов с одного языка на другой.

    Информация должна быть достоверной, актуальной и полезной.

2.Перевести предложения на русский язык:

    The teacher’s computer is placed on the table in the corner of the classroom.

    Instrumental system programs facilitate process of creation of new programs for a computer.

    Universal arrangement of processing of the information is the computer.

1.Перевести предложения на английский язык:

    Операционная система обычно хранится во внешней памяти компьютера .

    Словари необходимы для перевода текстов с одного языка на другой.

    Информация должна быть достоверной, актуальной и полезной.

2.Перевести предложения на русский язык:

    The teacher’s computer is placed on the table in the corner of the classroom.

    Instrumental system programs facilitate process of creation of new programs for a computer.

    Universal arrangement of processing of the information is the computer.

1.Перевести предложения на английский язык:

    Операционная система обычно хранится во внешней памяти компьютера .

    Словари необходимы для перевода текстов с одного языка на другой.

    Информация должна быть достоверной, актуальной и полезной.

2.Перевести предложения на русский язык:

    The teacher’s computer is placed on the table in the corner of the classroom.

    Instrumental system programs facilitate process of creation of new programs for a computer.

    Universal arrangement of processing of the information is the computer.

1.Перевести предложения на английский язык:

    Операционная система обычно хранится во внешней памяти компьютера .

    Словари необходимы для перевода текстов с одного языка на другой.

    Информация должна быть достоверной, актуальной и полезной.

2.Перевести предложения на русский язык:

    The teacher’s computer is placed on the table in the corner of the classroom.

    Instrumental system programs facilitate process of creation of new programs for a computer.

    Universal arrangement of processing of the information is the computer.

1.Перевести предложения на английский язык:

    Словари необходимы для перевода текстов с одного языка на другой.

2.Перевести предложения на русский язык:

    The teacher’s computer is placed on the table in the corner of the classroom.

1.Перевести предложения на английский язык:

    Универсальным устройством обработки информации является компьютер.

    Словари необходимы для перевода текстов с одного языка на другой.

    Инструментальные системные программы облегчают процесс создания новых программ для компьютера.

2.Перевести предложения на русский язык:

    The information should be authentic, actual and useful.

    The teacher’s computer is placed on the table in the corner of the classroom.

1.Перевести предложения на английский язык:

    Универсальным устройством обработки информации является компьютер.

    Словари необходимы для перевода текстов с одного языка на другой.

    Инструментальные системные программы облегчают процесс создания новых программ для компьютера.

2.Перевести предложения на русский язык:

    1)The operation system is usually stored in external memory of a computer.

    The information should be authentic, actual and useful.

    The teacher’s computer is placed on the table in the corner of the classroom.

1.Перевести предложения на английский язык:

    Универсальным устройством обработки информации является компьютер.

    Словари необходимы для перевода текстов с одного языка на другой.

    Инструментальные системные программы облегчают процесс создания новых программ для компьютера.

2.Перевести предложения на русский язык:

    1)The operation system is usually stored in external memory of a computer.

    The information should be authentic, actual and useful.

    The teacher’s computer is placed on the table in the corner of the classroom.

1.Перевести предложения на английский язык:

    Универсальным устройством обработки информации является компьютер.

    Словари необходимы для перевода текстов с одного языка на другой.

    Инструментальные системные программы облегчают процесс создания новых программ для компьютера.

2.Перевести предложения на русский язык:

    The operation system is usually stored in external memory of a computer.

    The information should be authentic, actual and useful.

    The teacher’s computer is placed on the table in the corner of the classroom.

1.Перевести предложения на английский язык:

    Универсальным устройством обработки информации является компьютер.

    Словари необходимы для перевода текстов с одного языка на другой.

    Инструментальные системные программы облегчают процесс создания новых программ для компьютера.

2.Перевести предложения на русский язык:

    The operation system is usually stored in external memory of a computer.

    The information should be authentic, actual and useful.

    The teacher’s computer is placed on the table in the corner of the classroom.

Знание иностранных языков - это не только полезный навык в повседневной жизни, но также одно из основных требований при приеме на работу. В настоящее время необходимость в знании одного или даже нескольких иностранных языков приобретает всё более явную актуальность.

Секретарю знание языка (английского или немецкого) необходимо не только в поездке в отпуск за границу, но также и на приеме деловых партнёров из-за рубежа, в обыденной жизни при чтении новостей или просмотре фильмов. Поэтому, большое количество рутинных обыденных и повседневных операций, которые не требовали ранее знания иностранного языка, сегодня, ввиду развития процессов международной интеграции и повсеместному стремлению бизнеса к глобализации, становятся всё более затруднительными, если опираться только на один язык.

Однако сегодня одного только знания иностранных языков бывает недостаточно, поскольку объём информации, которую необходимо ежедневно переводить, существенно возрос. Вместе с тем, эта задача успешно решается, и ни для кого не составляет труда всего за несколько секунд перевести контракт или контент иностранного сайта. А всё потому, что переводом в этом случае занимается программа-переводчик: человек не успевает и глазом моргнуть, а перевод уже готов.

Цель данного урока - помочь студентам получить представление об компьютерных словарях и системах машинного перевода текста, познакомить с возможностями данных программы, научить использовать эти программы.

Скачать:


Предварительный просмотр:

Тема урока: «Системы машинного перевода текстов и компьютерные словари»

Цели урока:

  • помочь студентам получить представление об компьютерных словарях и системах машинного перевода текста, познакомить с возможностями данных программы, научить использовать эти программы.
  • развитие познавательных интересов, самоконтроля, умения конспектировать.
  • воспитание информационной культуры учащихся, внимательности, аккуратности, дисциплинированности, усидчивости.

Тип урока: урок изучения нового материала

Оборудование:

компьютер, проектор, экран, компьютерная презентация.

Ход урока:

I. Орг. момент

Приветствие, проверка присутствующих.

II. Актуализация знаний

Знание хотя бы одного иностранного языка необходимо сегодня всем, как воздух. В особенности пользователям: ведь избежать столкновения с английским языком при работе на компьютере, увы, невозможно. Ладно, если бы дело касалось только файлов с документацией к программам (которые у нас традиционно никто не читает) или названий программных меню (ориентироваться в которых можно научиться и без знания языка, методом научного тыка и зубрежки).

Плохо, если вы не знаете иностранного языка... Однако горю вашему - отчасти - можно помочь, установив на компьютер одну из специализированных программ-переводчиков или воспользовавшись компьютерными словарями.

Запишите тему урока «Системы машинного перевода текстов
и компьютерные словари».

Сегодня на уроке вы получите представление о компьютерных словарях и системах автоматического перевода текста и познакомитесь с возможностями данных программ

III. Ознакомление с новым материалом

С возникновением письменности люди получили мощный инструмент для сохранения знаний и для коммуникации. Первые письмена, дошедшие до нас на стенах храмов и гробниц, повествуют о деяниях царей и полководцев, происшедших много веков назад. Кроме того, люди записывали результаты хозяйственной деятельности, для того чтобы успешно торговать, собирать налоги и т.д.

Чтобы облегчить письменное общение между народами были созданы первые словари. Один из таких словарей был написан шумерскими жрецами на глиняных табличках. Каждая табличка была поделена на две равные части. С одной стороны записывалось шумерское слово, а с другой - аналогичное по значению слово на другом языке, иногда с кратким пояснением. С тех времен до наших дней структура словарей практически не изменилась.

В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и так далее), причем каждый из них может содержать десятки тысяч слов.

В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, где поиск нужного слова является достаточно трудоемким процессом.

Происходящая в настоящее время глобализация нашего мира приводит к необходимости обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках.

В этих условиях использование традиционной технологии перевода «вручную» тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществить немедленно, и нет возможности и времени пригласить переводчика.

Системы машинного перевода позволяют решить эти проблемы.

С появлением персонального компьютера стали создаваться электронные словари, облегчившие поиск нужного слова и предложившие множество новых полезных функций (озвучивание слова, поиск синонимов и т.д.).

Технология машинного перевода постепенно совершенствовалась. И если качество и скорость перевода первых систем оставляли желать лучшего, то теперь компьютер действительно может связно переводить текст с одного языка на другой. А более современные системы с приемлемым качеством переводят 1 страницу текста за 1 секунду.

Компьютерные словари многоязычные.

Они позволяют пользователю выбрать языки и направление перевода (например, англо-русский, испано-русский и др.)

Могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина и др.)

Обеспечивают быстрый поиск словарных статей.

Дают возможность ввода словосочетаний и текстов.

Могут являться мультимедийными, т.е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Основные требования к компьютерным переводчикам

Оперативность заключается в возможности постоянного обновления словарного запаса и тематических разделов.

Гибкость рассчитана на конкретную предметную область.

Скорость - возможность автоввода и обработки текстовой информации с бумаги. Одна такая система (OCR-System) ежедневно заменяет больше десяти опытных машинисток.

Точность заключается грамотности и адекватной передачи смысла переводимого текста на язык перевода.

У систем компьютерного перевода есть свои плюсы и минусы.

Плюсы

Высокая скорость перевода . Системы компьютерного перевода позволяют переводить многостраничные документы с высокой скоростью.

Универсальность. Профессиональный переводчик, как правило, имеет специализацию по переводу текстов определенной тематики. Программы-переводчики позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты

Низкая стоимость перевода . Прибегая к услугам профессиональных переводчиков, мы вынуждены платить деньги за каждую страницу перевода. Однако часто необходимости в получении идеального перевода текста нет, а нужно уловить смысл присланного письма или содержания страницы в Интернете. В этом случае система перевода, без сомнений, станет надежным и эффективным помощником.

Конфиденциальность . Многие пользователи регулярно используют системы машинного перевода для перевода личных писем, ведь далеко не каждый человек готов отдать постороннему переводчику личную переписку или доверить перевод коммерческих или финансовых документов.

Перевод в режиме он-лайн и перевод содержания Интернет-страниц . Позволяют переводить Web-страницы в режиме реального времени. Сервисы онлайн-перевода всегда под рукой и помогут в нужный момент быстро перевести информацию. Помимо этого, сегодня с помощью систем перевода можно переводить содержание Интернет-страниц и запросы поисковых систем.

Минусы

Но на эти системы нельзя полностью полагаться. Они допускают смысловые и стилистические ошибки и неприменимы для перевода художественных произведений , так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека.

Это происходит потому, что осуществляют перевод текстов, основываясь на формальном «знании»: синтаксиса языка (правил построения предложений), правил словообразования и использовании словарей.

Применение машинного перевода без настройки на тематику служит предметом многочисленных бытующих в Интернете шуток.

Фраза «Our cat gave birth to three kittens - two whites and one black», которую онлайн-переводчик «ПРОМТ» превращал в «Наш кот родил трёх котят - двух белых и одного афроамериканца». Если «афроамериканца» ещё можно было сделать «чёрным», написав «black kitten», то «коту» так и не получалось сменить пол: например, female cat переводился как «самка кот».

Программа не распознаёт контекст фразы и переводит термины дословно, к тому же не отличая собственных имён от обычных слов. Тот же переводчик ПРОМТ превращает «Лев Толстой» в «Lion Thick» («толстый лев»).

Переводчик Google, наоборот, слово «rice» (рис) часто принимал за фамилию бывшей госсекретаря США.

Что же делать, чтобы избежать таких ошибок?

  • Перед началом перевода, нужно определить тип текста , то есть из какой области жизнедеятельности человека он представлен (экономика, спорт, наука и т.д.). Ведь каждая сфера имеет свои нюансы и термины.
  • Часто причиной неправильного перевода являются опечатки переводимом тексте. Это касается и распознанных текстов. Слова с ошибками помечаются переводчиками как незнакомые, потому что в таком виде их нет в словарях. Хуже, если есть ошибки в пунктуации - одна неправильно поставленная запятая способна исказить перевод всего предложения.
  • Работайте с фрагментами текста . Никогда не переводите весь текст сразу. В нем всегда найдутся слова, отсутствующих в словаре и такие, которые система переводит неправильно.

Онлайновые компьютерные переводчики в Интернете обеспечивают выбор тематического словаря и направления перевода. Они позволяют переводить любые тексты, набранные в окне перевода или скопированные из буфера обмена, веб-страницы, включая гиперссылки, а также электронные письма.

Самыми популярными являются Google, PROMT, Яндекс.перевод.

Translate.ru - первый российский веб-сервис, предназначенный для перевода текста или веб-страниц на другие языки. При переводе отдельного слова выдаёт словарную статью. Открыт 6 марта 1998 года компанией PROMT.

Яндекс.Перевод - веб-сервис компании Яндекс, предназначенный для перевода части текста или веб-страницы на другой язык. Система строит свои словари соответствий на основе анализа миллионов переведённых текстов. Текст для перевода компьютер вначале сравнивает с базой слов, затем с базой моделей языка, стараясь определить смысл выражения в контексте.

Google Переводчик - веб-сервис компании Google, предназначенный для автоматического перевода части текста или веб-страницы на другой язык. Для некоторых языков пользователям предлагаются варианты переводов, например, для технических терминов, которые должны быть в будущем включены в обновления системы перевода. Сервис включает в себя также перевод всей веб-страницы и даже одновременный поиск информации с переводом на другой язык.

Использование системы машинного перевода позволяет значительно сократить время, требуемое для перевода текстов. Лучшими среди российских систем машинного перевода считаются PROMT, ABBYY Lingvo, Мультитран, SlovoEd .

Электронный словарь ABBYY Lingvo. Многоязычная версия охватывает 15 языков. В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена.

Электронный словарь Promt. Компания ПРОМТ предлагает программы-переводчики и словари PROMT для перевода текстов с английского, немецкого, французского, испанского и других языков на русский и обратно. Полное решение для автоматического перевода деловой и технической документации, электронной почты, web-сайтов и презентаций.

Переводчики доступны не только для персональных компьютеров, но и для мобильных телефонов, планшетов и прочих устройств.

Например, для того, чтобы быстро и с удобствами переводить нужные абзацы тексты создана программа для Андроид - Быстрый переводчик. Ее главным преимуществом является то, что она переводит тексты после копирования их в буфер обмена. Вам необходимо лишь выделить нужные участки текста, чтобы получить быстрый перевод прямо на планшете или телефоне Android.

IV. Закрепление изученного материала

На уроке мы познакомились компьютерными словарями и системами автоматического перевода текста и возможностями данных программ .

1. Какие требования предъявляют к компьютерным переводчикам?

2. Какими преимуществами обладают компьютерные словари по сравнению с традиционными бумажными словарями?

3. В каких случаях целесообразно использовать системы компьютерного перевода?

4. Какие тексты нецелесообразно переводить с помощью компьютерных переводчиков?

5. Как называются лучшие российские системы машинного перевода?

V. Домашнее задание

Подготовиться к практической работе

VI. Итог урока.

Подведение итога урока. Выставление оценок.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

Михеева Е.В. Информационные технологии в профессиональной деятельности. – М.: Академия, 2006. – 384 с.

Сапков В.В. Информационные технологии и компьютеризация делопроизводства. – М.: Академия, 2006. – 288 с.

Виды систем машинного перевода // logrus.ru

Документы, составленные на иностранных языках, турфирме следует перевести на русский. Иначе расходы по ним нельзя будет принять в целях налогообложения. Однако иногда перевод не нужен. Скажем, если речь идет о закодированных на латинице реквизитах электронного авиабилета (письмо ФНС России от 7 июня 2011 г. № ЕД-4-3/8983).

Необходимость перевода документов
В соответствии с пунктом 1 статьи 16 Закона РФ от 25 октября 1991 г. № 18071 «О языках народов Российской Федерации» официальное делопроизводство в организациях в нашей стране ведется на русском языке.

А как закреплено в пункте 9 Положения по ведению бухгалтерского учета и бухгалтерской отчетности в РФ, утвержденного приказом Минфина России от 29 июля 1998 г. № 34н, бухгалтерский учет имущества, обязательств и хозяйственных операций (фактов хозяйственной деятельности) фиксируется в валюте РФ - в рублях.

При этом документирование имущества, обязательств и иных фактов хозяйственной деятельности, ведение регистров бухгалтерского учета и отчетности осуществляются на русском языке. Далее сказано: первичные учетные документы, составленные на иных языках, должны иметь построчный перевод на русский язык.

На основании указанных норм контролирующие органы делают вывод, что первичные документы, если они оформлены на иностранном языке, обязательно должны быть переведены на русский. Такое мнение выражено, в частности, в письмах Минфина России от 3 ноября 2009 г. № 03-03-06/725, от 14 сентября 2009 г. № 03-03-05/170, от 16 февраля 2009 г. № 03-03-05/23.

Хотя в судах организациям удается отстоять расходы, которые подтверждены документами без перевода (постановления ФАС Московского округа от 21 апреля 2011 г. № КА-А40/2152-11, от 8 октября 2008 г. № КА-А40/8061-08).

Также чаще всего арбитры встают на сторону налогоплательщиков, указывая, что отсутствие перевода документов на русский язык не может служить основанием для отказа в вычете НДС. Пример тому - постановления ФАС Московского округа от 1 апреля 2009 г. № КА-А40/132809, от 16 марта 2009 г. № КА-А40/1450-09, ФАС Западно-Сибирского округа от 5 марта 2007 г. № Ф04-979/2007(31967-А45-14).

Однако если у турфирмы документы не будут иметь перевода, отстаивать возможность налогового учета расходов или права на вычет скорее всего придется в суде. При этом исход судебного спора может быть и не в пользу налогоплательщика.

Как оформить перевод документа
Финансовое ведомство уточняет, что перевод может сделать как профессиональный переводчик, так и сама организации, вернее, ее работник (письма от 14 сентября 2009 г. № 03-03-05/170, от 20 марта 2006 г. № 03-02-07/1-66).

При этом как должен быть оформлен такой документ, законодательство не устанавливает. Поэтому его можно выполнить в виде отдельного документа либо вписать русский текст на ксерокопии иностранного первичного документа.

Надо отметить, что перевод может быть выполнен и организацией, выдавшей первичный документ, например, в виде справки (письмо Минфина России № 03-03-05/170).

Когда можно обойтись без перевода
В некоторых случаях переводить документы не придется.

Этого не нужно делать, во-первых, при регулярном получении от своих контрагентов-иностранцев типовых документов, в которых отличаются только цифровые показатели (номер, дата документа, цена и т. п.), достаточно перевести один раз форму документа на русский. Разъяснения по данному вопросу приведены в письме Минфина России от 3 ноября 2009 г. № 03-03-06/1/725.

Во-вторых, не требуется переводить информацию, не имеющую существенного значения для подтверждения произведенных расходов.

Например, условия применения тарифа, правила авиаперевозки, правила перевозки багажа. На это обратили внимание чиновники главного финансового ведомства в письме от 14 сентября 2009 г. № 03-03-05/170.

В-третьих, не нужен перевод формализованных (закодированных) реквизитов электронного авиабилета, заполненных с использованием символов латиницы (письма ФНС России от 7 июня 2011 г. № ЕД-4-3/8983, от 26 апреля 2010 г. № ШС-37-3/656@).

А вот когда в электронном авиабилете значения фактически обозначены на иностранном языке и не совпадают с формализованными (закодированными) значениями или кодами в соответствии с Едиными международными кодификаторами, то эти показатели (значения) авиабилета подлежат переводу на русский язык.

Учет расходов на перевод
В бухгалтерском учете расходы туристической фирмы на оплату услуг по переводу документов включаются в состав прочих в том месяце, в котором они оказаны. Это отражается записью по дебету счета 91 «Прочие доходы и расходы» (субсчет «Прочие расходы») и кредиту счета 76 «Расчеты с разными дебиторами и кредиторами» (п. 11, 16, 18 ПБУ 10/99 «Расходы организации»).

Принимаются такие расходы и в целях налогообложения прибыли - в составе прочих как оплата за информационные услуги (подп. 14 п. 1 ст. 264 Налогового кодекса РФ) либо как иные прочие траты. Об этом - в письме УФНС России по г. Москве от 26 мая 2008 г. № 20-12/050126. Правда, эта норма касается расходов на сторонний перевод.

Напомним, что для соответствия требованиям статьи 252 Налогового кодекса РФ расходы на перевод документов должны быть документально подтверждены.

При «упрощенке» учесть такие расходы не получится. Поскольку они не предусмотрены в закрытом перечне разрешенных трат (п. 1 ст. 346.16 Налогового кодекса РФ).

Важно запомнить

Расходы на сторонний перевод документов можно учесть в целях налогообложения прибыли. А вот принять их при «упрощенке» нельзя.

Компьютерные словари и системы машинного перевода текстов

Компьютерные словари. Словари необходимы для перевода текстов с одного языка на другой. Существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и т. д.), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, в которой поиск нужного слова является достаточно долгим и трудоемким процессом.

Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности. Во-первых, компьютерные словари могут являться многоязычными - давать пользователю возможность выбрать языки и направление перевода (например, англо-русский, испанско-русский и т. д.).

Во-вторых, компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).

В-третьих, компьютерные словари обеспечивают быстрый поиск словарных статей: "быстрый набор", когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.

В-четвертых, компьютерные словари могут являться мультимедийными, т. е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Системы компьютерного перевода. Процесс глобализации мира приводит к необходимости частого обмена документами между людьми и организациями, находящимися в разных странах мира и говорящими на различных языках.

В этих условиях использование традиционной технологии перевода "вручную" тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков. Перевод полученного по электронной почте письма или просматриваемой в браузере Web-страницы необходимо осуществлять срочно, и нет времени пригласить переводчика.

Системы компьютерного перевода позволяют решить эти проблемы. Они, с одной стороны, способны переводить многостраничные документы с высокой скоростью (одна страница в секунду), с другой стороны, переводить Web-страницы "на лету", в режиме реального времени.

Системы компьютерного перевода осуществляют перевод текстов, основываясь на формальном "знании": синтаксиса языка (правил построения предложений), правил словообразования и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

Современные системы компьютерного перевода позволяют достаточно качественно переводить техническую документацию, деловую переписку и другие специализированные тексты. Однако они не применимы для перевода художественных произведений, так как не способны адекватно переводить метафоры, аллегории и другие элементы художественного творчества человека.

Контрольные вопросы

    1. Какими преимуществами обладают компьютерные словари по сравнению с традиционными бумажными словарями?
    2. В каких случаях целесообразно использовать системы компьютерного перевода?

Системы оптического распознавания документов

Системы оптического распознавания символов. Системы оптического распознавания символов используются при создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат.

Сначала с помощью сканера необходимо получить изображение страницы текста в графическом формате. Далее для получения документа в текстовом формате необходимо провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательность текстовых символов.

Системы оптического распознавания символов сначала определяют структуру размещения текста на странице и разбивают его на отдельные области: колонки, таблицы, изображения и т. д. Далее выделенные текстовые фрагменты графического изображения страницы разделяются на изображения отдельных символов.

Для отсканированных документов типографского качества (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений) распознавание символов проводится путем их сравнения с растровыми шаблонами.

Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого it наибольшей степени совпадает с изображением (рис. 3.16).

При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.) используется векторный метод распознавания символов. В распознаваемом изображении символа выделяются геометрические примитивы (отрезки, окружности и др.) и сравниваются с векторными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех геометрических примитивов и их расположение больше всего соответствует распознаваемому символу (рис. 3.17).

Системы оптического распознавания символов являются "самообучающимися" (для каждого конкретного документа они создают соответствующий набор шаблонов символов), и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.

С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

Системы оптического распознавания форм. При заполнении документов большим количеством людей (например, при сдаче выпускником школы единого государственного экзамена (ЕГЭ)) используются бланки с пустыми полями. Данные вводятся в поля печатными буквами от руки. Затем эти данные распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.

Сложность состоит в том, что необходимо распознавать символы, написанные от руки, которые довольно сильно различаются у разных людей. Кроме того, такие системы должны уметь определять, к какому полю относится распознаваемый текст.

Контрольные вопросы

    1. В чем состоят различия в технологии распознавания текста при использовании растрового и векторного методов?

№ 8. Кодирование текстовой информации.

№ 9. Создание визитных карточек на основе шаблона.

№ 10. Установка параметров страницы документа, вставка колонтитулов и номеров страниц.

№ 11. Вставка в документ формул.

№ 12. Форматирование символов и абзацев.

№ 13. Создание и форматирование списков.

№ 14. Вставка оглавления в документ, содержащий заголовки.

№ 15. Вставка в документ таблицы, ее форматирование и заполнение данными.

№ 16. Создание гипертекстового документа.

№ 17. Перевод текста с помощью компьютерного словаря.

№ 18. Сканирование и распознавание бумажного текстового документа.