Редактирование текста в форматах, в которых такая фукнция не предусмотрена, сопряжено с предварительной обработкой изображений. Чаще всего производится распознавание текста с созданием структуры документа через OCR-систему.
Система оптического распознавания создает подобие исходного документа в условно редактируемом виде. Как видно, здесь есть две оговорки "подобие документа" и "условно редактируемый". Разберем, почему так получается.
Когда текст автоматически распознается системой, создается документ в который внедряются стили оформления, шрифты, структура документа, таблицы, иллюстрации. Для простых документов, статей, не содержащих сложной верстки, иллюстраций, графиков и чертежей такой процесс выдает очень достойный результат. Документ сохраняется в формате MS Word, с которым впоследствии работает переводчик, редактор или корректор (носитель языка).
Примечания пруфридера в хорошо распознанном редактируемом документе
Стоимость редактирования текста в иллюстрациях, графиках, схемах и чертежах определяется на основании его объема и трудоемкости внесения правок. За единицу расчета стоимости редактуры принимают 1800 знаков исходного текста. Если текста на картинках относительно немного, но он сильно "разбросан" по странице, то в заказ на редактуру может быть добавлена услуга "верстка страницы", которая компенсирует временные затраты редактора на обработку документа.
Значительно сложнее обстоит дело с документами, структура которых не позволяет автоматически воссоздать его в редактируемом формате. Примером может послужить техническая инструкция с большим количеством иллюстраций с фоном и выносками, пояснениями, размещенными в пределах графического элемента и внедренных в его контект. Такие иллюстрации с текстом очень плохо поддаются оптическому распознаванию и поэтому использовать полученный таким образом документ можно с существенными оговорками. Для целей перевода и редактуры эти документы могут поспособствовать, но для печати и распространения переведенной документации категорически не подходят.
Пример инструкции, содержащей текстовые надписи, которая после распознавания становится практически непригодна для работы редактора.
|
Такие документы приходится переверстывать заново, используя графику с оригинальных файлов и текст с переведенных. Понятно, что этот процесс занимает существенно больше времени и более затратный, чем редактура документов в текстовых форматах. При редактировании редактор выделит ошибки цветом, а исправления и комментарии отметит в виде комментария. Такой вариант редактуры документов потребует внести изменения в текст оригинала самостоятельно или обратиться к верстальщику, который создавал исходный документ.