Для организации письменного перевода время от времени приходится сталкиваться и файлами в формате PDF. При этом возникает необходимость перевести его в форматы, подлежащие форматированию MS Office и пр.
Типовая схема перевода PDF-файлов
PDF документы бывают двух видов: растровые (полученные путем сканирования) и текстовые. Во втором случае можно произвести выделение, а в сканированном документе выделение не представляется возможным. Поэтому способы работы с ними будут различными. В текстовом PDF чаще всего можно скопировать текст, который почти не требует правки. Отсканированные документы необходимо распознавать.
Конвертация в текст
Способы конвертации в текст зависят от различных факторов.
- Защищенность документа паролем.
Защищенный документ сложно подвергнуть обработке. FineReader здесь нам не поможет. Есть варианты использования программы для вскрытия паролей. Лучшие из них: Elcomsoft PDF Password Recovery. Но самый простой и беспроблемный способ – обратиться к владельцу с просьбой прислать исходник.
- Использование в тексте стандартной шрифтовой раскладки (symbol map).
Если документ подлежит копированию, а затем легко вставляется, значит мы имеем правильную раскладку. Но в случае, когда вместо привычного текста вставляются непонятные значки или вообще пустоты, раскладка некорректная, и поиск здесь не сработает.
- Наличие в документе таблиц, символов, картинок.
PDF не распознает таблицы, поэтому извлечь их обычным способом или специальными конвертерами невозможно. Их надо распознавать, причем вручную. Та же проблема с колонтитулами, подписями к картинкам. Для таких документов нет однозначного ответа, как лучше поступить, работать с ним вручную или затратить время на распознавания после извлечения через FineReader.
- Наличие колонок в документе.
Здесь тоже есть проблемы. Часто при распознавании с использованием различных программ все колонки попадают в один общий текст, и получается на выходе абракадабра, с которой непросто справиться. Однако, FineReader имеет настраиваемую функцию по распознаванию блоков. Поколоночно достаточно аккуратно может выбирать документ и Acrobat Reader.
- Требуемый формат на выходе.
Чем проще запрашиваемый формат должен получиться в итоге, тем проще используемая программа. Можно брать простой акробат для простого формата или FineReader при сложном форматировании текста.
В случае, если мы имеем дело с документом на иностранном языке, то можно выбрать способы его верстки до или после перевода.
Чем лучше верстка после перевода.
1. Меньшие трудозатраты по верстке, так как текст сразу верстается в чистом виде, в отличие от предварительной верстки, когда элементы текста из-за того, что русский текст имеет большую длину, чем английский и французский исходник, могут уплыть и скатиться на другую страницу.
2. Во время верстки появляется возможность дополнительного форматирования текста.
Обращайтесь за услугами редактирования текстов в нашу компанию, где Вам предложат услуги квалифицированных редакторов и все сопутствующее лингвистическое обслуживание!