Конвертеры HTML в RTF с интеграцией иллюстраций в тело RTF файла.
В свое время перепробовал несколько десятков разных конвертаций в разных программах. Приходилось оценивать разные параметры. В частности:
- Возможность внедрения картинок в RTF (подгрузка из интернета или оффлайн каталога)
- Сохранение редко встречаемых шрифтов (еврейского и греческого в частности)
- Сохранение оформления (расстояния между абзацами, отступы, таблицы).
- Читабельность трансляции ссылок в TheWord (всплывающие подсказки) кликабельность естественно не проверял - итак ясно что работать переходы без манипуляций с исходниками не будут, - только ссылки на внешние источники в формате понятном для браузера.
- Ну и наконец оценивал - скорость работы.
В общем есть программы которые обладают хорошими параметрами НО и крупными недостатками, - например невозможность конвертации иврита и греческого текста ставит на них крест.
Указанные программы имеют разные преимущества друг перед другом при конвертации разных материалов. Для минимализма файлов рекомендуется HTMLtoRTF 3.1 Pro. Если нужно интегрировать картинки разных форматов в одну страницу то лучше использовать TotalHTML Converter.
HTMLtoRTF 3.1 Pro
особенности:
Очень высокая скорость обработки.
Имеет поддержку командной строки (то есть можно конвертировать заданную папку одним кликом с заранее определенными настройками).
Хорошо сохраняет разметку при конвертации wiki сайтов.
Создает небольшие по объему RTF файлы.
Хорошо сохраняет тексты на разных языках в Unicode.
Имена файлов в Unicode не видит.
Файлы RTF иногда бывали не валидными - не все успешно импортировались в TW3. Так что после нее еще нужно было делать дополнительный проход Амбером. (RTF в RTF)
TotalHTML Converter
особенности:
Часто выдает ошибки.
Разные версии конвертера форматирую ттекст по разному. Возможно какая нибудь версия 1,45 даст лучший результат чем одна из последних.
При наличии автокликера можно пользоваться и триальной версией. Время от времени подавляя всплывающее окно с предупреждением.
Имена файлов в Unicode не видит.
Файлы создает небольшого размера.
Скорость конвертации довольно высокая.
Более-менее нормально сохраняет оформление.
Скачивает из интернета и внедряет в RTF все картинки - PNG, JPG, GIF файлы. Последнее меня вообще убило. Потому что не HtmlToRtf ни Convert DOC не внедряли 2 типа файлов. Впрочем у HtmlToRtf есть опция для конвертации файлов в формат WMF перед внедрением, но это сильно увеличивает размер файла.
ConvertDoc
особенности:
За последние годы как замечают программа практически не изменялась внешне и по количеству опций (версии 4-7).
Имеет поддержку запуска заданий из командной строки что в общем то важно для удобства. Учитывая что родной интерфейс не всегда удобен и предсказуемо себя ведет.
Имеет два режима конвертации - родной и с использованием конвертера MS OFFICE.
Иногда автоматически срывается на альтернативный метод конверсии - особенно при больших объемах файла. При этом обратно режим конвертации (после прохождения проблемного участка) автоматически не восстанавливается. Таким образом может образоваться сборная-солянка из файлов которые заметно отличаются друг от друга по качеству.
- Родной конвертер ConvertDoc позволяет интегрировать изображения в файл, но не любит символы Unicode в тексте.
Скорость обработки средняя.
Качество оформления уступает "офисному".
- Режим конвертации с использованием MS OFFICE (он используется во многих конвертерах такого плана).
Хорошо сохраняет текст оригинала с использованием Unicode.
Качество оформления в целом радует. Если он не прибегает к использованию шрифта Cambria Math.
Этот режим конверсии не способен внедрять изображения в тело файла.
Этот режим конверсии работает жутко медленно.
Размер файлов по сравнению с HTMLtoRTF в этом режиме конверсии просто огромный.