Эта страница может содержать автоматически переведенный текст.

Функции преобразования PDF в текст

Из PDF-документов на разных языках можно извлекать текст в различных форматах.

Процесс преобразования PDF в текст

Docotic.Pdf может извлекать простой и форматированный текст из PDF-документов. Также можно получить подробные сведения о шрифте, цвете, размере и других свойствах каждого символа.

Для извлечения арабского, ивритского или персидского текста из PDF-документов не требуется ничего особенного. Docotic.Pdf достаточно интеллектуален, чтобы корректно извлекать текст справа налево и двунаправленный текст.

Статьи

Ниже приведены ресурсы, объясняющие различные аспекты преобразования PDF в текст в коде C# и VB.NET.

Сообщения в блоге

У нас есть запись в блоге, объясняющая, как извлечь текст из PDF, не предназначенного для поиска. Обычно в таких документах текст отображается как растровое изображение.

Типичный пример — отсканированный PDF-документ. PDF-документы, не предназначенные для поиска, также могут отображать текст в виде векторных контуров без использования шрифтов или специальных операторов PDF.

Примеры кода

Эти примеры кода показывают разные варианты преобразования PDF в текст в C# и VB.NET.