17:50

pdf -> txt

put a rock beat over everything
а нет ли программки, которая позволяла бы получать из файла pdf текст? есть несколько книг в pdf, очень для реферата нужны, а перепечатывать ручками лень )



upd. а вот из djvu похоже никак не получится, это же картинка. или всё-таки есть шанс?

@темы: Поиск ПО

Комментарии
14.04.2007 в 17:53

Вы по самому пдф поройтесь, там где-то в меню есть опция «копировать».
14.04.2007 в 17:57

put a rock beat over everything
получается, что копируется весь документ? а выделить нужный фрагмент никак не выйдет?
14.04.2007 в 18:01

Именно выделить нужное место. Там на видном месте в меню есть кнопка «Выбрать» или типа того, вот нажимаете на неё и выделяете дальше как привыкли.
14.04.2007 в 18:03

War...War never changes.
ABBYY Fine Reader вам в помощь =)

У него есть функция обработки пдф.
14.04.2007 в 18:03

put a rock beat over everything
~Ellie~ нашла, спасибо ) к сожалению, этот фрагмент вставляется в MS Word как картинка ( но других способов, похоже, нет )
14.04.2007 в 18:04

put a rock beat over everything
Proof

чОрт. 990 рублей ради курсовой. нет, лучше ручками )
14.04.2007 в 18:05

Swimming guineapig

Поищите другие OCR, очень удивлюсь, если опенсурсники ещё не занялись этой проблемой.
14.04.2007 в 18:32

put a rock beat over everything
Поищите другие OCR

спасибо, хоть буду знать, что в строке "поиск" писать ))
14.04.2007 в 18:42

решаем проблемы с головой!
Именно для таких целей существует программа ABBYY PDF Transformer.
14.04.2007 в 18:46

For tonight GOD IS A DJ
Swimming guineapig любую программу можно скачать и сломать, так что цена здесь роли не играет.

Вот например:



ABBYY PDF Transformer 2.0



Конвертируйте и создавайте PDF профессионально и быстро! PDF-файлы широко распространены во всем мире, ведь они открываются и одинаково отображаются на всех компьютерах. Но как извлечь информацию из PDF-файла и внести нужные изменения? Ответ перед вами: ABBYY PDF Transformer 2.0. Эта полезная и легкая в использовании программа позволяет не только конвертировать PDF-файлы в редактируемые форматы, но и создавать PDF из приложений Microsoft Office одним щелчком мыши. При конвертировании из PDF программа делает текст редактируемым, а также сохраняет внешний вид документа, в том числе таблицы. Поэтому вам не придется тратить время на восстановление исходного оформления.



ps если нужно залью одним архивом вместе с ключиком.
14.04.2007 в 18:49

put a rock beat over everything
techsupport

спасибо)



doctor.exe

а он большой?.. )
14.04.2007 в 19:08

For tonight GOD IS A DJ
http://rapidshare.com/files/5879992/PDF_trans2.0.rar



51 мб. будут вопросы по установке, пиши
14.04.2007 в 19:20

put a rock beat over everything
doctor.exe

спасибо )
14.04.2007 в 22:31

Танкист Апокалипсиса
Помимо вышеуказанных поможет и Adobe Reader Professional.
15.04.2007 в 01:40

решаем проблемы с головой!
Adobe Reader Professional



Такого продукта нет. Есть Adobe Acrobat Reader и Adobe Acrobat Professional.
15.04.2007 в 02:11

Прежде чем испробовать достичь цели - я хочу запомнить этот мир целым ©
Adobe Acrobat Reader /Foxit PDF Reader. Я юзаю это, копируется как текст в ворд на ура.

а вот из djvu похоже никак не получится, это же картинка. или всё-таки есть шанс?

Где то я видел вариат перегона из этого формата в другой, ща поищу.
15.04.2007 в 02:20

Прежде чем испробовать достичь цели - я хочу запомнить этот мир целым ©
Выводы неутешительны:

После длительных поисков, я понял, что вариант всего один:

1. Экспорт из djvu в tif

2. распознавание в FineReader.

3. Экспорт в (txt, chm, pdf, html, doc и т.д.)



Печально, что на полном автомате не получиться...

15.04.2007 в 09:25

put a rock beat over everything
спасибо всем )



Сэр Дьявол

мда. долговато получится... )
15.04.2007 в 10:48

Танкист Апокалипсиса
Такого продукта нет. Есть Adobe Acrobat Reader и Adobe Acrobat Professional.

Да, напутал. Adobe Acrobat Professional.
15.04.2007 в 12:07

решаем проблемы с головой!
djvu - специальный формат, усложняющий копирование и использование текста из него
15.04.2007 в 23:04

Выдыхай, бобёр, выдыхай! В смысле, ну хоть педивикию почитайте. В смысле, про дежавю.



Вообще, всё очень просто: если текст в файле есть, его как правило несложно выдрать. Если текста в файле нет, тогда придётся распознавать -- без вариантов. Но распознавание вообще-то тоже довольно легко автоматизировать.
16.04.2007 в 10:47

мне сказали, что ты меня все еще любишь
Swimming guineapig а нет ли программки, которая позволяла бы получать из файла pdf текст?



Если еще актуально, то вот: http://slil.ru/24241730 (3.8 Мб + кейген)



Конвертация PDF в DOC. Довольно аккуратно и достаточно быстро.
16.04.2007 в 10:49

решаем проблемы с головой!
нет ли программки, которая позволяла бы получать из файла pdf текст?



Именно для таких целей существует программа ABBYY PDF Transformer.



Читайте внимательней комментарии.
16.04.2007 в 10:51

мне сказали, что ты меня все еще любишь
techsupport это вы мне?
16.04.2007 в 10:54

решаем проблемы с головой!
Автору цитаты нет ли программки, которая позволяла бы получать из файла pdf текст?
16.04.2007 в 11:43

put a rock beat over everything
ehlo_kitty сами вы бобёр ) в русской викепедии написано DjVu-файл может содержать текстовый (OCR) слой, значит можно как-нибудь вытащить текст. вот я и спрашиваю как. Сэр Дьявол даже уже написал как... а почему бобёр?



DDD спасибо, уже установила ABBYY PDF Transformer )



techsupport спасибо, я уже с первого раза поняла и установила, благодаря doctor.exe )
16.04.2007 в 12:57

Это не к Вам относилось.



/me sighs



Внизу статьи есть ссылки. Если слой с текстом в файле есть, они Вам помогут.
16.04.2007 в 13:23

ehlo_kitty

+1
27.04.2007 в 20:56

Горячий_лед
Хотите "новость"?! В ABBYY FineReader 8.0 Professional Edition есть встроенная програмулька ABBYY Screenshot Reader которая отлично копирует текст с экрана.



ABBYY Screenshot Reader

Это простое и удобное приложение предназначено для распознавания текста с любой области экрана компьютера. Screenshot Reader позволит переводить в редактируемый формат такие тексты, которые нельзя скопировать обычным способом (например, тексты с интернет-страниц, созданных при помощи технологии Flash). Как распознанный текст, так и снимок экрана могут быть сохранены в виде файла или переданы в буфер обмена.

Таким образом, при помощи ABBYY Screenshot Reader можно:

* быстро собрать в один файл цитаты из нескольких открытых документов

* получить в виде текста содержание папки с файлами, название файлов и атрибуты

* сохранить в виде текста историю писем в Outlook

* извлечь текст из сообщений об ошибках, сообщений в строке статуса, и т.д.

* сохранить данные только из выбранного столбца таблицы (в интернет-браузере, базе данных и т.д.)

Утилита доступна зарегистрированным пользователям ABBYY FineReader 8.0. А чтоб ее "зарегистрировать", достаточно установить патч. ;-) Удачи!



Сам пользуюсь по всякому случаю :D в том числе и для получения текста из дежавю