а нет ли программки, которая позволяла бы получать из файла pdf текст? есть несколько книг в pdf, очень для реферата нужны, а перепечатывать ручками лень )
upd. а вот из djvu похоже никак не получится, это же картинка. или всё-таки есть шанс?
Swimming guineapig любую программу можно скачать и сломать, так что цена здесь роли не играет.
Вот например:
ABBYY PDF Transformer 2.0
Конвертируйте и создавайте PDF профессионально и быстро! PDF-файлы широко распространены во всем мире, ведь они открываются и одинаково отображаются на всех компьютерах. Но как извлечь информацию из PDF-файла и внести нужные изменения? Ответ перед вами: ABBYY PDF Transformer 2.0. Эта полезная и легкая в использовании программа позволяет не только конвертировать PDF-файлы в редактируемые форматы, но и создавать PDF из приложений Microsoft Office одним щелчком мыши. При конвертировании из PDF программа делает текст редактируемым, а также сохраняет внешний вид документа, в том числе таблицы. Поэтому вам не придется тратить время на восстановление исходного оформления.
ps если нужно залью одним архивом вместе с ключиком.
Выдыхай, бобёр, выдыхай! В смысле, ну хоть педивикию почитайте. В смысле, про дежавю.
Вообще, всё очень просто: если текст в файле есть, его как правило несложно выдрать. Если текста в файле нет, тогда придётся распознавать -- без вариантов. Но распознавание вообще-то тоже довольно легко автоматизировать.
ehlo_kitty сами вы бобёр ) в русской викепедии написано DjVu-файл может содержать текстовый (OCR) слой, значит можно как-нибудь вытащить текст. вот я и спрашиваю как. Сэр Дьявол даже уже написал как... а почему бобёр?
DDD спасибо, уже установила ABBYY PDF Transformer )
techsupport спасибо, я уже с первого раза поняла и установила, благодаря doctor.exe )
Хотите "новость"?! В ABBYY FineReader 8.0 Professional Edition есть встроенная програмулька ABBYY Screenshot Reader которая отлично копирует текст с экрана.
ABBYY Screenshot Reader
Это простое и удобное приложение предназначено для распознавания текста с любой области экрана компьютера. Screenshot Reader позволит переводить в редактируемый формат такие тексты, которые нельзя скопировать обычным способом (например, тексты с интернет-страниц, созданных при помощи технологии Flash). Как распознанный текст, так и снимок экрана могут быть сохранены в виде файла или переданы в буфер обмена.
Таким образом, при помощи ABBYY Screenshot Reader можно:
* быстро собрать в один файл цитаты из нескольких открытых документов
* получить в виде текста содержание папки с файлами, название файлов и атрибуты
* сохранить в виде текста историю писем в Outlook
* извлечь текст из сообщений об ошибках, сообщений в строке статуса, и т.д.
* сохранить данные только из выбранного столбца таблицы (в интернет-браузере, базе данных и т.д.)
Утилита доступна зарегистрированным пользователям ABBYY FineReader 8.0. А чтоб ее "зарегистрировать", достаточно установить патч. Удачи!
Сам пользуюсь по всякому случаю в том числе и для получения текста из дежавю
-
-
14.04.2007 в 17:53-
-
14.04.2007 в 17:57-
-
14.04.2007 в 18:01-
-
14.04.2007 в 18:03У него есть функция обработки пдф.
-
-
14.04.2007 в 18:03-
-
14.04.2007 в 18:04чОрт. 990 рублей ради курсовой. нет, лучше ручками )
-
-
14.04.2007 в 18:05Поищите другие OCR, очень удивлюсь, если опенсурсники ещё не занялись этой проблемой.
-
-
14.04.2007 в 18:32спасибо, хоть буду знать, что в строке "поиск" писать ))
-
-
14.04.2007 в 18:42-
-
14.04.2007 в 18:46Вот например:
ABBYY PDF Transformer 2.0
Конвертируйте и создавайте PDF профессионально и быстро! PDF-файлы широко распространены во всем мире, ведь они открываются и одинаково отображаются на всех компьютерах. Но как извлечь информацию из PDF-файла и внести нужные изменения? Ответ перед вами: ABBYY PDF Transformer 2.0. Эта полезная и легкая в использовании программа позволяет не только конвертировать PDF-файлы в редактируемые форматы, но и создавать PDF из приложений Microsoft Office одним щелчком мыши. При конвертировании из PDF программа делает текст редактируемым, а также сохраняет внешний вид документа, в том числе таблицы. Поэтому вам не придется тратить время на восстановление исходного оформления.
ps если нужно залью одним архивом вместе с ключиком.
-
-
14.04.2007 в 18:49спасибо)
doctor.exe
а он большой?.. )
-
-
14.04.2007 в 19:0851 мб. будут вопросы по установке, пиши
-
-
14.04.2007 в 19:20спасибо )
-
-
14.04.2007 в 22:31-
-
15.04.2007 в 01:40Такого продукта нет. Есть Adobe Acrobat Reader и Adobe Acrobat Professional.
-
-
15.04.2007 в 02:11а вот из djvu похоже никак не получится, это же картинка. или всё-таки есть шанс?
Где то я видел вариат перегона из этого формата в другой, ща поищу.
-
-
15.04.2007 в 02:20После длительных поисков, я понял, что вариант всего один:
1. Экспорт из djvu в tif
2. распознавание в FineReader.
3. Экспорт в (txt, chm, pdf, html, doc и т.д.)
Печально, что на полном автомате не получиться...
-
-
15.04.2007 в 09:25Сэр Дьявол
мда. долговато получится... )
-
-
15.04.2007 в 10:48Да, напутал. Adobe Acrobat Professional.
-
-
15.04.2007 в 12:07-
-
15.04.2007 в 23:04Вообще, всё очень просто: если текст в файле есть, его как правило несложно выдрать. Если текста в файле нет, тогда придётся распознавать -- без вариантов. Но распознавание вообще-то тоже довольно легко автоматизировать.
-
-
16.04.2007 в 10:47Если еще актуально, то вот: http://slil.ru/24241730 (3.8 Мб + кейген)
Конвертация PDF в DOC. Довольно аккуратно и достаточно быстро.
-
-
16.04.2007 в 10:49Именно для таких целей существует программа ABBYY PDF Transformer.
Читайте внимательней комментарии.
-
-
16.04.2007 в 10:51-
-
16.04.2007 в 10:54-
-
16.04.2007 в 11:43DDD спасибо, уже установила ABBYY PDF Transformer )
techsupport спасибо, я уже с первого раза поняла и установила, благодаря doctor.exe )
-
-
16.04.2007 в 12:57/me sighs
Внизу статьи есть ссылки. Если слой с текстом в файле есть, они Вам помогут.
-
-
16.04.2007 в 13:23+1
-
-
27.04.2007 в 20:56ABBYY Screenshot Reader
Это простое и удобное приложение предназначено для распознавания текста с любой области экрана компьютера. Screenshot Reader позволит переводить в редактируемый формат такие тексты, которые нельзя скопировать обычным способом (например, тексты с интернет-страниц, созданных при помощи технологии Flash). Как распознанный текст, так и снимок экрана могут быть сохранены в виде файла или переданы в буфер обмена.
Таким образом, при помощи ABBYY Screenshot Reader можно:
* быстро собрать в один файл цитаты из нескольких открытых документов
* получить в виде текста содержание папки с файлами, название файлов и атрибуты
* сохранить в виде текста историю писем в Outlook
* извлечь текст из сообщений об ошибках, сообщений в строке статуса, и т.д.
* сохранить данные только из выбранного столбца таблицы (в интернет-браузере, базе данных и т.д.)
Утилита доступна зарегистрированным пользователям ABBYY FineReader 8.0. А чтоб ее "зарегистрировать", достаточно установить патч.
Сам пользуюсь по всякому случаю