Общее описание расширения DJVU

Файл с расширением DJVU (DjVu Image) — это формат созданный компанией LizardTech который относится к категории Растровые изображения.

Файл DJVU предназначен для содержания контента в растровом виде, среди основного выделяют каталоги, книги, журналы и отсканированные изображения. Довольно часто, применяется для текстового материала, содержащего обилие схем, формул и рисунков. Прочие подобные форматы не смогут настолько точно распознавать вышеприведенные элементы.  

Как создать djvu из картинок

Предположим, что фотографии или отсканированные копии страниц у вас уже есть. Поместите их в одну общую папку, затем скачайте конвертер по этой ссылке:

Скачайте DjVu конвертер

Откройте архив и запустите файл «Djvu Small Mod.exe». Выберите операцию кодирования, затем нажмите кнопку «Открыть файлы».

Выберите операцию кодирования

Поддерживается создание djvu из картинок в формате jpg, bmp, gif, tiff, pnm и из растровых файлов.

Выделите все изображения в папке (чтобы сделать это быстро, нажмите CTRL+A), и откройте их.

Выделите все изображения в папке

Затем выберите, куда сохранить создаваемый файл и придумайте ему имя.

 Чтобы начать процесс конвертации нажмите кнопку «Кодировать».

Как создать DjVu файл

Процесс не долгий, на современном ПК на обработку 50 страниц уходит в среднем 1 секунда.

В конце, если не убирать галочку с опции «показать результат», будет предложено открыть получившуюся книгу в одной из программ для чтения DjVu файлов, установленной на компьютере.

Как создать файл Djvu

1) DjVu Small

О программе: https://www.djvu-scan.ru/forum/index.php?topic=42.0

Программа для создания файла djvu из картинок формата bmp, jpg, gif и пр. Кстати, программа может не только создавать, но и извлекать из djvu все графические файлы, которые находятся в сжатом формате.

Пользоваться ей очень просто. После запуска программы, вы увидите небольшое окно, в котором за несколько шагов можно создать файл djvu.

1. Для начала нажимаете на кнопку Open Files (красная единичка на скрине ниже) и выбираете те картинки, которые вы хотите запаковать в данный формат.

2. Вторым шагом выбираете место, где будет сохранен созданный файл.

3. Выбираете, что сделать с вашими файлами. Document — > Djvu — это преобразовать документы в формат djvu; Djvu Decoding — этот пункт нужно выбирать, когда вы вместо картинок в первой вкладке выбираете файл djvu, чтобы его извлечь и получить его содержимое.

4. Select encoding profile — выбор качества сжатия. Лучшим вариантом будет эксперимент: взять пару картинок и попробовать их сжать, если качество вас устроит — то затем можно и всю книгу сжать с этими же настройками. Если же нет — то попробовать увеличить качество. Dpi — это количество точек, чем выше это значение — тем лучше качество, и тем больше получается размер исходного файла.

5. Convert — кнопка, которая запускает создание сжатого файла djvu. Время на эту операцию будет зависеть от количества картинок, их качества, мощности ПК и т.д. На 5-6 картинок ушло примерно 1-2 сек. на среднем по мощности компьютере на сегодняшний день. Кстати, ниже приведен скриншот: размер файла получился примерно 24 кб. из 1мб исходных данных. Нетрудно посчитать, что файлы были сжаты в 43* раза!

1*1024/24 = 42,66

2) DjVu Solo

Читайте также:  Как в Photoshop вставить картинку на фон, слой или другое фото?

О программе: https://www.djvu.name/djvu-solo.html

Еще одна неплохая программа для создания и извлечения файлов djvu. Многим пользователям она кажется не такой удобной и наглядной, как DjVu Small, но все равно рассмотрим процесс создания файла и в ней.

1. Открываете файлы картинок, которые вы отсканировали, скачали, взяли у друзей и пр. Важно! Сначала откройте всего лишь 1 картинку из всех желаемых конвертировать!

Важный момент! Многие не могут открыть картинки в этой программе, т.к. по умолчанию она открывает файлы формата djvu. Чтобы открыть другие графические файлы, просто поставьте в графе типы файлов значение как на картинке снизу.

2. После того, как ваша одна картинка была открыта, можно добавить остальные. Для этого в левом окне программы вы увидите столбик с маленьким превью вашей картинки. Щелкните по ней правой кнопкой мышки и выберите пункт «Insert page after» — добавить страницы (картинки) после этой.

Затем выделяете все картинки, которые хотите сжать и добавляете в программу.

3. Теперь жмете на file/Encode As Djvu — произвести кодирование в Djvu.

Далее просто нажимаете на «OK».

В следующем шаге вас просят указать место, где будет сохранен кодированные файл. По умолчанию вам предлагается папка для сохранения та, из которой вы добавляли файлы картинок. Можно выбрать и ее.

Теперь вам необходимо выбрать качество, с которым программа сожмет картинки. Лучше всего, его подобрать экспериментально (т.к. у многих вкусы разные и давать конкретные цифры бесполезно). Просто оставьте сначала по умолчанию, сожмите файлы — затем проверьте, устроит ли вас качество документа. Если не устроит — то затем увеличьте/уменьшите качество и опять проверьте и т.д. пока не найдете свой баланс между размером файла и его качеством.

Файлы в примере были сжаты до 28кб! Довольно неплохо, особенно для тех, кто хочет сэкономить место на диске, или у тех у кого медленный интернет.

Создание djvu в процессе сканирования

Если дома есть сканер, нет смысла предварительно фотографировать каждую страницу, можно их сканировать и преобразовывать в DjVu «на лету». Правда для этого потребуется уже другая программа, которая работает только на Windows XP и 7 — DjVu Solo (на восьмерке не пробовали, а вот на десятке она не запустилась).

Скачайте DjVu Solo, установите и запустите. На верхней панели найдите значок сканера и нажмите на него. Откроется стандартная утилита сканирования.

значок сканера

Если ничего не происходит, через меню зайдите в «Файл» — «Выбрать источник», и из списка устройств выберите свой сканер. Если там пусто, проверьте, установлены ли драйвера, идущие в комплекте с устройством? Попробуйте переустановить их, затем перезапустить программу.

После сканирования через утилиту, изображение откроется в отдельном окне на рабочем столе Solo. Через меню зайдите в «Файл» — «Преобразовать в DjVu», затем сохраните созданный файл. Это еще не книга – только одна ее страница.

Далее алгоритм действий такой: заново нажимаете на значок сканера на верхней панели программы, сканируете новую страницу, сохраняете и опять преобразовываете в DjVu. Созданный файл откроется в новом окне – то есть теперь в программе Solo будет 2 открытых окна с файлами. Вот это новое окно закройте и перейдите к первому окну. Затем через меню зайдите в «Правка» — «вставить страницы в конец книги» и вставьте к первому файлу второй.

Затем отсканируйте третью страницу, и полученный файл опять добавьте в конец книги, то есть к файлу из первого окна. Тоже самое сделайте с четвертой и всеми последующими страницами по очереди, пока книга не закончится.

DjVu Editor 6.0 Pro + Rus


Исключительно по просьбам пользователей CWER.ws
Document Express with DjVu — группа приложений, позволяющих создавать, управлять, записывать и распространять файлы в формате DjVu. Document Express Editor — одна из наиболее распространенных программ для создания и просмотра DjVu-документов на локальном компьютере.

Рассмотрим коротко ее основные возможности и кратко опишем принцип создания DjVu-документов.

В Document Express Editor, можно открывать и конвертировать файлы таких форматов: DjVu (*.djvu, *.djv), BMP (*.bmp), GIF (*.gif), JPEG (*.jpeg, *.jpg), PNM (*.pnm, *.ppm, *.pgm, *.pbm), TIFF (*.tiff, *.tif), PICT (*.pict).

Для создания DjVu-файла нужно отсканировать страницу (меню “Файл” -> “Сканировать”), либо открыть уже готовое изображение поддерживаемого формата (меню “Файл” -> “Открыть”). Если в документ должен быть многостраничный, то при помощи меню “Правка” > “Добавить страницы до…” или “Правка” > “Добавить страницы после…” вставить в документ до или после открытого изображения остальные изображения.

Затем при помощи меню “Файл” -> “Сохранить как…” сохранить документ в формате DjVu.

При сохранении файла программа предложит выбрать настройки: распознавать ли текст; профиль; разрешение (от 100 до 600 dpi); качество текста (возможны 5 уровней от «агрессивного», т.е. со значительной потерей до «без потери»), сохранять изображения каждое в отдельном или все в одном файле.

Так называемый профиль – это тоже настройки, только пользователь выбирает тип документа, а программа автоматически подстраивается под тип изображения.

Всего доступны 7 профилей:

  1. «Нормальный» – для большинства отсканированных печатных документов
  2. «Электронный» – для растровых изображений электронного происхождения, таких, как скриншоты и т.п.
  3. «Фото» — для фотографий. При этом функция OCR не работает, поэтому функция поиска и копирования текста в созданном документе не будет работать.
  4. «Битональный» — для черно-белых изображений
  5. «Рукопись» — для старых или рукописных изданий без рисунков или фотографий
  6. «Рисунок» — похож на «Рукопись», но с поддержкой рисунков и фотографий
  7. «Карта» — похож на «Рисунок», но с лучшей поддержкой перевернутого текста

Этими настройками, как правило, действительно можно добиться удовлетворительного результата. После того, как настройки заданы, нужно выбрать место на локальном диске и сохранить файл в формате DjVu. После сохранения добавляется возможность подсвечивать области в документе, вставлять внутренние (для самого документа) и внешние гиперссылки и т.п. Так же если при создании DjVu-документа не было задано распознавание текста, это можно сделать позже. Document Express Editor 6.0.1 умеет распознавать около 100 языков, в том числе русский и украинский.

Вообще вопрос о необходимости добавления текстового OCR-слоя при создании DjVu-документа является дискуссионным. Помимо того, что процедура распознавания текста занимает значительное время, OCR-слой увеличивает размер DjVu-файла. Однако наличие текстового слоя очень удобно при дальнейшей работе с электронной книгой. Во-первых, появляется возможность копировать нужные фрагменты текста для последующей обработки; во-вторых – искать по ключевому слову или выражению в самом DjVu-документе и среди всего множества DjVu-документов как на локальных дисках, так и в сети. Функция поиска по ключевому слову присутствует практически во всех DjVu-программах.

Так как многие DjVu-документы содержат текстовый OCR-слой, у некоторых пользователей создается впечатление, что их можно конвертировать в формат DOC, или подобный. Однако формат DjVu – это графический, а не текстовый формат. Поэтому напрямую конвертировать DjVu-документ в формат «Word-processor» – подобного редактора нельзя. DjVu-файл может лишь содержать встроенный OCR-слой – простой текст без какого-либо форматирования. Используя буфер обмена этот текстовый слой можно перенести в текстовый редактор и вручную форматировать.

Для создания DjVu (кодирование/декодирование)

DjVu Small

Сайт: http://www.djvu-soft.narod.ru/scan/djvu_small.htm

DjVu Small - как создать за 4 клика мышки файл DjVu

DjVu Small — как создать за 4 клика мышки файл DjVu

Это одна из самых простых программ для создания DjVu-файлов (из обычных картинок, с которыми все привыкли работать: TIF, JPG, BMP, GIF и PNG). Программа очень удобна, универсальна, работает практически во всех ОС Windows 98/NT/XP/7/8/10.

Отмечу, что программа может как сжимать одну или несколько картинок в DjVu (это называется кодированием), так и разжимать (т.е. декодировать — получить/извлекать из DjVu картинки).

Программа не нуждается в установке. Поддерживает русский интерфейс.

Для сжатия картинок в DjVu в ней необходимо (см. скрин выше):

  1. открыть папку или файлы;
  2. выбрать папку, где будет сохранен полученный файл;
  3. выбрать качество (вот здесь довольно сложно дать конкретную рекомендацию, т.к. выбирать нужно исходя из исходного качества. Для начала я рекомендую выбрать вариант «Default», если качество/размер файла не устроит — поменяете на отличный вариант);
  4. нажать кнопку «Пуск».

 DjVu DocExpress

Сайт: http://www.djvu-soft.narod.ru/soft/

Открываем файл

Открываем файл

Очень мощная программа для создания и редактирования DjVu документов. Например, программа может перевернуть сразу все страницы на 90-80 градусов, создать ссылки на страницы внутри файла или на отдельные страницы в сети интернет.

Что касается создания в ней файла DjVu, то здесь все просто:

  1. сначала открываете одну картинку (любую). Используйте меню «File/Open» (см. скрин выше);
  2. далее щелкаете по картинке правой кнопкой мышки и в меню выбираете вариант «Insert Pages After» (т.е. вставить еще дополнительно картинки после этой). Выбираете сразу 10-20 (или сотню  ) и добавляете в проект. Вставка доп. картинок после этой

    Вставка доп. картинок после этой 

  3. после чего сохраняете полученный файл (меню «File/Save as…»). Необходимо будет задать настройки (рекомендую выбирать качество не менее 300 DPI — а вообще, конечно, нужно попробовать несколько раз самостоятельно сохранить документ при разных настройках, чтобы «почувствовать» когда и в каких случаях что выбирать). Задаем настройки и место сохранения

    Задаем настройки и место сохранения

  4. PdfToDjvuGUI

Сайт: http://www.trustfm.net/software/utilities/PdfToDjvuGUI.php

Главное окно

Главное окно

Одно из самых простейших решений — это PdfToDjvuGUI. Суть в том, что можно создавать DjVu не из картинок (как в предыдущих вариантах), а из PDF файла. В некоторых случаях это гораздо удобнее и быстрее.

Ремарка! Если вы не знаете как создать PDF файл, рекомендую вот эту статью (там несколько способов): https://ocomp.info/kak-sdelat-pdf-fayl.html

После запуска программы, достаточно выбрать файл (кнопка «Add PDF»), а затем кликнуть по кнопке «Generate DjVu» (при необходимости задать настройки сжатия).

После чего запуститься автоматическое конвертирование файла (просто подождите пока «черное» окно будет закрыто). Файл DjVu будет создан в том же каталоге, в котором находился добавленный на конвертацию PDF.

 Онлайн-сервисы конвертирования

Сейчас в сети довольно-таки много сервисов, предлагающих загрузить к ним файл и быстро его конвертировать в DjVu. Конечно, их вряд ли можно использовать для сканированных документов (все-таки, в них часто содержаться личные и корпоративные сведения). Но для примера, приведу парочку вариантов:

  • https://convertio.co/ru/pdf-djvu/ — сервис позволяет быстро перегнать PDF в DjVu (файл не должен превышать 100 Мб);
  • http://djvu2pdf.com/ru/ — еще один сервис (в его арсенале достаточно много направлений конвертирования). По ссылке, которую привел выше, найдете обратный вариант: DjVu в PDF.

Требования к исходным файлам

Если вы решили создать книгу в формате DjVu, произведите ее скан в формате BMP (я использую этот формат), TIFF или PNG. Лучше потренироваться на нескольких страницах, чтобы подобрать правильный режим, поскольку самая трудоемкая часть всех действий — это собственно сканирование.

  • Качество сканирования — не менее 300 DPI (выставляется в программе сканирования). Если выставить меньше — могут возникнуть проблемы с распознаванием текста и чтением мелкого шрифта.
  • Для книг с формулами (где есть мелкие символы) рекомендуют более высокое качество, например 600 DPI.
  • Сканирование нужно производить в полутоновом режиме (градации серого), а не черно-белом.
  • Неплотное прижатие к стеклу сканера (изогнутые строчки, тени) может создавать проблемы с распознаванием текстового слоя.
  • Если через бумагу просвечивает обратная страница книги, рекомендуется подложить под страницу черную бумагу (для этой цели может быть удобен лист тонкого черного картона из набора разноцветных картонок для детских поделок, или что-нибудь подобное).

DjVu Solo

Для создания книги можно использовать бесплатную программу DjVu Solo 3.1 (инсталлятор — 2,1 Мб). Это единственная программа, которая необходима, остальное описанное в этой статье просто улучшает качество получаемой книги.

В бесплатной версии 3.1 этой программы (кажется, ее уже убрали с сайта разработчика) интуитивно-непонятный интерфейс при выборе файлов, поэтому делайте так:

  • Откройте (File-Open) первую страницу (укажите в окне выбора файла формат — например, BMP)
  • Добавьте следующие файлы BMP (Edit — Append page(s)…). Конечно, не по одному, а сразу все. Чтобы при выборе файлов не сбился их порядок, удерживая клавишу ⇧ Shift, щелкните на последний, а затем — на второй файл BMP в окне выбора файлов.

После выбора файлов нужно нажать кнопку Сохранить и выбрать имя файла и режим сжатия (я выбираю Clean).

Кодировщик может «падать» на страницах с грубыми растровыми изображениями — в этом случае их нужно размыть (например, программой IrfanView сделать Blur в выделенных «мышью» прямоугольных областях или выполнить устранение растра плагином Descreen для Adobe Photoshop). Эта проблема у меня встречалась только один раз на одной из старых книг.

Проблема «инь»



Пример ошибки «инь». Красным цветом отмечены проблемные буквы.

В некачественно сделанных сканах кодировщик может заменить похожие буквы, например «и» на «н», и наоборот (так называемая проблема «инь», или «инь-янь»  ). Это связано с особенностями алгоритма сжатия (Transposed Letters in Group 4). Во избежание этого эффекта компания-разработчик предлагает сканировать с разрешением не ниже 300 DPI и выставлять параметр lossless (без потерь).

По ссылке приведен способ, как сделать это в DjVu Solo (нужные параметры есть в файле bitonaltodjvu.conf).

 При этом размер файла растет в 2-4 раза.

Разделение и разворот страниц, удаление полей

Целесообразно нарезать скан на страницы, повернуть их под правильным углом и удалить лишние поля.

 Это можно делать в полуавтоматическом режиме бесплатной программой ScanKromsator (чтобы не выставлять границы вручную — сразу же используйте функцию Draft kromsate).

 Отрезать чем больше — тем лучше, так как поля обычно мешают и при чтении, и при распознавании текста (см. ниже), при этом увеличивая размер итогового файла DJVU.

Добавление текстового слоя

Чтобы книгу можно было не только смотреть, но и производить внутри нее поиск и копировать текст в буфер обмена, целесообразно вставить в нее текстовый слой. Это делается программой FineReader (версии 7 или 8) с неофициальным дополнением DjvuOCR от gencho. При помощи этой программы можно снабдить текстовым слоем уже готовый файл DJVU без его повторного пережатия.

7 версия FineReader может быть использована в бесплатном режиме, поскольку не требуется сохранение результатов распознавания во внешние файлы (для DjvuOCR нужны только те файлики, которые нагенерил сам FineReader внутри своего проекта).

Как сконвертировать jpg в djvu?

Как сконвертировать djvu в jpg?

Icon of «Загрузите jpg-файл»
Шаг 1

Загрузите jpg-файл

Выберите файл, который вы хотите конвертировать с компьютера, Google Диска, Dropbox или перетащите его на страницу.Icon of «Выберите «в djvu»»
Шаг 2

Выберите «в djvu»

Выберите djvu или любой другой формат, в который вы хотите конвертировать файл (более 200 поддерживаемых форматов)Icon of «Скачайте ваш djvu файл»
Шаг 3

Скачайте ваш djvu файл

Подождите пока ваш файл сконвертируется и нажмите скачать djvu-файл

Как редактировать DJVU изображения с помощью Aspose.Imaging Редактор изображений

  1. Кликните внутри области для загрузки файла, чтобы загрузить DJVU файл, или перетащите DJVU файл в эту область
  2. Отредактируйте изображение с помощью одной или нескольких операций, таких как обрезка, поворот, применение фильтра и т. д.
  3. Нажмите кнопку Применить, чтобы применить изменения для каждой операции. Нажмите кнопку Отменить для отмены текущей операции в редакторе
  4. Вы можете использовать кнопки Undo-Redo, чтобы отменить или повторить последние несколько операций
  5. Измените формат выходного изображения, если необходимо; Нажмите на кнопку «Получить результат»
  6. Ссылка на скачивание обработанных изображений будет доступна сразу после завершения операции модификации
  7. Вы также можете отправить ссылку на готовый файл на свой адрес электронной почты
  8. Учтите что файл будет удалён с наших серверов после 24 часов, а ссылки для загрузки прекратят работу после этого периода времени

DJVU Graphics File Format

DjVu, произносится как «déjà vu», представляет собой графический формат файлов, предназначенный для отсканированных документов и книг, особенно тех, которые содержат комбинацию текста, рисунков, изображений и фотографий. Он был разработан компанией AT&T Labs.

Он использует несколько методов, таких как разделение слоев изображения текста и фоновых изображений, прогрессивная загрузка, арифметическое кодирование и сжатие с потерями для битональных изображений

Aspose.Imaging Редактор изображений

  • Инструкция
  • Часто задаваемые вопросы
  • Приложения

Выделяем и копируем текст в djvu файле
Способ 1 – через DjVu Reader

Предположим, что книга уже открыта в читалке, перейдите к нужной странице, затем кликните на верхней панели на иконку пунктирной обводки.

как выделить текст в djvu файле и скопировать его

Если иконки не видно, откройте настройки панелей инструментов и поставьте галочку (включите отображение) возле надписи: «Выбор режима».

Выбор режима

Обведите участок с текстом на странице и нажмите CTRL+T (язык ввода с клавиатуры должен стоять английский, T – это буква из латинского алфавита, а не из русского). Либо кликните по иконке «TXT» сверху.

Затем вставьте скопированный текст куда хотите.

Если вместо кириллицы вставились каракули, измените кодировку документа на CP1251 или западноевропейскую (Windows).

Способ 2 – через WinDjView

Зайдите в меню «Инструменты» — «Выделить текст» или кликните на значок курсора на верхней панели (справа от значка руки). Выделите интересующий вас участок текста, затем нажмите CTRL+C.

как выделить текст в WinDjView

Либо выберите операцию копирования через меню «Правка» – разницы нет. Всё, теперь текст попал в буфер обмена операционной системы. Откройте Word и нажмите CTRL+V.

Способ 3 – через STDU Viewer

Откройте DjVu книгу, затем выберите инструмент «Выделение текста». Зажмите левую кнопку мыши и выделяйте слова на одной или сразу нескольких страницах. Затем нажмите CTRL+C либо CTRL+Insert на клавиатуре.

как выделить текст в STDU Viewer