Главным преимуществом, сделавшим документы djvu популярными среди пользователей различных областей, несомненно, является специальная технология сжатия сканированного изображения. Технология производит процедуру разделения изначального документа на 3 слоя:
- 1й слой – однобитовая маска (сохраняет все четкие детали документа, в черно белом цвете)
- 2й слой – передний план (сохраняет информацию о цветовой гамме маски)
- 3й слой – задний план (сохраняет текстуру и изображения страницы)
Если учитывать тот факт, что подавляющее большинство книг написано черным шрифтом по белому фону, то есть используется всего 2 цвета, благодаря этому удается получить гигантскую (до 100раз) степень сжатия исходного сканированного документа.
Такие рекордные степени сжатия достигаются за счет JB2-алгоритма, суть которого заключается в том, что при повторе символа в документе, его изображение будет сохранено всего один раз. При сжатии многостраничного документа будет использована общая для всех страниц база общих изображений.
Помимо трех описанных выше слоев при сжатии документа, в формате djvu также используется особый OCR текстовый слой. OCR слой позволяет при просмотре djvu файла, производить поиск по всему документу, а также копировать нужные участки текста.
