Fakir> Вот, например, "Наука и жизнь" отсканирована чуть ли не за всю историю с позапрошлого века (!) - и все номера, что мне попадались - как раз в DjVu с текстовым слоем.
Не часто исключение. Хотя, учитывая количество номеров — может, они и составляют половину твоей коллекции?

...
Сейчас бегло посмотрел по журналам в DjVu моей коллекции, резюме такое:
«НиЖ» — более-менее качество распознавания (хотя ошибки распознавания есть), но сильно вредят жёсткие переносы в конце строк. Переверстать текст, если нужно его использовать — много работы.
«ТМ» — 50/50/46. Есть вообще без текстового слоя, есть с кривым текстовый слоем в виде латинской распознавалки (т.е. одни кривые знаки препинания), есть файлы с русским слоём, но ужасающего качества, совершенно непригодно для использования, быстрее ручками перенабить

«ХиЖ» — русский слой есть, качество паршивое. Хотя и лучше, чем варианты с ТМ.
«ЮТ для умелых рук» — русский слой есть в четверти файлов, качество ужасное. Rстати, чтобы понять, о чём речь идёт, короткий пример:
с чеrо начать! - такой вопрос зада-
ет каждый, кто решип заняться радио-
эпектроникой. Этим выпуском мы по-
Сi"араемся помочь всем жеп"ющим сде-
лать первые шаrи в интересный мир
радиопюбитеi1ьства.
В книгах... Ну, я бы сказал, что текстовый слой есть более чем в половине из тех, что просмотрел. Так что был не прав, считая, что он бывает совсем уже редко. Но для практического использования тоже, как правило, бесполезен. И ошибок распознавания много, и переносы жёсткие...