crower: (Crower)
crower ([personal profile] crower) wrote2014-05-16 01:59 pm

Как сконвертить tif в djvu

Давным давно (лет 15 назад) были отсканены конспекты лекций. Качество мерзкое. Страницы просвечиваются насквозь. На оригинале некоторые записи читались очень плохо, а на скане и того хуже. Несколько раз принимался вычитывать, но стоило отложить, как вычитка куда-то девалась, забывалась и в следующий раз всё по-новому. А тут есть mediawiki-сервер, как-то собирал уже сканы (SgKP) в djvu - почему бы вычитку туда не перенести. И вычитывать удобно, и результаты не потеряются. Сейчас как раз потихоньку вычитываю одни ТУ. В оригинале они в десятке pdf и в случае чего искать очень неудобно.

В общем взялся за конвертацию конспектов и завяз. Оказывается формат оригинальных сканов (tif) тулзами так просто не читается. Помучился, повычислял дерево взаимосвязей и собрал:
#!/bin/bash
for ((i=1;i<=97;i++))
   do
   n=`printf "%03d" $i`
   echo $n
   tifftopnm $n.tif | pnmtojpg > $n.jpeg
   cpaldjvu $n.jpeg $n.djvu
   done

Ну и как положено в конце:
djvm -c Lectures.djvu 0*.djvu


Готово. Загружаем на сервер, генерим индекс и теперь можно хоть вмногером вычитывать.