May. 16th, 2014

crower: (Crower)
Давным давно (лет 15 назад) были отсканены конспекты лекций. Качество мерзкое. Страницы просвечиваются насквозь. На оригинале некоторые записи читались очень плохо, а на скане и того хуже. Несколько раз принимался вычитывать, но стоило отложить, как вычитка куда-то девалась, забывалась и в следующий раз всё по-новому. А тут есть mediawiki-сервер, как-то собирал уже сканы (SgKP) в djvu - почему бы вычитку туда не перенести. И вычитывать удобно, и результаты не потеряются. Сейчас как раз потихоньку вычитываю одни ТУ. В оригинале они в десятке pdf и в случае чего искать очень неудобно.

В общем взялся за конвертацию конспектов и завяз. Оказывается формат оригинальных сканов (tif) тулзами так просто не читается. Помучился, повычислял дерево взаимосвязей и собрал:
#!/bin/bash
for ((i=1;i<=97;i++))
   do
   n=`printf "%03d" $i`
   echo $n
   tifftopnm $n.tif | pnmtojpg > $n.jpeg
   cpaldjvu $n.jpeg $n.djvu
   done

Ну и как положено в конце:
djvm -c Lectures.djvu 0*.djvu


Готово. Загружаем на сервер, генерим индекс и теперь можно хоть вмногером вычитывать.

Profile

crower: (Default)
crower

February 2018

S M T W T F S
    123
45678910
11121314151617
181920212223 24
25262728   

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 19th, 2025 10:34 am
Powered by Dreamwidth Studios