基本的な手順は基本的にReadMe(http://code.google.com/p/tesseract-ocr/wiki/ReadMe)のまま。
tesseract-3.01.tar.gzと適当にランゲージパック的なのを展開する。今回は英語。
tar zxvf tesseract-3.01.tar.gz
tar zxvf tesseract-ocr-3.01.eng.tar.gz
あ、そうそう、予めライブラリ類のインストールが必要です。cp tesseract-ocr/tessdata/* tesseract-3.01/tessdata/
sudo apt-get install autoconf automake libtool libpng12-dev libjpeg62-dev libtiff4-dev zlib1g-devんでもってコンパイル&インストール
./autogen.sh
./configure
make
sudo make installインストールが終わったら、tesseractで起動だっ…と思ったら、ライブラリがない的なこと言われる。
ぐぐると、http://markmail.org/message/2eqkprradbcrj2cp#query:+page:1+mid:ubdnj2daq47witkv+state:results
ldconfigでライブラリ類が整理されるっぽくて起動できるようになった。
11.10.31 22:19追記
ランゲージパック的なのは後から入れないとだめっぽいです。嘘つき。
sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata/