CentOS7にTesseract OCR 5.3をインストールする手順です。
LeptonicaはTesseractの依存ライブラリのため、そちらのインストールも行います。
どちらもソースからのインストールです。
環境
- CentOS7
- Tesseract 5.3.2 (https://github.com/tesseract-ocr/tesseract)
- Leptonica 1.83.0 (http://www.leptonica.org/download.html)
Leptonicaをインストール
Tesseractインストールする際にLeptonicaがインストールされていない場合、エラーとなるため先にインストールを行います。
# cd /usr/local/src # wget http://www.leptonica.org/source/leptonica-1.83.0.tar.gz # tar xvfz leptonica-1.83.0.tar.gz # cd leptonica-1.83.0 # ./autogen.sh # ./configure # make # make install
エラー
configure: error: Your compiler does not have the necessary C++17 support! Cannot proceed.
configure時に上記のエラーが出た場合は以下を追加で実行後、再度configureを実行してください。
# yum install -y centos-release-scl # yum install -y devtoolset-8-gcc devtoolset-8-gcc-c++ # scl enable devtoolset-8 bash
Tesseractをインストール
# git clone https://github.com/tesseract-ocr/tesseract.git # cd tesseract # ./autogen.sh # ./configure # make # make install
エラー
configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.
configure時に上記のエラーが出た場合は以下を追加で実行後、再度configureを実行してください。
# PKG_CONFIG_PATH=/usr/local/lib/pkgconfig/
インストール確認
tesseractコマンドが実行できればインストール成功です。
# tesseract --version tesseract 5.3.2-12-g0768 leptonica-1.83.0 libjpeg 6b (libjpeg-turbo 1.2.90) : libpng 1.5.13 : libtiff 4.0.3 : zlib 1.2.7 Found AVX512BW Found AVX512F Found AVX512VNNI Found AVX2 Found AVX Found FMA Found SSE4.1 Found OpenMP 201511
以上です。
コメント