CentOS7にTesseract OCR 5.3をインストールする手順です。
LeptonicaはTesseractの依存ライブラリのため、そちらのインストールも行います。
どちらもソースからのインストールです。
環境
- CentOS7
- Tesseract 5.3.2 (https://github.com/tesseract-ocr/tesseract)
- Leptonica 1.83.0 (http://www.leptonica.org/download.html)
Leptonicaをインストール
Tesseractインストールする際にLeptonicaがインストールされていない場合、エラーとなるため先にインストールを行います。
# cd /usr/local/src
# wget http://www.leptonica.org/source/leptonica-1.83.0.tar.gz
# tar xvfz leptonica-1.83.0.tar.gz
# cd leptonica-1.83.0
# ./autogen.sh
# ./configure
# make
# make install
エラー
configure: error: Your compiler does not have the necessary C++17 support! Cannot proceed.
configure時に上記のエラーが出た場合は以下を追加で実行後、再度configureを実行してください。
# yum install -y centos-release-scl
# yum install -y devtoolset-8-gcc devtoolset-8-gcc-c++
# scl enable devtoolset-8 bash
Tesseractをインストール
# git clone https://github.com/tesseract-ocr/tesseract.git
# cd tesseract
# ./autogen.sh
# ./configure
# make
# make install
エラー
configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.
configure時に上記のエラーが出た場合は以下を追加で実行後、再度configureを実行してください。
# PKG_CONFIG_PATH=/usr/local/lib/pkgconfig/
インストール確認
tesseractコマンドが実行できればインストール成功です。
# tesseract --version
tesseract 5.3.2-12-g0768
leptonica-1.83.0
libjpeg 6b (libjpeg-turbo 1.2.90) : libpng 1.5.13 : libtiff 4.0.3 : zlib 1.2.7
Found AVX512BW
Found AVX512F
Found AVX512VNNI
Found AVX2
Found AVX
Found FMA
Found SSE4.1
Found OpenMP 201511
以上です。
コメント