CentOS 7 安裝 Tesseract 文字辨識

CentOS 7 安裝 Tesseract 文字辨識 …
本文適用於 CentOS 7.9

1.安裝 Leptonica 需要的套件

yum -y install libjpeg* libjpeg-devel libpng* libpng-devel giflib* libtiff*  libtiff-devel  zlib* automake libtool centos-release-scl git

2.安裝 gcc8

yum -y install devtoolset-8-gcc*

3.切換之 gcc8

scl enable devtoolset-8 -- bash

4.檢查 gcc 版本

gcc -v

最下方應是出現 gcc version 8.***

5.使用 git 安裝 leptonica

cd ~
git clone https://github.com/DanBloomberg/leptonica.git
cd leptonica
./autogen.sh
./configure
make
make install

6.新增環境變數,在 /etc/profile 新增下列變數

vi /etc/profile

在最後新增

export LD_LIBRARY_PATH=/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
export LIBRARY_PATH=/usr/local/lib
export LC_ALL=C
export TESSDATA_PREFIX=/usr/local/share/tessdata

讓變數生效
source /etc/profile

7.安裝 tesseract-ocr

cd ~
git clone https://github.com/tesseract-ocr/tesseract.git
cd tesseract
./autogen.sh
./configure
make
make install

如果出現 : configure: error: Your compiler does not have the necessary C++17 support! Cannot proceed.
(1)  檢查是否安裝了 gcc8
(2) 是否切換到了 gcc8

8.檢查是否安裝成功 :

ldconfig

如果出現下列訊息 :

ldconfig: /lib64/libtesseract.so.5 is not a symbolic link
ldconfig: /lib64/liblept.so.5 is not a symbolic link

執行下列命令 :

ln -sf /lib64/libtesseract.so.5 /lib64/libtesseract.5.so
ln -sf /lib64/liblept.so.5 /lib64/liblept.5.so

9.檢查版本

tesseract --version

出現下列訊息

leptonica-1.84.0
  libjpeg 6b (libjpeg-turbo 1.2.90) : libpng 1.5.13 : libtiff 4.0.3 : zlib 1.2.7
 Found AVX2
 Found AVX
 Found FMA
 Found SSE4.1
 Found OpenMP 201511

10.安裝語言包

cd ~
git clone https://github.com/tesseract-ocr/tessdata_best.git
cd tessdata_best
cp chi* /usr/local/share/tessdata
cp eng* /usr/local/share/tessdata
cp jpn* /usr/local/share/tessdata

11.語法說明

tesseract 檔名 output -l lang

(1)檔名 : 可以是絕對路徑或相對路徑,但不能有非英文的文字
(2)/l 接語系 :
    繁體 : -l chi_tra
    繁體 + 英文 : -l chi_tra+eng
    簡體 : -l chi_sim
    日文 : -l jpn

 

 

 

 

參考資料 :
https://www.modb.pro/db/1689830366843068416