CentOS 7 安裝 Tesseract 文字辨識 …
本文適用於 CentOS 7.9
1.安裝 Leptonica 需要的套件
yum -y install libjpeg* libjpeg-devel libpng* libpng-devel giflib* libtiff* libtiff-devel zlib* automake libtool centos-release-scl git
2.安裝 gcc8
yum -y install devtoolset-8-gcc*
3.切換之 gcc8
scl enable devtoolset-8 -- bash
4.檢查 gcc 版本
gcc -v
最下方應是出現 gcc version 8.***
5.使用 git 安裝 leptonica
cd ~ git clone https://github.com/DanBloomberg/leptonica.git cd leptonica ./autogen.sh ./configure make make install
6.新增環境變數,在 /etc/profile 新增下列變數
vi /etc/profile 在最後新增 export LD_LIBRARY_PATH=/usr/local/lib export LIBLEPT_HEADERSDIR=/usr/local/include export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig export LIBRARY_PATH=/usr/local/lib export LC_ALL=C export TESSDATA_PREFIX=/usr/local/share/tessdata 讓變數生效 source /etc/profile
7.安裝 tesseract-ocr
cd ~ git clone https://github.com/tesseract-ocr/tesseract.git cd tesseract ./autogen.sh ./configure make make install
如果出現 : configure: error: Your compiler does not have the necessary C++17 support! Cannot proceed.
(1) 檢查是否安裝了 gcc8
(2) 是否切換到了 gcc8
8.檢查是否安裝成功 :
ldconfig
如果出現下列訊息 :
ldconfig: /lib64/libtesseract.so.5 is not a symbolic link
ldconfig: /lib64/liblept.so.5 is not a symbolic link
執行下列命令 :
ln -sf /lib64/libtesseract.so.5 /lib64/libtesseract.5.so ln -sf /lib64/liblept.so.5 /lib64/liblept.5.so
9.檢查版本
tesseract --version
出現下列訊息
leptonica-1.84.0 libjpeg 6b (libjpeg-turbo 1.2.90) : libpng 1.5.13 : libtiff 4.0.3 : zlib 1.2.7 Found AVX2 Found AVX Found FMA Found SSE4.1 Found OpenMP 201511
10.安裝語言包
cd ~ git clone https://github.com/tesseract-ocr/tessdata_best.git cd tessdata_best cp chi* /usr/local/share/tessdata cp eng* /usr/local/share/tessdata cp jpn* /usr/local/share/tessdata
11.語法說明
tesseract 檔名 output -l lang (1)檔名 : 可以是絕對路徑或相對路徑,但不能有非英文的文字 (2)/l 接語系 : 繁體 : -l chi_tra 繁體 + 英文 : -l chi_tra+eng 簡體 : -l chi_sim 日文 : -l jpn
參考資料 :
https://www.modb.pro/db/1689830366843068416