脚本专栏 
首页 > 脚本专栏 > 浏览文章

python识别文字(基于tesseract)代码实例

(编辑:jimmy 日期: 2025/1/19 浏览:3 次 )

这篇文章主要介绍了python识别文字(基于tesseract)代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Ubuntu版本:

1.tesseract-ocr安装

sudo apt-get install tesseract-ocr

2.pytesseract安装

sudo pip install pytesseract

3.Pillow 安装

sudo pip install pillow

开始写代码:

from PIL import Image
from pytesseract import pytesseract
image = Image.open('test.png')
code = pytesseract.image_to_string(image,lang='chi_sim')
print(code)

报错了:

python识别文字(基于tesseract)代码实例

找到路径,发现没有chi_sim.traineddata这个训练包

# 安装训练数据(equ为数学公式包)
sudo apt-get install tesseract-ocr-eng tesseract-ocr-chi-sim tesseract-ocr-equ

安装之后就会有训练包了,可以正常运行。

python识别文字(基于tesseract)代码实例

英文识别正确率较高,中文就比较鸡肋了。

python识别文字(基于tesseract)代码实例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

上一篇:Python爬虫运用正则表达式的方法和优缺点
下一篇:numpy求平均值的维度设定的例子
一句话新闻
Windows上运行安卓你用过了吗
在去年的5月23日,借助Intel Bridge Technology以及Intel Celadon两项技术的驱动,Intel为PC用户带来了Android On Windows(AOW)平台,并携手国内软件公司腾讯共同推出了腾讯应用宝电脑版,将Windows与安卓两大生态进行了融合,PC的使用体验随即被带入到了一个全新的阶段。
友情链接:杰晶网络 DDR爱好者之家 南强小屋 黑松山资源网 白云城资源网 站点导航 SiteMap