tesseract-ocr是一个支持中文识别的引擎,小编为您带来了tesseract-ocr3.02版本,还附带上了简体中文的语言包,你可以用来开发识别图片中文的项目!
tesseract-ocr介绍
Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。 Tesseract最初由HP公司开发,后来由Google接盘。
tesseract-ocr安装步骤
1、运行exe安装程序
2、点击接受许可协议
3、点击下一步
4、选择安装目录
5、一直点下一步,然后点安装,安装完成!
测试tesseract-ocr识别效果
首先,建立在桌面建立一个test文件夹,里面放一张有中文的图片tset.png
cd到这个目录,输入tesseract tset.png output_1 -l chi_sim
运行成功,进入test文件夹查看效果
多了一个output_1.txt文件,里面有东坡下载四个字,完美识别了test.png里面的文字。
- PC官方版
- 安卓官方手机版
- IOS官方手机版