软件大小:56 MB
软件类型:软件源码
软件版本:V4.0.0.20181030
时间:2022-08-12
温馨提示:该页面为Windows软件,不支持手机用户安装使用
Tesseract OCR,原由HP惠普公司开发设计的图像识别库,现已开源。据闻其曾位列图像识别工作能力排名第三,并为广大用户提供4.0.0 for Windows版本。以下是使用步骤:
下载后进行安装。默认情况下程序安装将为您配置系统环境变量,以便在任意文件目录下运行Tesseract。
安装完成后以下路径下将包含相关文件:
tessdata
文件夹:存放语言字库文件,与命令行界面中可能使用的主要参数相匹配的文档。
默认设置中已包含英文字库。
Tesseract-OCR模块可广泛应用于识别短信验证码、车牌识别、图像文字提取等多种场景。
打开DOS页面,输入tesseract
命令。
如果出现预期输出,则表示安装正常。
我准备了一张短信验证码图片,以下是使用Tesseract OCR进行识别的示例代码:
from PIL import Image
import pytesseract
# 打开图片
image = Image.open("sms_code.jpg")
# 使用Tesseract OCR进行识别
text = pytesseract.image_to_string(image)
print(text)
通过以上代码,您可以将图片中的文字提取出来。