python使用tesseract实现字符识别功能

2024-10-25 09:10 开发作者： for(::)

介绍

Tesseract 是一个android开源的光学字符识别（OCR）引擎，它能够识别多种语言的文本，可将扫描文档、图像中的文字提取并转换为计算机可编辑的文本格式。

1. 安装tesseract

首先到下列地址处，下载tesseract安装程序，并安装。

tesseract下载地址(第三方非官网)

https://digi.bib.uni-mannheim.de/tesseract/

python使用tesseract实现字符识别功能

安装完成后，进入安装目录找到tesseract.exe，并且拷贝路径，然后到编译器编写python代码。

2. 编写python代码

import cv2
import pytesseract

# 指定 Tesseract-OCR 可执行文件的路径
pytesseract.pytesseract.tesseract_cmd = "D:\\computer_vision_lib\\tesseract-ocr5.3\\tesseract.exe"

# 选择一张要识别的字符图片
img = cv2.imread("test.png")
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 使用 Tesseract-OCR 进行文字识别，并返回识别到的字符
print(pytesseract.image_to_string(img))
print('--android'*10)

# 获取每个字符的边界框的坐标
print(pytesseract.image_to_boxes(img))

hImg, wImg, _ = img.shape
boxes = pytesseract.image_to_boxes(img)
for b in boxes.splitlines():
   js b = b.split(' ')
    x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(img, (x, hImg - y), (w, hImg - h), (0, 0, 255), 3)
    cv2.putText(img, b[0], (x, hImg - y + 25), cv2.FONT_HERSHEY_COMPLEX, 1, (50, 50, 255),javascript 2)

cv2.imshow("Image", img)
cv2.waitKey(0)

执行截图如下：

python使用tesseract实现字符识别功能

到此这篇关于python使用tesseract实现字符识别功能的文章就介绍到这了,更多相关python tesseract字符识别内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希php望大家以后多多支持编程客栈(www.devze.com)！

继续阅读：python tesseract python tesseract实现字符识别 python字符识别

python使用tesseract实现字符识别功能

目录

介绍

1. 安装tesseract

2. 编写python代码

更多精彩内容

精彩评论

最新开发

golang定时器案例详解

golang中使用aes加密的操作方法

golang unique包和字符串内部化优化技巧

Go语言的GoRoot和GoPath的区别小结

C++ STL中容器string超详细讲解

开发排行榜

springboot后端存储富文本内容的思路与步骤(含图片内容)

PyCharm运行python测试,报错“没有发现测试”/“空套件”的解决

return base64.b64encode(b).decode(

基于C语言实现钻石棋游戏的示例代码

Sublime Text 3解决中文乱码问题（实测可用）