开发者

python使用tesseract实现字符识别功能

目录
  • 介绍
  • 1. 安装tesseract
  • 2. 编写python代码

介绍

Tesseract 是一个android开源的光学字符识别(OCR)引擎,它能够识别多种语言的文本,可将扫描文档、图像中的文字提取并转换为计算机可编辑的文本格式。

1. 安装tesseract

首先到下列地址处,下载tesseract安装程序,并安装。

tesseract下载地址(第三方非官网)

https://digi.bib.uni-mannheim.de/tesseract/

python使用tesseract实现字符识别功能

安装完成后,进入安装目录找到tesseract.exe,并且拷贝路径,然后到编译器编写python代码。

2. 编写python代码

import cv2
import pytesseract

# 指定 Tesseract-OCR 可执行文件的路径
pytesseract.pytesseract.tesseract_cmd = "D:\\computer_vision_lib\\tesseract-ocr5.3\\tesseract.exe"

# 选择一张要识别的字符图片
img = cv2.imread("test.png")
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 使用 Tesseract-OCR 进行文字识别,并返回识别到的字符
print(pytesseract.image_to_string(img))
print('--android'*10)

# 获取每个字符的边界框的坐标
print(pytesseract.image_to_boxes(img))

hImg, wImg, _ = img.shape
boxes = pytesseract.image_to_boxes(img)
for b in boxes.splitlines():
   js b = b.split(' ')
    x, y, w, h = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(img, (x, hImg - y), (w, hImg - h), (0, 0, 255), 3)
    cv2.putText(img, b[0], (x, hImg - y + 25), cv2.FONT_HERSHEY_COMPLEX, 1, (50, 50, 255),javascript 2)

cv2.imshow("Image", img)
cv2.waitKey(0)

执行截图如下:

python使用tesseract实现字符识别功能

到此这篇关于python使用tesseract实现字符识别功能的文章就介绍到这了,更多相关python tesseract字符识别内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希php望大家以后多多支持编程客栈(www.devze.com)!

0

上一篇:

下一篇:

精彩评论

暂无评论...
验证码 换一张
取 消

最新开发

开发排行榜