如何将图片上的文字信息提取出来,图片识别文字工具
创始人
2025-12-08 21:09:11
0

在日常办公或者学习中,经常会出现这样的工作场景,比如“老王,我这里有一张图片,请帮我整理一下里面的文字信息。” 已经是 2021 年了,你还真的还在用手打字。 图片文字信息? 所以赶快收藏这本秘籍吧。 这里我总结了三种方法教大家如何从图片中提取文本信息以及如何将图片转换为文本信息。

自动打码软件源码_源码自动软件打码怎么设置_自动打码脚本

方法一:QQ/微信聊天工具

是的,你没看错,就是QQ聊天工具。 新版微信还支持从图片中提取文字信息,还支持翻译。 相信大多数人应该都用过,而且效果也很好!

自动打码脚本_自动打码软件源码_源码自动软件打码怎么设置

这种方式比较适合移动操作,识别效果也很强大。 建议操作!

自动打码脚本_源码自动软件打码怎么设置_自动打码软件源码

方法二:在线图文识别工具

直接在百度上搜索就可以找到很多图像和文字识别工具。 大多数应该是通过调用接口封装的Web工具。 操作比第一种复杂。 毕竟,您需要上传文件,然后下载文件。

自动打码软件源码_源码自动软件打码怎么设置_自动打码脚本

例如:

你可以尝试这个方法。 互联网上有很多这样的工具。 如果图像识别量较小,可以免费使用。 切韭菜时要小心。 当然,识别率并不是100%,大家不妨尝试一下,仅供参考!

自动打码软件源码_源码自动软件打码怎么设置_自动打码脚本

自动打码脚本_自动打码软件源码_源码自动软件打码怎么设置

方法三:使用Python编写图像识别文字工具(操作比较俏皮,仅用于安装)

炫酷的操作来了,我们可以用python自己写一个工具脚本,图片识别文字工具脚本,可以批量操作,解放双手。 当然,这只是为了安装。 当然,我这么渣,肯定是直接调用接口的。 !

方法一:EasyOCR库

Python中有一个不错的OCR库——EasyOCR,它在GitHub上有9700个star。 可以在python中调用它来识别图像中的文本并将其输出为文本。

自动打码软件源码_自动打码脚本_源码自动软件打码怎么设置

EasyOCR支持80多种语言的识别,包括英语、中文(简体和繁体)、阿拉伯语、日语等,并且该库正在不断更新,未来将支持更多语言。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple easyocr

注意:EasyOCR库比较大,一定要换成国内源自动打码软件源码,不然就要等到时间结束了!

自动打码脚本_自动打码软件源码_源码自动软件打码怎么设置

EasyOCR的使用非常简单,分为三步:

1、创建识别对象; 2. 阅读并识别图像; 3.导出文本。

参考源码:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en']) 
# 读取图像
result = reader.readtext('test.jpg')
# 结果
print(result)

遗憾的是,调试并没有成功。 我还不知道问题所在。 我将问题发布出来,有知道的人可以给我一些建议!

源码自动软件打码怎么设置_自动打码脚本_自动打码软件源码

错误信息:

E:\Python\venv\scripts\python.exe E:/Python/twsb/ff2.py
E:\Python\venv\lib\site-packages\skimage\io\manage_plugins.py:23: UserWarning: Your installed pillow version is < 7.1.0. Several security issues (CVE-2020-11538, CVE-2020-10379, CVE-2020-10994, CVE-2020-10177) have been fixed in pillow 7.1.0 or higher. We recommend to upgrade this library.
  from .collection import imread_collection_wrapper
CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.
Downloading detection model, please wait
Traceback (most recent call last):
  File "E:/Python/twsb/ff2.py", line 4in 
    reader = easyocr.Reader(['ch_sim','en'])
  File "E:\Python\venv\lib\site-packages\easyocr\easyocr.py", line 170in __init__
    urllib.request.urlretrieve(model_url['detector'][0] , DETECTOR_PATH)
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\urllib\request.py", line 247in urlretrieve
    with contextlib.closing(urlopen(url, data)) as fp:
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\urllib\request.py", line 222in urlopen
    return opener.open(url, data, timeout)
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\urllib\request.py", line 531in open
    response = meth(req, response)
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\urllib\request.py", line 640in http_response
    response = self.parent.error(
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\urllib\request.py", line 569in error
    return self._call_chain(*args)
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\urllib\request.py", line 502in _call_chain
    result = func(*args)
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python38\lib\urllib\request.py", line 649in http_error_default
    raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 403: Forbidden

Process finished with exit code 1

方法二:ORC(tesseract-ocr)识别

安装pytesseract库首先要安装它所依赖的PIL和tesseract-ocr。 PIL是图像处理库,后续的tesseract-ocr是Google的OCR识别引擎。

安装 tesseract-ocr。 对此,没什么好说的。 下载程序,单击“下一步”并按照安装步骤进行安装!

自动打码脚本_自动打码软件源码_源码自动软件打码怎么设置

不过需要配置系统环境变量自动打码软件源码,或者调用程序时需要指明该工具的路径,即安装后tesseract.exe的路径!

自动打码脚本_源码自动软件打码怎么设置_自动打码软件源码

关于配置系统环境变量,可以自行百度配置。 这里没有配置。 可以直接指明应用路径地址:

pytesseract.pytesseract.tesseract_cmd = r'D:/Program Files/Tesseract-OCR/tesseract.exe'

注意:

下载 chi_sim.traindata 字体。 这是识别中文所必需的。

下载后放置在Tesseract-OCR项目的tessdata文件夹中。

自动打码脚本_源码自动软件打码怎么设置_自动打码软件源码

为了方便大家测试和使用,我这里封装了一个工具包!

相关内容

热门资讯

3... 3D模型制图可以经常使用以下几款软件: CATIA是法国达索公司的产品开发旗舰处置打算。 作为P...
3... 一 玩3D建模,电脑性能须要高配还是低配? 这个必定是高配,低配你电脑卡的就间接就跑不动了,你往罕用...
3... Solidworks性能要求: 1、内存:不低于16G,介绍32GB或以上,越高越好。 2、CPU:...
这... 一、维度不同 1、3D是指三维设计。 2、平面设计是二维设计。 二、真切度不同 1、3D更为初级,维...
手... 1、手机平面设计制图软件有:设计君、CAD看图王、设计本装修、来画设计、懒设计。 设计君这个运行...
沧... 北大青鸟。 沧州北大青鸟是沧州市一家广为人知的计算机培训学校,目前曾经开设了多种IT抢手专业课程...
o... office 办公(音:哦麻烦)microsoft office 微软办公软件就是咱们常说的办公软件...
罕... 罕用的办公软件有:Microsoft Office系列软件、WPS Office、Adobe Acr...
办... 《办公软件初级运行案例教程》是一本专为初等教育的“计算机基础”课程更新而设计的教材,旨在深化在校生的...
学... 一、电脑培训学校培训时期要多久关于这个疑问,答案是不固定的,然而普通来说电脑培训的时期有3个月、6个...
天龙白银APP忽悠投资者,欺骗...   华通白银公司的天龙白银APP忽悠投资者,欺骗投资者,广告忽悠投资者能月入过万,小投资高回报;欺骗...
o... Office的软件有多种,常常出现的包括Microsoft Office的套件。这类软件包括以下几种...
北... 北京办公软件培训班介绍北大青鸟、达内教育。 1、北大青鸟 北大青鸟职业教育,由北大青鸟与印度阿博泰克...
w... 1. 定义差异:Office是一套宽泛经常使用的办公软件品牌,蕴含Word、Excel、Outloo...
E... Excel表格是指Microsoft Office Excel电子表格软件。 Microsoft O...
办... 办公软件重要包括Microsoft Office系列、WPS Office、Google Works...
秒... 挺好的,我就是买了秒可职场的办公软件的组合课。 副业赚钱+职场技艺优化,一箭双雕,学上去还是挺适...
不... 不属于计算机软件的是显示适配器。 计算机软件包含: 1、操作系统软件,是计算机系统软件的外围,一切的...
什... 什么是数据库治理系统?它的关键配置是什么?数据库治理系统(DBMS)是一种关键的软件系统,它准许用户...
国... 机房工程是修建默认化系统中无法或缺的一环。 在消息中神思房树立之初,咱们必定遵照关系规范启动机房...