鱼C论坛

 找回密码
 立即注册
查看: 26300|回复: 24

[技术交流] 基于pytesseract的验证码识别

[复制链接]
发表于 2015-4-23 18:02:25 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
大家好,这次给大家带来介绍python的验证码识别的工具。pytesseract是一个很好用图像识别的工具,小白也可以轻松的上手
一、需要的软件
1、pytesseract
2、PIL或者是pillow都可以
3、tesseract-ocr
第一、二两个都可以通过pip安装,第三个百度就可以找到。
二、使用方法
1.先用PIL打开图片
2.调用pytesseract的image_to_string()方法即可,简单吧!
三、测试识别
我们先用PYQT写一个简单的测试界面,方便大家看,如下图:
1.jpg
1.第一组验证上场:
2.jpg
识别的速度很快,基本上是秒杀。:titter:
2.第二组验证上场:
3.jpg
这个识别无压力:victory:
3.第三组验证上场:
4.jpg
这样的字母也是可以的哦:big
4.第四组验证上场:
5.jpg
这个就出了点小的问题,不能直接识别了,可能需要对图像进行处理再识别。:shutup:
四、结语
tesseract是一个很好用的工具,识别率也还可以,就算是小白也可以轻松的使用,大家可以下载下来玩玩,祝大家玩的愉快:victory:

评分

参与人数 3荣誉 +9 鱼币 +19 贡献 +5 收起 理由
wangguohui + 4 + 4 + 2 支持楼主!
小人 + 5 热爱鱼C^_^
~风介~ + 5 + 10 + 3 感谢楼主无私奉献!

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2015-4-23 19:18:39 | 显示全部楼层
能不能提供Demo的下载?谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-6-6 15:29:25 | 显示全部楼层
tesseract-ocr 安装了相应的exe文件,但是还不行,不知道是哪里出了问题?

                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-6-7 20:31:54 | 显示全部楼层
用是可以用了,但是谁能告诉我,我导入电脑截图的“8888”,输出“sass”是什么鬼?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-9-27 17:51:02 | 显示全部楼层
qianczar 发表于 2015-6-6 15:29
tesseract-ocr 安装了相应的exe文件,但是还不行,不知道是哪里出了问题?

大哥,你这个问题是怎样解决的啊?我也碰到这样问题。。。。。
还有tesseract-ocr连接可以发一个吗??
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

匿名鱼油  发表于 2015-11-11 16:05:06
sadas
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具

匿名鱼油  发表于 2015-11-11 16:05:36
yeayee.com有相关的模块
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具

发表于 2015-12-4 12:02:48 | 显示全部楼层
大神帮忙看下,这是什么问题....

Traceback (most recent call last):
  File "/Users/hy/Documents/PyCharm/Test1/t.py", line 12, in <module>
    vcode = image_to_string(image)
  File "/System/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pytesseract/pytesseract.py", line 166, in image_to_string
    errors = get_errors(error_string)
  File "/System/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pytesseract/pytesseract.py", line 114, in get_errors
    error_lines = tuple(line for line in lines if line.find('Error') >= 0)
  File "/System/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/pytesseract/pytesseract.py", line 114, in <genexpr>
    error_lines = tuple(line for line in lines if line.find('Error') >= 0)
TypeError: Type str doesn't support the buffer API
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-12-7 11:15:25 | 显示全部楼层
tesseract-ocr终于安装好了,经测试成功可用哈哈哈哈
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-12-7 11:18:32 | 显示全部楼层
能有代码下载就更好了,或者可以发给我一份么?学习膜拜下!zuoyoux@126.com
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-12-25 11:03:48 | 显示全部楼层
急需!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-2-13 23:14:07 | 显示全部楼层
这样就可以写一个脚本破解简单的验证码了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-3-10 21:07:15 | 显示全部楼层
qianczar 发表于 2015-6-6 15:29
tesseract-ocr 安装了相应的exe文件,但是还不行,不知道是哪里出了问题?

同学你这个问题解决了吗 我也遇到类似的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-4-21 09:53:12 | 显示全部楼层
感觉这个东西很实用啊,不知道复杂一点的东西可以么
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-19 13:56:23 | 显示全部楼层
正在在selenium上需要!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-6-12 21:57:52 | 显示全部楼层
非常感谢分享
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-7-10 09:16:29 | 显示全部楼层
这样就可以写一个脚本破解简单的验证码了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-10-25 07:03:15 | 显示全部楼层
楼主为什么识别率这么高啊,我的都识别不出来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-15 10:31:33 | 显示全部楼层
有源码吗,分享下,谢谢啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-6-1 16:22:13 | 显示全部楼层
bucuo
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-3-28 23:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表