欢迎来到 黑吧安全网 聚焦网络安全前沿资讯,精华内容,交流技术心得!

中文点选验证码之自动识别

来源:本站整理 作者:佚名 时间:2018-09-12 TAG: 我要投稿

此时匹配的结果就有些惨不忍睹了。所以就换另外一种识别方式-ocr 识别。    
2.OCR识别
这里采用的是腾讯云的OCR-通用印刷体识别(https://cloud.tencent.com/document/product/866/17600)。
参考文档。输入mp图片,返回的是json。

查看json内容,发现包含了图片中的文字、位置和大小等。

同理ap中内容也可以获取。   

此时匹配的时候直接就是匹配文字了。首先获取ap中后三个文字,然后与mp中返回的内容匹配,获取其位置和大小,然后再画矩形即可。
由于比较简单,这里直接贴结果。

匹配相当完美。
0X03 总结
本文用了两种方法来自动识别汉字点选验证码,第一种采用的是opencv的模板匹配,这种方法虽然也可以匹配到,但这种方法缺点就是对于字体形状差异较大的验证码识别率较低。而第二种方法就比较快捷方便了,而且识别度高,比较推荐第二种方法。
当然这两种方法对于简单、“正规”的验证码可以,遇到复杂的、“扭曲的”验证码就不行了。这时候就要用到机器学习了,而本文只是简单的“识别”,将机器学习用到这里,就有些大材小用了。
相关代码:https://github.com/fupinglee/MyPython/tree/master/captcha/Pointselection
0×04 参考
[1]http://bluewhale.cc/2017-09-22/use-python-opencv-for-image-template-matching-match-template.html
[2]https://cloud.tencent.com/document/product/866/17600
 

上一页  [1] [2] [3] [4] 

【声明】:黑吧安全网(http://www.myhack58.com)登载此文出于传递更多信息之目的,并不代表本站赞同其观点和对其真实性负责,仅适于网络安全技术爱好者学习研究使用,学习中请遵循国家相关法律法规。如有问题请联系我们,联系邮箱admin@myhack58.com,我们会在最短的时间内进行处理。
  • 最新更新
    • 相关阅读
      • 本类热门
        • 最近下载