欢迎来到 黑吧安全网 聚焦网络安全前沿资讯,精华内容,交流技术心得!

python小脚本-提取邮箱

来源:本站整理 作者:佚名 时间:2016-10-17 TAG: 我要投稿

使用python正则表达式,在一堆各种字符中提取是邮箱名的字符串。
import refile = open("AT.txt")c=[]for line in file.readlines():
    contant = re.findall(r"[\w\d\.-_]+(?=\@)",line)    mail=list(set(contant))    for i in mail:        if i != "":            print i            c.append(i)Num = len(c)print Num
正则表达式[\w\d\.-_]+(?=\@)解析:
首先理解字符集,字符集所在位置可以是字符集中任意所以开始[\w\d\.-_]代表可以出现则代表邮箱@之前可以出现字母、数字、.、-、_。紧接在[]字符集之后+代表至少要匹配一次,说明@之前可以有多个字符,(?=\@)则表示之前的字符指导@截止,并且@不计算在之内。
list(set(contant))用于去除里面相同的邮箱名
for i in mail:这个for循环体,代表去除re.findall查找结果中的空列表。
 

【声明】:黑吧安全网(http://www.myhack58.com)登载此文出于传递更多信息之目的,并不代表本站赞同其观点和对其真实性负责,仅适于网络安全技术爱好者学习研究使用,学习中请遵循国家相关法律法规。如有问题请联系我们,联系邮箱admin@myhack58.com,我们会在最短的时间内进行处理。
  • 最新更新
    • 相关阅读
      • 本类热门
        • 最近下载