Python:收集的一些常用的正则表达式

Python正则表达式库 re 的主要函数:

  • re.match() :只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None
  • re.search():扫描全部字符串
  • re.findall():找到RE匹配的所有子串,并把它们作为一个列表返回。
  • re.finditer():找到RE匹配的所有子串,并把它们作为一个迭代器返回。

如果你多次用到同一个正则表达式,为了提高提高运行效率可以编译它:

例子,检查字符串以什么结尾:

Screen Shot 2015-11-29 at 3.31.01 PM

用ipython的timeit统计执行时间

Screen Shot 2015-11-29 at 3.48.39 PM

通过文件扩展名判断文件类型

无效用户名

检查用户名长度
允许的字符

检查无效电子邮件地址格式

检查无效的URL格式

正整数

负整数

全部整数

正数

负数

所有实数

无效日期格式

12小时制

24小时制

检查HTML标签

无效IP格式

IPv4

IPv6

无效MAC地址

校验密码强度

密码的强度必须是包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间。

校验中文

字符串仅能是中文。

由数字、26个英文字母或下划线组成的字符串:

校验身份证号码

下面是身份证号码的正则校验。15 或 18位。

校验日期

“yyyy-mm-dd“ 格式的日期校验,已考虑平闰年。

校验金额

金额校验,精确到2位小数。

校验手机号

下面是国内 13、15、18开头的手机号正则表达式。(可根据目前国内收集号扩展前两位开头号码)

判断IE的版本

文件路径及扩展名校验

验证windows下文件路径和扩展名(下面的例子中为.txt文件)

提取网页图片

提取页面超链接

匹配HTML标签

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注