字符
. 匹配除\n外的任意字符\ 转义字符,使后一个字符改变原来的意思[] 字符集(字符类),对应字符集中的任意字符# _*_ coding:utf-8 _*_import remy_str = '''konmgzhagen.com.cn kongyicheng.com.cn'''# 点不能匹配换行\n(这一条匹配不到)dot = re.search('cn.*kong',my_str).group()# \可将点转成真正的字符Escape = re.search('kong.*\.cn',my_str).group()print Escape# 以o开头,后面是n或m的字符串chartSet = re.search('o[nm]',my_str).group()print chartSet结果:AttributeError: 'NoneType' object has no attribute 'group'kongyicheng.com.cnon
预定义字符集
\d 数字[0-9]\D 非数字\s 空格 \S 非空格\w 单词字符\W 非单词字符
数量词
* 匹配前一个字符0或无限次+ 匹配前一个字符1或无限次? 匹配前一个字符0或1次{m} 匹配前一个字符m次{m,n} 匹配前一个字符m到n次
边界匹配
^ 匹配字符串开头$ 匹配字符串结尾\A 仅匹配字符串开头\Z 仅匹配字符串结尾
常用的re模块方法
re.match() 从字符串的开头匹配,匹配一次re.search() 从字符串的任意位置开始匹配,匹配一次re.findall() 从字符串的任意位置开始匹配,返回一个列表re.finditer() 从字符串的任意位置开始匹配,返回一个迭代器,适合大数量的匹配
# _*_ coding:utf-8 _*_ import re my_str = 'I am python modules test for re modules am' print re.match('I am',my_str).group() print re.search('am',my_str).group() print re.findall("modules",my_str) for e in re.finditer("modules",my_str): print e.group() 结果
I am
am['modules', 'modules']modulesmodules