Python 正则表达式
Last updated
Was this helpful?
Last updated
Was this helpful?
1.点号“.”
一个点号可以代替除了换行符以外的任何一个字符,包括但不限于英文字母、数字、汉字、英文标点符号和中文标点符号。
2.星号“*”
一个星号可以表示它前面的一个子表达式(普通字符、另一个或几个正则表达式符号)0次到无限次。
3.问号“? ”
问号表示它前面的子表达式0次或者1次。注意,这里的问号是英文问号。问号最大的用处是与点号和星号配合起来使用,构成“.*? ”。通过正则表达式来提取信息的时候,用到最多的也是这个组合。
4.反斜杠“\”
反斜杠在正则表达式里面不能单独使用,甚至在整个Python里都不能单独使用。反斜杠需要和其他的字符配合使用来把特殊符号变成普通符号,把普通符号变成特殊符号。
5.数字“\d”
正则表达式里面使用“\d”来表示一位数字。为什么要用字母d呢?因为d是英文“digital(数字)”的首字母。
再次强调一下,“\d”虽然是由反斜杠和字母d构成的,但是要把“\d”看成一个正则表达式符号整体。如果要提取两个数字,可以使用\d\d;
如果要提取3个数字,可以使用\d\d\d。但是如果不知道这个数有多少位怎么办呢?就需要用*号来表示一个任意位数的数字。如:\d*
6.小括号“()”
小括号可以把括号里面的内容提取出来。
Python的正则表达式模块名字为“re”,也就是“regular expression”的首字母缩写。
1.findall
Python的正则表达式模块包含一个findall方法,它能够以列表的形式返回所有满足要求的字符串。