python的正则表达式使用方法

在Python中,使用正则表达式进行数据提取可以使用re模块。下面是5个常用的正则表达式函数和使用示例:

  1. re.findall(pattern, string):
    该函数用于在字符串中找到所有匹配的子串,并返回一个包含所有匹配项的列表。示例:
   import re
   text = "Hello, my name is John. I live in New York."
   matches = re.findall(r"\b\w+\b", text)
   print(matches)  # 输出:['Hello', 'my', 'name', 'is', 'John', 'I', 'live', 'in', 'New', 'York']
  1. re.search(pattern, string):
    该函数用于在字符串中搜索第一个匹配的子串,并返回一个匹配对象。示例:
   import re
   text = "Hello, my name is John. I live in New York."
   match = re.search(r"\b\w+\b", text)
   if match:
       print(match.group())  # 输出:Hello
  1. re.match(pattern, string):
    该函数用于在字符串的开头搜索第一个匹配的子串,并返回一个匹配对象。示例:
   import re
   text = "Hello, my name is John. I live in New York."
   match = re.match(r"\b\w+\b", text)
   if match:
       print(match.group())  # 输出:Hello
  1. re.sub(pattern, repl, string):
    该函数用于在字符串中搜索匹配的子串,并用指定的字符串替换它们。示例:
   import re
   text = "Hello, my name is John. I live in New York."
   new_text = re.sub(r"\bJohn\b", "Michael", text)
   print(new_text)  # 输出:Hello, my name is Michael. I live in New York.
  1. re.split(pattern, string):
    该函数用于根据正则表达式的匹配项分割字符串,并返回一个分割后的子串列表。示例:
   import re
   text = "John, Michael, David, Sarah"
   names = re.split(r",\s*", text)
   print(names)  # 输出:['John', 'Michael', 'David', 'Sarah']

已发布

分类

标签:

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注