1、清洗手机号码
import re # 导入正则化模块
import numpy as np
import pandas as pd
# 清洗手机号码
s = ('13115021381','18277122391','17823912311','20218231923','138291229811') # 输出手机号码的数据,其中第4个数据不是手机号码(开头不是1)、第5个数据不是手机号码(有12位)
pattern = r'[1][35789]\d{9}$' # 设置正则化匹配的模式,手机号码是11位,第1位是1,第2为是35789中的一个,然后剩下9位数,用\d{9}来完成,最后用$表示结尾(即只匹配11个数)
a = [] # 设置空列表
for data in s: # 对列表中的元素进行遍历
if re.findall(pattern,data) != []: # 设定匹配的结果,不要空list
a.append(data) # 当不是空list的时候,向数组中添加元素
a # 查看清洗得到的结果,可以看到'20218231923'和'138291229811'这两个假手机号码被清洗掉了
2、清洗座机号码
s= ['010-28172132','0231-3817212','031-42312772','023-498281211','0131-39897123','0102321231'