继续接着上次的,总结这段时间在使用Python过程中遇到的问题与解决方法。
1. 正则表达式的使用(re)
import re
# 表达式编译
pattern = re.compile(r'^1[35789]\d{9}$')
# 如果存在匹配结果为True,否则为False
pattern.match(inst)
2. 在数据量特别大时,直接使用dataframe分片的效率优于使用groupby
#使用groupby
info_group = data.groupby('info')
for info,group in info_group:
print(info,group)
#使用dataframe分片
info_list = data['info'].dropna().values
for user_id in range(len(info_list)):
print(info_list[user_id])
group = data[(data['info'] == info_list[user_id])]
3. 画直方图(matplotlib.plyplot)
一个特别详细的例子
这里还有一个点画直方图时,赋给label的值如果是以下划线开头的,那么在图例中不显示,所以必须在变量前套上一个空格再赋给label