pandas
1. 分组
df.groupby('col_name')
df.groupby(['col1','col2'])
2. 筛选(去掉行)
去掉col_name中包含list内容的行
df[(True^df['col_name'].isin(list))]
去掉col_name中含有str字符串的行
df[(True^df['col_name'].str.contains('str'))]
3. 重命名列名
df..columns = ['col1','col2']
4. 去重
df.col_name.drop_duplicates()
5.加一列
df.loc(:, 'col_name') = df[]
matplotlib
1. 子图
plt.figure(figsize=(26,12))
plt.subplot(221) ---两行两列的第一个图
plt.show()
2. 坐标数值过长如何翻转90度
plt.xticks(x,rotation=90)
3. 将不同范围的数据画到同一张图里
plt.twinx()
plt.twiny()
4. 不同类型的图
线图:plt.plot(x,y,c='royalblue',label='name')
柱状图:plt.bar()
pdf图:n, bins, patches = plt.hist(x_clean,bins='auto',color='whitesmoke',rwidth=0.7)