#记录日常工作中用到的功能
一、matplotlib库
(1)导库
import matplotlib.pyplot as plt
from matplotlib.pyplot import MultipleLocator
from matplotlib.font_manager import FontProperties
import pandas as pd
import numpy as np
(2)读取数据
假设数据储存在Excel/csv等文件格式中
file_path = ‘你的文件路径‘
df = pd.read_excel(file_path, sheet_name='指定sheet名')
(3)数据处理
pandas读取的Excel后生成dataframe格式,对其中异常值的处理主要有:
异常情况 | 方法 |
单元格内无内容 | df.fillna(0, inplace=True) |
筛选指定数值范围 | df_filtered= df[(df['column']>0)&(df['column'])<100] |
(4)绘图
1.中文字符显示问题
font_path = '字体储存的绝对路径'
#字体文件格式为ttf,下载后放在同一目录下
myfont = FontProperties(fname=font_path)#绘图时指定myfont
2.图像种类
类型 | 方法 |
散点图 | scatter |
折线+点 | plot.scatter(x,y,kind='line') |
3.坐标轴
类型 | 方法 |
坐标轴范围 | plt.ylim('数值范围') |
不显示坐标轴 | plt.xlim([]) |
修改间隔 | yticks = plt.gca().yaxis.set_major_locator(MultipleLocator(0.5)) |
4.图像大小
画布大小 | plt.figure(figsize=(15,7)) |