1.
import matplotlib.pyplot as plt
import seaborn as sns
画子图: plt.subplot(m,n) (m,n)个子图
fig,(ax1,ax2)=plt.subplot(1,2,1):第一个子图
子图设置标题:ax1.set_title(name)
matplotlib画子图时设置总标题:fig.suptitle(name)
控制画图的大小:plt.figure(figsize=(m,n))
画直方图:ax1.hist(x,color="..") 或者sns.displot(x,bins=10,kde=True,color="red") kde:核密度,而且后者画出的直方图会有拟合曲线。
画条形图(类别的特征):plt.bar(x,height=y)或者sns.barplot(x=None,y=None,data=None)
2.
在pandas中.map函数将一个自定义函数应用于Series结构中的每个元素(elements),在DataFrame结构中没有map含函数;DataFrame中用的是.apply(),它作用于DataFrame中的每个行或者列。
如果要判断两个类型是否相同推荐使用 isinstance(a,str)
pandas中.value_counts()的用法:它是查看某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。
sort与sorted函数的区别:
sort 是应用在 list 上的方法,sorted 可以对所有可迭代的对象进行排序操作。
list 的 sort 方法返回的是对已经存在的列表进行操作,无返回值,而内建函数 sorted 方法返回的是一个新的 list,而不是在原来的基础上进行的操作。
sorted语法:sorted(iterable, cmp=None, key=None, reverse=False) iterable -- 可迭代对象;cmp -- 比较的函数,这个具有两个参数,参数的值都是从可迭代对象中取出,此函数必须遵守的规则为,大于则返回1,小于则返回-1,等于则返回0;key -- 主要是用来进行比较的元素,只有一个参数,具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序;reverse -- 排序规则,reverse = True 降序 , reverse = False 升序(默认)。