1.求和 sum()
对每一列的数据进行求和
import pandas as pd
data = pd.read_excel('表格名.xlsx')
a = data.sum()
print(a)
注:非数值的列会被连接在一起称为一个字符串。
单独列求和
import pandas as pd
data = pd.read_excel('表格名.xlsx')
a = data['列标签'].sum()
print(a)
2.求平均值 mean()
使用方法和求和是相同的,同类的还有求最大值 max() 求最小值min()
3.获取数值的分布情况,即数据个数,平均值,最值,方差,分位数(25%,50%,75%)
使用describe() 书写方式与求和相同,也可单独列求分布情况。
4.炫酷词云图
这里需要安装一个库 Wordcloud
pip install Wordcloud
1.以空格作为分隔符,将文本隔为词语
2.同一个词语出现的次数越多,在图片中越大
3.对一些没有意义的词语会被自动过滤掉
4.中文需要导入相应的字体