- pandas 是什么?最简单通俗的理解,pandas就是python一个现成的数据分析库,最常用的基本库。
- pandas 收费么?免费的
- pandas 怎么安装?最简单的方法,pip install pandas, 如果是在PyCharm环境下,当你输入 import pandas as pd时,如果看到pandas高亮为红色,点击右键直接安装就可以,安装好后,pandas字体颜色显示灰色正常
- pandas 在数据分析中怎么用?
1)先要导入pandas模块
import pandas as pd
2)用pandas打开文件,如csv文件
df =pd.read_csv(r'文件路径\文件名.csv')
df 是定义的变量名,可以根据自己的文件内容进行自己定义,如home等等
3)可以先查看文件的前面几行内容,大概判断下自己想要分析的内容
df.head(3)
df 就是你的文件名,即上面自定义的变量名home
4) 可以进行数值的升降排序
降序排列,ascending(上升的)等于True就是升序,等于False就是降序
df.sort_values(by='列的名称',ascending=False).head()
5)还可以进行数据筛选后再进行排序,一目了然的看到结果
示例如,先筛选想要的列,再进行数值降序排列
house_shaixuan=house[['建筑面积','户型','装修','總價']]
house_shaixuan.sort_values(by='建筑面积',ascending=False).head()
6)有时需要根据现有数据计算得出想要的数值,在进行排序
示例如,先算单价,再进行升序排列
house['单价'] = house['總價']/house['建筑面积']
house.sort_values(by='单价',ascending=True).head(3)
head后面括号里的数字如果不写,默认是前五行,可以自己随意填写数字,也可以将head(头) 改成tail(尾),意思就是要看后面几行
如果csv 文件格式换成Excel,也是一样的。
不过要注意的是Excel文件名的尾部是.xls(93-07的兼容版)或者…xlsx(07后的版本),这个文件名点击右键属性就可以看见,在写代码的别忽略了