pandas高级篇

最新推荐文章于 2024-12-06 16:25:09 发布

messi_james

最新推荐文章于 2024-12-06 16:25:09 发布

阅读量1.3k

点赞数 1

本文链接：https://blog.csdn.net/MESSI_JAMES/article/details/80805729

版权

1.pandas数据分割,cut()

cut:是将数据划分成几个区间，每个区间长度一样，区间数据个数不一定一样
qcut:划分区间只能是0—1之间数，差值是分位数，包含0和1，按分位数划分，如果差值a小于1，就没有1000个值，共a*1000个数

这里写图片描述

2.pandas数据过滤和筛选

np.random.seed(number) number是生成随机数的种子
np.random.randn() 默认生成随机数的种子数是当前时间的时间戳
定义一个种子数,种子数只能用一次
这里写图片描述

3.pandas读取文件数据

（1）pd.read_csv()
这里写图片描述
（2）pd.read_table()，默认逗号分隔，使用sep指定分隔符

（3）读取没有标题的csv文件，手动指定数据标题

添加names，即指定列索引

通过添加columns，指定行索引

（4）.将读取的数据进行层次化索引