数据分析
kylinxjd
这个作者很懒,什么都没留下…
展开
-
Pandas DataFrame索引操作
pandas通过查找数据索引原创 2019-08-02 16:22:51 · 1912 阅读 · 0 评论 -
Numpy Random模块
numpy的random模块生成各种指定类型分布的数组原创 2019-08-17 09:56:16 · 180 阅读 · 0 评论 -
python实现KNN算法
K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。原创 2019-08-20 19:16:03 · 312 阅读 · 0 评论 -
Pandas DataFrame合并concat、merge,分组GroupBy
Pandas DataFrame合并,分组操作原创 2019-08-07 16:54:01 · 2533 阅读 · 0 评论 -
pandas读csv出现 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte
在使用Pandas读取csv文件的时候,很可能出现编码不对的情况。这时候可以指定读取编码解决。原创 2019-08-07 09:00:15 · 2168 阅读 · 0 评论 -
Windows安装配置Spark
Windows环境下配置spark+python开发环境原创 2019-08-13 20:10:16 · 187 阅读 · 0 评论 -
Pandas连续数据的离散化,cut、qcut
先创建一个DataFrame测试import pandas as pdimport numpy as npd = pd.DataFrame(np.random.randint(0, 50, (10, 6)), index=list('ABCDEFGHIJ'), columns=list('abcdef'))1、等宽法、将数...原创 2019-08-08 15:32:08 · 1066 阅读 · 0 评论 -
Pandas透视表
透视表可以根据一个或多个键对数据进行聚合,并根据行和列上得分组建将数据分配到各个矩形区域中。在Python和pandas中,也有透视表的使用。原创 2019-08-05 10:05:25 · 548 阅读 · 0 评论 -
Pandas-DataFrame描述统计函数
pandas描述统计函数: 求和、中位数,平均值,方差,相关系数。。。。原创 2019-08-03 10:30:45 · 6442 阅读 · 0 评论 -
Padas DataFrame添加、删除、异常数据处理操作
pandas添加、删除DataFrame行、列处理异常数据原创 2019-08-02 19:08:49 · 4136 阅读 · 0 评论 -
DataFrame多重索引
DataFrame多重索引,分组计算原创 2019-09-05 15:15:47 · 13808 阅读 · 6 评论