TH_NUM的博客

日常积累

pandas常用用法

1.将DataFrame里面的数值提取成list userList=list() userList= userList + df1['userID'].values.tolist() 2 . 构造含有index的dataFrame actData = pd.DataFrame(index...

2018-07-19 17:15:34

阅读数:36

评论数:0

Pandas Rank进行排序

排序和排名 根据条件对Series对象或DataFrame对象的值排序(sorting)和排名(ranking)是一种重要的内置运算。 first: 对于相同的值按照出现的顺序排名 min: 对于相同的值都取小的排名 max:对于相同的值都取大的排名 import pandas a...

2018-07-11 11:42:35

阅读数:440

评论数:0

pandas 将多个DataFrame进行groupBy合并

import pandas as pd df = pd.DataFrame({'uid': [1, 2, 3, 4], 'B': [1, 2, 3, 4], 'C': [4,5,6,7]}) df2=pd.DataF...

2018-07-10 20:14:48

阅读数:158

评论数:0

pandas 对group进行聚合

DataFrameGroupBy.agg(arg, *args, **kwargs) 例子: >>> df = pd.DataFrame({'A': [1, 1, 2, 2], ... ...

2018-07-10 20:04:36

阅读数:125

评论数:0

通过Pandas读取大文件

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取: import pandas as pd f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv') reader = pd.read_csv(f, sep=',', iterator=T...

2018-05-24 16:28:13

阅读数:292

评论数:0

Pandas 行列操作

行选择 不管何时,你调用了一个方法返回或者打印一个DataFrame时,最左边的一列必然是索引值,可以通过index属性来直接访问DataFrame的索引值。 import pandas as pd df1=pd.DataFrame({'name':['kate','herz','cath...

2018-05-24 16:24:37

阅读数:100

评论数:0

python---pandas.merge使用

merge 函数参数 merge: 合并数据集, 通过left, right确定连接字段,默认是两个数据集相同的字段 参数 说明 left 参与合并的左侧DataFrame right 参与合并的右侧DataFrame how 连接方式:‘inner’(默认);还有,‘outer...

2018-05-24 16:08:42

阅读数:57

评论数:0

pandas中apply函数的用法

apply函数可以对DataFrame对象进行操作,既可以作用于一行或者一列的元素,也可以作用于单个元素。 例:列元素 data=np.arange(0,16).reshape(4,4) data=pd.DataFrame(data,columns=['0','1','2','3']) d...

2018-05-24 15:51:30

阅读数:273

评论数:0

python pandas消除空值和空格以及 Nan数据替换

在人工采集数据时,经常有可能把空值和空格混在一起,一般也注意不到在本来为空的单元格里加入了空格。这就给做数据处理的人带来了麻烦,因为空值和空格都是代表的无数据,而pandas中Series的方法notnull()会把有空格的数据也纳入进来,这样就不能完整地得到我们想要的数据了,这里给出一个简...

2018-05-24 13:47:57

阅读数:6552

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭