pandas
baidu-liuming
机器学习 深度学习 大数据 自然语言处理 linux python shell hive 算法
展开
-
python获取Pandas列名的几种方法
获取DataFrame虽然是一个比较简单的操作,但是有时候到手边就是写不出来,所以在这里总结记录一下:1.链表推倒式data = pd.read_csv('data/Receipt code January minute trading volume.csv')print([column for column in data])#打印结果['COUNT', 'SUCC', 'FAIL'...转载 2020-04-21 19:50:45 · 2514 阅读 · 0 评论 -
python,dataframe,如何判断某列元素为空,或者判断某个值为空
1.判断某列元素为空print(train[‘列名’].isna())那么将会输出一系列 True 和False, 代表对应结果,True表示当前值为空2.判断某个值为空print (np.isnan(train[‘列名’][0]))输出True 或者False...转载 2020-04-09 21:02:26 · 15245 阅读 · 0 评论 -
pandas:填充缺失值
当数据中存在NaN缺失值时,我们可以用其他数值替代NaN,主要用到了DataFrame.fillna()方法,下面我们来看看具体的用法:1.先来创建一个带有缺失值的DataFrame:import pandas as pdimport numpy as npdf=pd.DataFrame(np.random.randn(5,3),index=list('abcde'),columns=['...转载 2020-04-09 20:59:27 · 4641 阅读 · 0 评论 -
【Python数据分析】Pandas按行遍历Dataframe
Pandas按行遍历Dataframe的方法主要有两种:iterrows()和itertuples(),具体用法如下:# 构建数据集import pandas as pdimport numpy as npN = 20dataset = pd.DataFrame({ 'date': pd.date_range(start='2016-01-01',periods=N,freq...转载 2020-04-09 20:34:33 · 5720 阅读 · 0 评论 -
python数据分析之pandas数据选取:df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]
1 引言Pandas是作为Python数据分析著名的工具包,提供了多种数据选取的方法,方便实用。本文主要介绍Pandas的几种数据选取的方法。Pandas中,数据主要保存为Dataframe和Series是数据结构,这两种数据结构数据选取的方式基本一致,本文主要以Dataframe为例进行介绍。 在Dataframe中选取数据大抵包括3中情况: ** 1)行(列)选取(单维度选取):d...转载 2019-11-03 23:10:31 · 13380 阅读 · 0 评论 -
pandas按行按列遍历Dataframe的几种方式
遍历数据有以下三种方法简单对上面三种方法进行说明:iterrows(): 按行遍历,将DataFrame的每一行迭代为(index,Series)对,可以通过row[name]对元素进行访问。 itertuples():按行遍历,将DataFrame的每一行迭代为元祖,可以通过row[name]对元素进行访问,比iterrows()效率高。iteritems():按列遍历,将Data...转载 2019-11-03 21:28:37 · 10935 阅读 · 0 评论 -
【解决办法】read_csv()第一列作为index
简述在之前读取csv文件的时候,发现第一列被读到了dataframe的column中了,而不是读到了index中,查阅完文档后得到解决。解决办法index_col : int or sequence or False, default NoneColumn to use as the row labels of the DataFrame. If a sequence is give...转载 2019-11-03 20:35:21 · 2446 阅读 · 0 评论 -
pandas打印结果出现省略的解决方案
pandas打印结果的列数或者行数过多,导致出现省略号的解决方案(临时):如图:5行12列只显示出来5行2列暂时可行的解决方案:设置最大显示的行数:pd.set_option(‘display.max_columns’,1000)pd.set_option(‘display.max_columns’,None)设置显示的宽度:pd.set_option(‘display.widt...转载 2019-07-22 00:44:47 · 3857 阅读 · 0 评论 -
pandas.read_csv中的usecols函数实现读取指定列
官方解释如下:usecols : list-like or callable, default None常用的用法为:pandas.read_csv(‘file_name.csv’, usecols = [0,1,2,3]) 读取0,1,2,3也就是前四列,中间的数可以任意指定...转载 2019-07-28 16:26:58 · 21296 阅读 · 2 评论