Pandas
gaoyueace
GitHub主页:https://github.com/TimeIvyace
展开
-
Pandas数据结构-DataFrame
pandas主要数据对象为Series和DataFrame。 DataFrame DataFrame表示一个表格,是一个经过排列的列表集。具有行和列的索引,所以可以采用分层索引表示高维数据。 可以将长度相同的字典或NumPy数组转换成为DataFrame,例如:data={'a':[3,5,7], 'g':[4.6,24,56], 'b':['aaa','vbb','原创 2017-12-01 11:19:21 · 530 阅读 · 0 评论 -
Pandas数据结构-Series
pandas主要数据对象为Series和DataFrame。 Series Series是一个一维类似数组对象,包含一个数组的数据和一个与数组关联的数据标签。 若不指定索引值,则默认从0开始计数。可以分别使用values和index属性来获取Series的数值和索引值。例如:ser1=pd.Series([1,3,4,3])print(ser1.values)print(ser1.inde原创 2017-12-01 10:18:44 · 330 阅读 · 0 评论 -
Pandas统计特征函数
Python中用于数据探索的库主要是Pandas和Matplotlib,Pandas提供了大量与数据探索相关的函数。这些统计特征函数能反映出数据的整体分布,主要作为Pandas的对象DataFrame或Series的方法出现。 sum():计算数据样本的总和(按列计算) mean():计算数据样本的算术平均数 var():计算数据样本的方差 std():计算数据样本的标准差 corr():原创 2017-12-01 18:06:10 · 4469 阅读 · 0 评论