Pandas
Jakob_Hu
当你无助时
展开
-
Pandas-DataFrame构造
一. DataFrame的构造方式1. 通过list或numpy数组构造DF# -*- coding:utf-8 -*-import pandas as pddf = pd.DataFrame([data = ['a', 'b', 'c'], ['d', 'e', 'f'],['g', 'h', 'i']], columns = ['fi...原创 2017-10-19 17:26:59 · 6605 阅读 · 2 评论 -
Pandas学习笔记(DataFrame基本操作)
对于生成的dDataFrame,下一步进行的是对他的基本操作,增、减、改、查。一. 数据选取 从已有的DataFrame中取出其中一列或几列,并对其进行操作。 Pandas取出DataFrame的列有两种方式,两个方式没有好与坏之分,还是看个人喜欢用哪个#-*- coding:utf-8 -*-import pandas as pddf = pd.Dat...原创 2017-10-25 21:57:47 · 10887 阅读 · 0 评论 -
Pandas-Series基础
Pandas-SeriesSeries构造1)使用列表构造2)使用字典创建SeriesSeries相关方法Series构造1)使用列表构造Series类似于一维数组,有一组数据及一组索引标签组成,# -*- coding: utf-8 -*->>> import pandas as pd>>> obj = pd.Series([4, 7, -5, 3...原创 2019-03-18 20:20:13 · 390 阅读 · 0 评论 -
Pandas——索引对象
索引对象简单索引对象索引对象简单运算append和concat方法difference、intersection和 union方法delete和insert方法drop方法索引对象操作进阶重索引 reindexSeries和DataFrame的索引操作Series索引DataFrame索引通过索引定位(loc、iloc和ix、xs方法)索引排序(sort_index方法)Series索引排序Dat...原创 2019-03-19 21:03:52 · 1378 阅读 · 0 评论 -
Pandas数据对象进阶——Series和DataFrame
Pandas数据对象进阶汇总计算和描述数据sum方法、median方法、mode方法和mean方法idxmin和idxmax方法cumsum和cumprod方法describe方法分位数汇总计算和描述数据在官网上目前Series和DataFrame能够对其数据进行操作的方法有,sum方法、median方法、mode方法和mean方法如上这些方法对数据进行基本的统计计算,1)sum方法...原创 2019-03-21 20:06:00 · 1917 阅读 · 0 评论 -
pandas数据对象进阶——索引对象
pandas数据对象进阶1. Series层次化索引Series创建层次化索引获取Series层次化索引使用Series层次化索引层次化索引使Series与DataFrame相互转换2. DataFrame层次化索引DataFrame创建层次化索引DataFrame行列索引操作3. 重排分级次序层次化索引的层次重排层次化索引指定层级的排序根据级别汇总统计已存在的Series和DataFrame构建...原创 2019-03-21 20:39:37 · 480 阅读 · 0 评论 -
Pandas引入外部文件数据
Pandas引入外部文件数据读取文本文件读取Excel文件数据读取SQL文件读取文本文件读取文本文件所用的函数一般有两个,read_csv() 和 read_table() ,文本文件一般读取的是csv格式和txt格式,#-*- coding:utf-8 -*-import pandas as pdres = pd.read_table('sale.txt', sep = '\t...原创 2019-03-22 13:43:56 · 1082 阅读 · 0 评论 -
数据规整化(一)——合并
数据规整化——合并1. 数据库形式的合并1)merge方法参数说明基本使用merge方法on相关参数merge方法index相关参数merge方法how参数笛卡尔积与多列一同merge2)join方法基本使用join方法how参数join方法合并两个以上DataFrame2. 轴向连接(concat方法)参数说明concat方法axis参数concat方法join参数concat方法join_ax...原创 2019-03-23 22:35:53 · 886 阅读 · 0 评论 -
数据规整化——重塑和旋转
重塑和旋转1. 重塑索引stack方法1)基本使用2)dropna参数3)level参数unstack方法1)基本使用2)level参数stack 和unstack方法配合使用格式转换——pivot方法1)基本使用2)value参数1. 重塑索引重排索引使用的是pandas模块的 stack和 unstack方法,stack方法1)基本使用对DataFrame使用stack方法可以看做...原创 2019-03-24 23:53:21 · 460 阅读 · 0 评论 -
数据规整化——数据转换
数据转换1. 去除重复数据判断数据是否重复——duplicated方法去除重复项——drop_duplicates方法1)基本使用2)subset参数3)keep参数2. 将映射用于数据转换——series对象map方法3. 替换值——replace方法1)一个值替换为另一个值2)多个值替换为一个值3)一次性替换多个值列表形式字典形式4. 索引重命名index对象的map方法(原数据上改动)ind...原创 2019-03-25 19:15:09 · 1594 阅读 · 0 评论 -
数据规整化——字符串操作
字符串操作回顾Python内置的字符串方法1)strip方法和split方法2)join方法3)in判断、index方法、find方法4)count方法5)replace方法Python正则表达式pandas矢量化字符串方法回顾Python内置的字符串方法1)strip方法和split方法2)join方法3)in判断、index方法、find方法index方法与 find方...原创 2019-03-25 22:06:23 · 394 阅读 · 0 评论 -
数据的分组运算(GroupBy)——基础篇
数据的分组运算—groupby参数解读基本使用1)Series分组2)DataFrame的分组GroupBy对象size方法分组进行迭代依据每列数据类型进行分组分组后选取一个或一组列进行运算使用字典或者Series进行分组1)字典形式进行分组2)Series形式进行分组通过函数进行分组依据索引级别进行分组分组运算的标准术语**“拆分—应用—合并”(split-apply-combine)**,具...原创 2019-03-25 22:40:52 · 5657 阅读 · 0 评论 -
数据的聚合运算——基础篇
数据的聚合运算聚合函数1)选取GroupBy对象的一列聚合运算2)选取GroupBy对象的多列聚合运算3)自定义聚合函数(aggregate和agg方法)聚合高级应用面向列的多函数应用1)agg方法对GroupBy对象的一列使用一个方法2)agg方法对GroupBy对象的一列使用多个方法3)agg方法对多列使用多种相同的方法4)agg方法对分组变量的多列使用多种不同的方法无索引形式返回聚合变量聚...原创 2019-03-26 20:28:59 · 9802 阅读 · 0 评论 -
数据的聚合与分组运算(进阶篇)
数据的聚合与分组运算—进阶使用分组的值填充数据缺失值随机采样和排列使用分组的值填充数据缺失值pandas中,缺失值可以使用较为粗鲁的dropna方法去除,但是更多时候想用一个定值或者数据集本身衍生出来的值去填充缺失值,此时使用fillna方法,这两个方法的使用具体可见先前笔记。首先回顾一般情况下的缺失值填充,一般的在数据未分组的情况下可以直接对Series和Dataframe使用fil...原创 2019-03-28 13:25:30 · 781 阅读 · 0 评论 -
透视表和交叉表
透视表和交叉表透视表交叉表透视表透视表(pivot table)是常见的数据汇总工具,它根据一个或多个键对数据进行聚合,根据行和列上的分组键将数据分配到矩形区域中。pandas中使用pivot_table方法创建透视表,官方文档中的例子,以C列作为分组列,将C传入columns参数,生成的透视表中C列不同的值作为分类值。指定A、B两列为索引列,将两列列名传递给index参数。对透视表...原创 2019-03-28 13:37:49 · 3327 阅读 · 0 评论