![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Pandas
Roddy_Liu
这个作者很懒,什么都没留下…
展开
-
Pandas数据重塑和透视
使用多层索引进行重塑stack(堆叠) :旋转或将列中的数据透视到行unstack(拆堆):将行中的数据透视到列data.stack() data.unstack()data.unstack(0) #0表示最外层data.unstack('key1').stack('key2')数据透视长透视为宽:data.piovot()dat...原创 2019-08-07 22:27:11 · 684 阅读 · 0 评论 -
Pandas时间序列进阶(日期范围,频率,移位,时区处理)
日期范围生成日期范围:pd.date_range()方法用于根据特定频率生成指定长度的DatetimeIndexpd.date_range( start=None, end=None, periods=None, freq=None, tz=None, normalize=False, #时间标准化为0 ...原创 2019-08-09 18:48:51 · 1279 阅读 · 0 评论 -
Pandas分层索引
pandas允许你在一个轴向上有多个索引层级,提供了一种在更低纬度的形式中处理更高维度数据的方式分层索引的创建已有的dataframe数据: data.set_index(['key1','key2'])data = pd.Series(np.random.randn(9),index=[[ ],[ ]])分层索引的命名data.index.names = ['key1','...原创 2019-08-07 16:58:16 · 380 阅读 · 0 评论 -
Pandas数据清洗与准备
处理缺失值NA处理方法dropna 根据每个标签的值是否是缺失值来筛选轴标签,并根据允许缺失的数据量来确定阈值(应用于行)fillna 用某些值来填充确实的数据或使用插值方法,(ffillna或bfillna)(应用于列)isnull 返回表明哪些值是缺失值的布尔值notnull ...原创 2019-08-07 16:19:30 · 606 阅读 · 0 评论 -
Pandas时间序列基础(转换,索引,切片)
时间序列的类型:时间戳:具体的时刻固定的时间区间:例如2007年的1月或整个2010年时间间隔:由开始时间和结束时间表示,时间区间可以被认为是间隔的特殊情况实验时间和消耗时间:每个时间是相对于特定开始时间的时间的量度,(例如自从被放置在烤箱中每秒烘烤的饼干的直径)日期和时间数据的类型及工具datetime模块中的类型:date 使用公历日历存储日历日...原创 2019-08-09 16:22:59 · 7442 阅读 · 0 评论 -
pandas入门
首先介绍一下numpy 和 pandas的区别:numpy pandas基础数据类型 扩展数据类型 关注的是数据结构表达 关注的是数据应用表达维度:数据间的关系 ...原创 2019-08-06 22:58:29 · 233 阅读 · 0 评论 -
Pandas数据透视表和交叉表
数据透视表pivot_table和数据透视pivot的区别数据透视和数据透视表的区别简单的讲就是如果数据中的一个值对应的行索引和列索引都相同时,pivot将会报错:Index contains duplicate entries, cannot reshape,pivot_table不会报错,默认计算相同数据的均值并返回。如果每个值对应的行索引和列索引都是唯一的,两者的结果也是一样的。dt...原创 2019-08-08 23:43:26 · 888 阅读 · 0 评论 -
Pandas分组应用实例
分组技术与分箱技术连用data = pd.DataFrame({'data1':np.random.randn(1000), 'data2':np.random.randn(1000)})quantiles = pd.cut(data.data1,4) #得到categories对象grouped = data.data1....原创 2019-08-08 21:23:44 · 402 阅读 · 0 评论 -
Pandas 数据聚合与分组操作
GroupBy机制分组聚合图示grouped操作datacity US JPtenor 1 3 5 1 30 -0.423185 0.107952 0.051819 -3.058473 -0.6485711 0.011324 -1.096422 -0.60593...原创 2019-08-08 14:52:06 · 1142 阅读 · 0 评论 -
Pandas联合和合并数据集
连接方式pandas.merge 根据一个或多个键将行进行连接,与SQL数据库的1连接操作类似pandas.concat 使对象在轴向上进行黏合或 ‘堆叠’join()combine_first()实例方法允许将重叠的数据拼接在一起,以使用一个对象的值填充另个对象的缺失值pd.merge()多对一连接:df1在连接键所对应列中的值每个值有多个,df2在连接键所对应列中的值每个...原创 2019-08-07 20:45:16 · 891 阅读 · 0 评论