数据处理
文章平均质量分 73
Pandas、Numpy使用
初一·
这个作者很懒,什么都没留下…
展开
-
pandas处理Excel中的列转行
问题描述:在数据处理过程中,我们有时会遇到数据并不是我们想要的格式,比如给的数据表是这样的:然而我们需要的格式是这样的:这时,我们可以使用set_index()+stack()进行列转行:...原创 2020-03-10 13:06:04 · 1278 阅读 · 0 评论 -
解决Pandas的to_excel()写入不同Sheet,而不会被重写
在使用Pandas的to_excel()方法写入数据时,当我们想将多个数据写入一个Excel表的不同DataFrame中,虽然能够指定sheet_name参数,但是会重写整个Excel之后才会存储。import pandas as pd 现在我有三个DataFrame,分别是大众某车型的配置、外观和内饰数据。现在我想要将这三个DF存入一张表的不用sheet中>>> ...原创 2019-09-12 11:55:40 · 37982 阅读 · 12 评论 -
使用Pandas批量读取Excel
之前遇到的一个小需求,需要对一个文件夹内的20张表的数据进行聚合运算,所以记录一下:引包import pandas as pdimport os代码def read_heat_data(dir_name): csvFilePath = './{}'.format(dir_name) heatdfList = [] for fName in os.listdi...原创 2019-09-06 15:16:42 · 3691 阅读 · 1 评论 -
pandas读取excel时,保留开头的0
数据来源:高德API POI分类编码对应表在读取数据时,不过不做任何处理: 这样在做数据处理(合并处理)时,无法准确对应。解决方法: 使用converters参数,字典的key值就是你要指定保留0的数据列,可以指定列名,如果没有列名可以指定序号df = pd.read_excel("top.xlsx",sheet_name=2,header=None,converters={0:...原创 2019-08-23 10:51:20 · 4952 阅读 · 1 评论 -
Pandas数据处理之数据取值与选择
3.3 数据取值与选择 本篇介绍Pandas的Series和DataFrame对象的数据获取与调整操作.一、Series数据选择方法 Series对象与一维Numpy数组和标准字典在许多方面都一样。1.将Series看做字典 和字典一样,Series 对象提供了键值对的映射:In[1] : import pandas as pd import numpy as npI...原创 2019-06-18 12:56:40 · 9069 阅读 · 0 评论 -
Pandas数据处理之Pandas的Index对象
《Python数据科学手册》读书笔记3.2.3 Pandas的Index对象 Series 和DataFrame 对象都使用便于引用和调整的显式索引。。Pandas 的Index 对象是一个很有趣的数据结构,可以将它看作是一个不可变数组或有序集合In [1] : import numpy as np import pandas as pd In [2] : ind = pd....原创 2019-06-13 10:43:24 · 3252 阅读 · 2 评论 -
Pandas数据处理之Pandas的DataFrame对象
《Python数据科学手册》读书笔记3.2.2 Pandas的DataFrame对象Pandas的另一个基础数据结构是DataFrame。和之前介绍的Series一样,DataFrame既可以作为一个通用型Numpy数组,也可以看做特殊的Python字典。1.DataFrame是通用的Numpy数组 如果将Series 类比为带灵活索引的一维数组,那么DataFrame 就可以看作是一种...原创 2019-06-12 11:05:59 · 1355 阅读 · 0 评论 -
Pandas数据处理之Pandas的Series对象
《Python数据科学手册》读书笔记3.2.1 Pandas的Series对象 Pandas的Series对象是一个带索引数据构成的一维数组。可以用一个数组创建Series对象,如下所示:In [1] : improt numpy as np import pandas as pdIn [2] : data = pd.Series([1,2,3,4])In [3] : data...原创 2019-06-11 15:02:25 · 2679 阅读 · 0 评论