![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
Mr番茄蛋
大家一起学习
展开
-
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte解决办法
Pandas导入CSV文件,出现下面的报错信息。/usr/local/lib/python3.5/dist-packages/pandas/io/parsers.py in __init__(self, src, **kwds) 1706 kwds['usecols'] = self.usecols 1707 -> 1708 self._rea...原创 2019-12-13 16:31:36 · 5296 阅读 · 0 评论 -
pandas统计重复值次数
from pandas import DataFramedf = DataFrame({'key1':['a','a','b','b','a','a'], 'key2':['one','two','one','two','one','one'], 'data1':[1,2,3,2,1,1], #...原创 2018-06-27 16:13:08 · 48559 阅读 · 2 评论 -
Python数据处理——Pandas模块使用(三)
本文主要介绍pandas库的加载数据:数据来源加载数据随机采样加载数据pandas提供了一些将表格型数据读取为DataFrame对象的函数,其中用的比较多的是read_csv和read_table,参数说明如下: 参数 说明 path 表示文件位置、URL、文件型对象的字符串 sep或delimiter 用于将行中的各字段进行...原创 2018-06-01 13:22:34 · 432 阅读 · 0 评论 -
Python数据处理——Pandas模块使用(二)
数据变换操作导入文件import numpy as npimport pandas as pdodata = pd.read_csv('example.csv')这三行代码就可以实现csv文件的导入,注意文件的路径删除行Data1 = data.drop([16,17])drop()方法如果不设置参数inplace=True,则只能在生成的新数据块中实现删除效果,而...原创 2018-05-07 20:36:24 · 3210 阅读 · 0 评论 -
Python数据处理——Pandas模块使用(一)
一、Pandas介绍在处理实际的金融数据时,一个条数据通常包含了多种类型的数据,例如,股票的代码是字符串,收盘价是浮点型,而成交量是整型等。在C++中可以实现为一个给定结构体作为单元的容器,如向量(vector,C++中的特定数据结构)。在Python中,pandas包含了高级的数据结构Series和DataFrame,使得在Python中处理数据变得非常方便、快速和简单。pandas不同的版...原创 2018-05-07 19:42:55 · 2562 阅读 · 2 评论 -
Series的整数索引 KeyError
Series的整数索引s = pd.Series(np.arange(3),index=["a","b","c"]) print(s[-1]) #2 s1 = pd.Series(np.arange(3)) print(s1[-1]) # 这一句会报错,因为KeyError解决办法调用pandas的iloc函数 s1.iloc[-1] 就能正常运行...原创 2018-06-02 14:57:27 · 1724 阅读 · 0 评论 -
Python数据处理——Pandas模块使用(六)
本文主要介绍pandas数据清洗,排序,索引设置,数据选取数据清洗更改数据格式astype()isin #计算一个“Series各值是否包含传入的值序列中”的布尔数组unique #返回唯一值的数组value_counts #返回一个Series,其索引为唯一值,值为频率,按计数降序排列丢...原创 2018-06-02 14:50:15 · 502 阅读 · 0 评论 -
Python数据处理——Pandas模块使用(五)
本文主要介绍pandas数据转换操作1.分组In [42]: df = DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5) ...: ,'data2':np.random.randn(5)})In [43]: d...原创 2018-06-01 13:45:35 · 295 阅读 · 0 评论 -
Python数据处理——Pandas模块使用(四)
本文主要介绍pandas数据清洗和数据操作1. 数据统计In [31]: df = DataFrame({'A':np.random.randn(5),'B':np.random.randn(5)})In [32]: dfOut[32]: A B0 -0.635732 0.7389021 -1.100320 0.9102032 1....原创 2018-06-01 13:39:39 · 290 阅读 · 0 评论 -
Python数据处理——Pandas模块使用(七)
本文主要介绍Pandas统计函数:groupby、pivot_table及crosstab产生数据import numpy as npimport pandas as pdfrom pandas import DataFramedf = DataFrame({'key1':['a','a','b','b','a'], 'key2':['one',...原创 2018-06-04 14:19:48 · 312 阅读 · 0 评论