Pandas
文章平均质量分 54
zheng_weibin
一个转行数据分析的菜鸟,希望有朝一日学成独孤九剑纵横江湖
展开
-
Pandas常用函数小结
下列笔记实例数据源均为宽带339日模型数据,均已import下列库import numpy as npimport pandas as pdfrom pandas import Series, DataFramepct_change()Series.pct_change(periods=1, fill_method='pad', limit=None, freq=None, **kwargs)[s原创 2018-01-17 22:31:48 · 501 阅读 · 0 评论 -
Pandas剔除混合数据中非数字的数据
我们日常拿到的数据,指标字段有时会混入非数字的数据,这时候会影响我们的操作,nameheightHang180Ben145ChonotknowXIn189比如read_csv读入时,该列会以object形式读入,也不能直接进行计算,不然会出现如unsupported operand type(s) for +: 'float' and 'str'的错误这时候就需要进行数据预处理,清除掉指标值中非数...原创 2018-02-26 13:18:02 · 16417 阅读 · 0 评论 -
Pandas索引&层次化索引
Pandas索引df['列名']得到一个单独列In[9]:kuandai['分公司']Out[9]: 入网时间2018-01-04 深圳2018-01-04 深圳2018-01-05 深圳......df[2:5]得到行的切片In[14]:kuandai[2:4]Out[14]: 入网时间 KD012指标 付费方式 付费类型 光宽类型 分公司 十六大渠道 ...原创 2018-01-17 22:58:17 · 426 阅读 · 0 评论 -
numpy索引和切片
1、基本的索引和切片基本索引与切片与python列表操作类似arr = [1,2,3,4,5]arr[2:4] #[3,4]当把标量值赋予给一个切片时(如arr[2:4]=12),该值会广播到整个选区。注意数组切片是原始数组的视图。这意味着数据不会被复制,视图上的任何修改都会直接反映到源数据上。多维数据索引中,索引位置上的元素不是标量,而是一维数组了arr2=np.array([[1,2,3...原创 2018-02-24 10:49:07 · 658 阅读 · 0 评论 -
缺失值处理
pandas使用NaN(Not a Number)表示浮点和非浮点数组中的缺失数据,Python内置的None值也会被当做NA处理,pandas对象上的所有描述统计都排除了缺失数据。NA处理方法方法说明dropna根据各标签的值是否存在缺失数据对轴标签进行过滤,可通过阈值调节对缺失值的容忍度fillna用指定值或插值方法(如ffill或bfill)填充缺失数据isnull返回布尔对象,表示那些值是...原创 2018-02-24 17:49:30 · 718 阅读 · 0 评论