pandas
文章平均质量分 66
小白tree
致力于成为图形学工程师的小白
展开
-
pandas groupby分组后对每个组进行fillna填值
pandas Dataframe grouby分组填值fillna ffill bfill原创 2022-07-06 21:31:48 · 3595 阅读 · 1 评论 -
pandas raise TypeError(‘expected ‘ + str(self.expected_type)) TypeError: expected <class ‘str‘>
这个问题在pandas1.1以上应该都会有,我的原因是excel最后两行是这样的,不是个规范的格式这个不规范的格式在之前可以用参数skipfooter=2轻松处理,但在较新的版本就会出现如题的错误。另一个原因是pandas更新了引擎,从xlrd => openpyxlxlrd因为安全性不高,在较新版本放弃了对xlsx格式的支持,pandas也将引擎换到openpyxl。解决方法是:pandas退回1.0.1版本,xlrd退回1.2.0版本pip install pandas==1.0.1原创 2022-02-12 21:13:18 · 4928 阅读 · 2 评论 -
报表中pandas缺失值的处理与保留
在做一些如金融分析报表的时候,一般既不可以像平常机器学习那样直接dropna将缺失值一删了之,也不能插值。这时候缺失值的处理就可能比较麻烦。先说下结论:pandas会将数值型缺失值读取为nan,使用pd.isna()和pandas中的时间缺失值类型和numpy的是不一样的,一、如果是存成int型的如股票代码有缺失一般都会将这列的类型读取为np.float64,有时候想把其转化为np.int64是没有必要的,因为输出到文件时,648000不会...原创 2022-02-01 14:46:21 · 2860 阅读 · 0 评论 -
pandas.Series之间的运算
本篇描述index相同的的两个Series的加减乘除运算。此外:Series的其他运算——可以参考《DataFrame和Series的简单运算(加减乘除)》《Pandas.Series的加减乘除数学运算》...原创 2020-02-10 20:03:53 · 6345 阅读 · 0 评论 -
DataFrame和Series的简单运算(加减乘除)
一、先运行下面的程序import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 下面两个方法都可以# frame = DataFrame(np.arange(9).reshape(3,3), columns=list('abc'), index=['one', 'two', 'threee'])...原创 2020-02-10 19:59:57 · 16136 阅读 · 2 评论 -
Series.value_counts,pd.value_counts计算Series,DataFrame数据频率
在pandas里面常用用value_counts确认数据出现的频率。一、对Series使用ss = Series.values_count()注意这里返回的就是SeriesIn[2]: import numpy as np ...: import pandas as pd ...: from pandas import DataFrame ...: from pandas im...原创 2020-02-03 23:10:32 · 4083 阅读 · 1 评论