Pandas 数据处理
文章平均质量分 63
Series、DataFrame、Concat、Append、suffixes、GroupBy、eval、query······
懒笑翻
这个作者很懒,什么都没留下…
展开
-
IPython Jupyter NumPy Pandas Matplotlib Scikit-Learn statsmodels
1、 IPython Jupyter NumPy Pandas Matplotlib Scikit-Learn statsmodels scipy statsmodels简介1.1 IPython 和 Jupyter1.2 Pandas1.3 matplotlib1.4 scikit-learn1.5 scipy1.6 Numpy1.7 statsmodels2、安装pandas matplotlib ipython scikit-learn3、安装Numpy+MKL......原创 2022-08-01 20:06:19 · 688 阅读 · 0 评论 -
SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame
是因为我在根据列修改每一行值的时候,如下修改方式,虽然也修改成功了吧。设置拷贝警告试图在DataFrame中的片副本上设置值。原创 2022-07-25 21:15:53 · 885 阅读 · 0 评论 -
python df 计算两列时间之间相差的天数并添加到表中
这时候发现这个age_days列中数据相差天数中还有个尾巴。然鹅我并不想要这个尾巴,下面来把他删了。原创 2022-07-25 21:10:58 · 1015 阅读 · 3 评论 -
Python boxplot 详解+用法
四分位数具有一定的鲁棒性多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响。由此可见,箱型图识别异常值的结果比较客观,在识别异常值方面有一定的优越性。称为四分位数间距,是上四分位数QU与下四分位数QL之差,其间包含了全部观察值的一半。·whis表示箱形图上下须与上下四分位的距离,默认为1.5倍的四分位差。·showcaps表示是否显示箱体顶部和底部的横线,默认显示。·showboxs表示是否显示箱形图的箱体,默认显示。·positions表示箱体的位置。........原创 2022-07-20 15:52:26 · 7069 阅读 · 0 评论 -
df.drop_duplicates() 详解+用法
1、不定义任何参数,完全删除重复的行数据2、去除重复的几列行数据。drop_duplicates(self, subset: 'Optional[Union[Hashable, Sequence[Hashable]]]' = None, keep: 'Union[str, bool]' = 'first', inplace: 'bool' = False, ignore_index: 'bool' = False) 返回: DataFrame with duplicate row原创 2022-07-19 21:34:26 · 9251 阅读 · 0 评论 -
df.describe() 详解+用法+示例
Python 3.8.8 (default, Apr 13 2021, 15:08:03) [MSC v.1916 64 bit (AMD64)]Type 'copyright', 'credits' or 'license' for more informationIPython 7.22.0 -- An enhanced Interactive Python. Type '?' for help.PyDev console: using IPython 7.22.0Python 3.8.8 (d原创 2022-07-14 14:37:31 · 7340 阅读 · 0 评论 -
df.set_index()
set_index(self, keys, drop=True, append=False, inplace=False, verify_integrity=False) Set the DataFrame index using existing columns. Set the DataFrame index (row labels) using one or more existing columns or arrays (of the correct length).原创 2022-07-13 22:15:10 · 1774 阅读 · 0 评论 -
df.plot 参数解释以及使用
df.plot(x, y, kind, figsize, title, grid, legend, style) x 只有dataframe对象时,x可用。横坐标 y 同上,纵坐标变量 kind 可视化图的种类,如下: | - 'bar' : vertical bar plot | - 'barh' : horizontal bar plot | - 'hist' : histogram原创 2022-07-13 21:51:06 · 4750 阅读 · 0 评论 -
pandas resample()与asfreq()的区别 resample()按日周月累计方法
处理时间序列数据时,经常需要按照新的频率(更高频率、更低频率)对数据进行重新取样。你可以通过 resample() 方法解决这个问题,或者用更简单的 asfreq() 方法。这两个方法的主要差异在于,resample() 方法是以数据累计(data aggregation)为基础,而 asfreq() 方法是以数据选择(data selection)为基础。 比如按月累计:...原创 2022-07-13 20:41:33 · 1012 阅读 · 0 评论