- 博客(4)
- 收藏
- 关注
原创 meld安装启动报错解决
meld安装sudo apt-get install meldmeld启用meld&meld崩溃报错:GLib.Error: gtk-icon-theme-error-quark: 图标“folder”未在主题 Adwaita 中出现 (0) Traceback (most recen解决:sudo apt-get install --reinstall meld gnome-icon-theme...
2021-04-19 15:24:33 1019
原创 利用python进行数据分析(第十章)
数据聚合与分组操作GroupBy机制分组键形式与需要分组的轴向长度一致的值列表或者值数组 DataFrame的列名的值 可以将分组轴上的值和分组名称相匹配的字典或series 可以在轴索引或索引中的单个标签上调用的函数计算分组的均值 GroupBy的 mean方法 size方法 返回一个包含组大小信息的series 遍历各分组for循环 dict(list(df.groupby('key')))选择一列或所有列的子集df.groupby('key')['data'] df.g
2021-04-12 19:59:40 291
原创 利用python进行数据分析(第八章)
数据规整:连接、联合与重塑分层索引简介一个轴向上拥有多个索引层级 是在更低维度的形式中处理更高维度数据的方式 在重塑数据和数组透视表等分组操作中有重要作用 unstack 重新排列df stack 反操作 每个轴都可以有分层索引 分层的层级可以有名称重排列和层级排列sort_index只能在单个层级上对数据进行排序 sort_index可使得结果按照层级进行字典排序 level=0从最外层进行排序按层级进行汇总统计df.sum(level='', axis= ) 使用了gro
2021-04-08 20:19:48 415
原创 利用python进行数据分析(第七章)
数据清洗与准备处理缺失值过滤缺失值:dropna一维删除缺失值 二维删除含缺失值行 参数how='all'删除所有值均为缺失值的行 参数thresh保留一定数量缺失值行补全缺失值:fillna默认返回新对象 inplace=True标识修改原对象 method='ffill'补全方法向前向后 limit=2填充范围数据转换删除重复值df.duplicated返回布尔类型series,标识该行是否之前存在 df.drop_duplicated返回df,删除重复列,默认保留第
2021-04-08 19:12:07 238
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人