动手学数据分析
文章平均质量分 89
Datawhlae 动手学数据分析:https://gitee.com/datawhalechina/hands-on-data-analysis
Beta Lemon
盖将自其变者而观之,则天地曾不能以一瞬
展开
-
【动手学数据分析】 Task05 - 模型建立和评估
模型建立和评估的基本流程:读入数据集、特征工程、分割训练集和测试集、创建模型、输出模型预测结果原创 2021-09-23 20:56:19 · 219 阅读 · 0 评论 -
【动手学数据分析】 Task04 - 数据可视化
信息可视化能帮我们找出异常值、进行必要的数据转换、判断选用哪种相关模型,同时也需要数据可交互。matplotlib是一个用于绘制高质量图表的第三方包,其衍生出了多个数据可视化工具,如 seaborn。综合使用pandas,matplotlib和seaborn 可绘制出较多静态图。原创 2021-09-20 10:06:06 · 236 阅读 · 0 评论 -
【动手学数据分析】 Task03 - 数据重构
一、数据的合并:常见的合并方法[有 concat、append、merge、join二、使用Series类型的数据三、数据的聚合与运算原创 2021-09-17 10:03:02 · 175 阅读 · 0 评论 -
【动手学数据分析】 Task02 - 数据清洗及特征处理
数据清洗一方面是对NAN空数据的处理,有替换填充、删除等方法;另一方面是去重,使用DataFrame.drop_duplicates()方法。对于特征处理部分,先对连续变量进行离散化操作(分箱处理),这主要是为了提升模型的稳定性,减少过拟合出现的几率。另外是转换文本类型变量,以及对某一列进行特征提取。原创 2021-09-15 11:09:06 · 199 阅读 · 0 评论 -
【动手学数据分析】 Task01 - 数据载入及观察 + Pandas基础 + 探索性数据分析
一、数据载入及初步观察:首先是下载数据集,其次是导入模块并载入数据,查看表结构信息,以及判断空数据;二、pandas 基础:比较两种数据类型DataFrame和Series,筛选数据;三、探索性数据分析:通过排序、数据计算来统计数据,找出隐含信息。原创 2021-09-14 17:30:40 · 210 阅读 · 0 评论