![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
棠糖䉎
这个作者很懒,什么都没留下…
展开
-
动手学数据分析—5.数据建模及模型评估
动手学数据分析—5.数据建模及模型评估一、 特征工程1.1缺失值填充1.2编码分类变量二、模型搭建tips12.1切割训练集和测试集tips2Q12.2 模型创建tips3Q22.3 输出模型预测结果tips4Q3三、模型评估3.1 交叉验证tips5Q43.2 混淆矩阵tips6Q53.3 ROC曲线tips7Q6引言&复习本章将开始数据建模。过程将综合使用所学知识:特征工程、模型搭建与模型评估。import pandas as pdimport numpy as npimport s原创 2020-08-27 23:04:35 · 705 阅读 · 0 评论 -
动手学数据分析—4.数据可视化
动手学数据分析—4.数据可视化一、图表介绍二、可视化工具Matplotlib2.1 准备数据2.1.1 一维数据2.1.2 二维数据或图片2.2 绘制图形2.2.1 画布2.2.2 坐标轴2.3 绘图流程2.4 自定义图像2.4.1 颜色、色条与色彩表2.4.2 标记2.4.3 线型2.4.4 文本与标注2.4.5 尺寸限制、图例和布局2.5 保存图像2.6 显示图像2.6.1 关闭与清除引言&复习本章的学习可参考《Python for Data Analysis》第九章主要使用工具:matp原创 2020-08-25 23:45:27 · 188 阅读 · 0 评论 -
动手学数据分析—3.数据重构
动手学数据分析—3.数据重构一、数据重构1.1 数据的合并1.1.1载入数据,与原数据对比1.1.2 横向合并表1.1.3 纵向合并表1.1.4 使用DataFrame自带的方法join方法和append1.1.5 使用Panads的merge方法和DataFrame的append方法引言&复习在上一章的学习中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。# 导入基本库原创 2020-08-23 23:53:00 · 202 阅读 · 0 评论 -
动手学数据分析—2.数据清洗及特征处理
动手学数据分析—2.数据清洗及特征处理一、数据清洗1.1 缺失值观察和处理1.1.1缺失值观察1.1.2处理缺失1.2重复值观察与处理1.2.1查看数据中的重复值1.2.2处理重复值2.特征观察与处理2.1对文本进行转换2.2提取特征引言&复习在上一章的学习中,我们对基础知识做了一个简易梳理,通过对数据的各个角度进行观察,从而对数据分析的一些操作有了初步认识。这一章,我们将对数据分析进行流程性学习,主要包括数据清洗、特征处理,数据重构以及数据可视化。而这些内容又为最后的建模和模型评价做了铺垫。原创 2020-08-21 22:33:07 · 199 阅读 · 0 评论 -
动手学数据分析——1.数据加载及探索性数据分析
动手学数据分析——1.数据加载及探索性数据分析一、数据加载1.1 载入数据1.1.1 导入数据科学库numpy和pandas1.1.2 载入数据1.1.3 每1000行为一个数据模块,逐块读取1.1.4 修改表头语言类型,设置索引列1.2.初步观察1.2.1 查看数据基本信息1.2.2 观察表格前10行的数据和后15行的数据1.2.3 判断数据是否为空,为空的地方返回True,其余地方返回False1.3保存数据二、Pandas基础2.1.找到数据集并花式查看2.1.1 DataFrame与Series数据原创 2020-08-19 23:53:44 · 333 阅读 · 0 评论