数据分析
文章平均质量分 56
includeSteven
这个作者很懒,什么都没留下…
展开
-
动手学数据分析 数据建模和模型评估
在对数据进行处理和初步的可视化分析之后,我们就可以使用数据来获取想要的信息。而对数据的分析第一步就是建模,建模完成之后还需要评估我们的模型是否可靠。这里使用的建模库是sklearn,其中包含机器学习的很多算法,对应的模型算法选择路径可以参考下图:首先需要将数据集划分为训练集和测试集,这里使用的是sklearn.model_selection.train_test_split方法,可以通过jupyter的查看方法的文档。这里需要注意在切割数据集默认是使用随机选取,需要根据实际情况进行判定。在sklearn中,原创 2022-06-24 00:10:21 · 541 阅读 · 0 评论 -
动手学数据分析 数据可视化
通常数据可视化,可以帮助我们寻找一些异常值(过大或过小的值)、进行数据转换(数据标准化)、判断可使用的模型等。这里主要介绍matplotlib和seaborn导入:import matplotlib.pyplot as plt在jupyter notebook中使用需要使用%matplotlib inline,在IPython中使用%matplotlibmatplotlib的图像都是基于Figure对象,但是我们的图像是基于subplot进行绘制的,使用fig.add_subplot对象返回的是AxesSu原创 2022-06-21 01:11:11 · 59 阅读 · 0 评论 -
动手学数据分析 数据重构
主要是针对数据进行重构和分析,其中包括数据的合并、连接、数据分组和聚合运算对应方法:concat、join、append、merge、groupby、sum、max、mean等原创 2022-06-19 01:41:14 · 257 阅读 · 0 评论 -
动手学数据分析 数据清洗及特征处理
通过使用pandas对数据进行数据清洗,其中包括数据的缺失值处理(NA)和重复值处理;接着使用pandas对数据进行特征处理,主要使用离散化/文本变量转换/字符串操作的相关方法原创 2022-06-17 00:23:19 · 84 阅读 · 0 评论