组队学习
sd3145265
这个作者很懒,什么都没留下…
展开
-
《统计学习方法第二版》学习笔记3——K近邻法
第三章 k近邻法目录第三章 k近邻法前言1 理论部分1.1 k近邻算法1.2 k近邻模型1.2.1 模型1.2.2 距离度量1.2.3 k值的选择1.2.4 分类决策规则1.3 k近邻法的实现:kd树1.3.1 构造kd树1.3.2 搜索kd树2 代码部分2.1 距离度量2.2 课本例3.12.3 scikit-learn实例2.4 sklearn.neighbors.KNeighborsClassifier2.5 kd树2.6 构造平衡kd树算法2.7 例3.2前言【导读】k近邻法(k-NN)是一种原创 2020-10-02 20:36:09 · 463 阅读 · 0 评论 -
《统计学习方法第二版》学习笔记2——感知机
第2章 感知机目录第2章 感知机前言1 理论部分2.1 感知机模型前言本文主要参考资料:《统计学习方法》第二版 李航《统计学习方法》第二版PPT 袁春1 理论部分【导读】本章的结构按着统计学习方法三要素——模型、策略、算法来进行安排。感知机是我们正式学习的第一个模型,算是一个比较简单基础的的二分类的线性分类模型。主要内容依然是用思维导图展示,强调知识体系结构。此外,由于我们后面学习的模型很多,我们要重点弄清每个模型的具体应用场景和优缺点。链接:https://pan.baidu.原创 2020-09-13 22:46:32 · 270 阅读 · 0 评论 -
《统计学习方法第二版》学习笔记1——概论
第1章 统计学习及监督学习概率论目录第1章 统计学习及监督学习概率论前言1 理论部分1.1 统计学习1.2 统计学习的分类1.3 统计学习方法三要素1.4 模型评估与模型选择1.5 正则化与交叉验证1.6 泛化能力1.7 生成模型与判别模型1.8 监督学习应用前言本文主要参考资料:《统计学习方法》第二版 李航《统计学习方法》第二版PPT 袁春这次学习笔记主要记录《统计学习方法》的一些重要知识点及其拓展、相关代码实现和一些思考,起因是我们可爱美丽的V同学发动的组队学习打卡活动。本人并非计原创 2020-09-07 00:21:39 · 838 阅读 · 0 评论 -
datawhale课程[动手学数据分析]——Task05:模型搭建与评价
目录第三章 模型搭建和评估--建模模型搭建任务一:切割训练集和测试集任务提示1任务二:模型创建提示任务三:输出模型预测结果提示3第三章 模型搭建和评估-评估模型评估任务一:交叉验证提示4思考4任务二:混淆矩阵提示5任务三:ROC曲线提示6思考6第三章 模型搭建和评估–建模经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合原创 2020-08-27 22:13:11 · 482 阅读 · 0 评论 -
datawhale课程[动手学数据分析]——Task04:数据可视化
目录2 第二章:数据可视化开始之前,导入numpy、pandas以及matplotlib包和数据2.7 如何让人一眼看懂你的数据?2.7.1 任务一:跟着书本第九章,了解matplotlib,自己创建一个数据项,对其进行基本可视化2.7.2 任务二:可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)。2.7.3 任务三:可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)。2.7.4 任务四:可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试原创 2020-08-26 11:53:53 · 894 阅读 · 0 评论 -
datawhale课程[动手学数据分析]——Task03:数据重构
目录开始之前,导入numpy、pandas包和数据2 第二章:数据重构2.4 数据的合并2.4.1 任务一:将data文件夹里面的所有数据都载入,观察数据的之间的关系2.4.2:任务二:使用concat方法:将数据train-left-up.csv和train-right-up.csv横向合并为一张表,并保存这张表为result_up2.4.3 任务三:使用concat方法:将train-left-down和train-right-down横向合并为一张表,并保存这张表为result_down。然后将上边的原创 2020-08-24 00:40:00 · 572 阅读 · 0 评论 -
datawhale课程[动手学数据分析]——Task02:数据清洗简述
目录2 第二章:数据清洗及特征处理2.1 缺失值观察与处理2.1.1 任务一:缺失值观察2.1.2 任务二:对缺失值进行处理2.2 重复值观察与处理2.2.1 任务一:请查看数据中的重复值2.2.2 任务二:对重复值进行处理2.2.3 任务三:将前面清洗的数据保存为csv格式2.3 特征观察与处理2.3.1 任务一:对年龄进行分箱(离散化)处理2.3.2 任务二:对文本变量进行转换2.3.3 任务三:从纯文本Name特征里提取出Titles的特征(所谓的Titles就是Mr,Miss,Mrs等)附加题【回原创 2020-08-21 23:42:14 · 353 阅读 · 0 评论 -
datawhale课程[动手学数据分析]——Task01:数据加载及探索性数据分析
目录0 前言1 数据加载1.1 载入数据1.1.1 任务一:导入numpy和pandas1.1.2 任务二:载入数据1.1.3 任务三:每1000行为一个数据模块,逐块读取1.1.4 任务四:将表头改成中文,索引改为乘客ID [对于某些英文资料,我们可以通过翻译来更直观的熟悉我们的数据]1.2 初步观察1.2.1 任务一:查看数据的基本信息1.2.2 任务二:观察表格前10行的数据和后15行的数据1.2.4 任务三:判断数据是否为空,为空的地方返回True,其余地方返回False1.3 保存数据1.3.1原创 2020-08-19 21:52:11 · 693 阅读 · 0 评论