公户灿灿-CSDN博客

原创李航《统计学习方法（第二版）》笔记：第一章——统计学习及监督学习概论（二）

目录4. 模型评估与模型选择4.1 训练误差与测试误差4.2 过拟合与模型选择5. 正则化与交叉验证5.1 正则化5.2 交叉验证6. 泛化能力6.1 泛化误差6.2 泛化误差上界7. 生成模型与判别模型8. 监督学习应用8.1 分类问题8.2 标注问题8.3 回归问题4. 模型评估与模型选择4.1 训练误差与测试误差4.2 过拟合与模型选择5. 正则化与交叉验证5.1 正则化5.2 交叉验证6. 泛化能力6.1 泛化误差6.2 泛化误差上界7. 生成模型与判别模型8. 监督学习应用

2020-09-14 01:14:26 361

原创李航《统计学习方法（第二版）》笔记：第一章——统计学习及监督学习概论（一）

目录1. 统计学习概念2. 统计学习分类2.1 基本分类2.2 按模型分类2.3 按算法分类2.4 按技巧分类3. 统计学习方法三要素3.1 模型3.2 策略3.3 算法4. 模型评估与模型选择4.1 训练误差与测试误差4.2 过拟合与模型选择5. 正则化与交叉验证5.1 正则化5.2 交叉验证6. 泛化能力6.1 泛化误差6.2 泛化误差上界7. 生成模型与判别模型8. 监督学习应用8.1 分类问题8.2 标注问题8.3 回归问题1. 统计学习概念赫尔伯特·西蒙：“如果一个系统能够通过执行某个过程改进

2020-09-06 23:56:23 895

原创数据分析之Kaggle Titanic竞赛——第三章：数据建模、模型评估

目录0.前言1. 数据建模1.1 载入库1.2 读取数据集1.3 模型搭建1.3.1 切割训练集和测试集1.3.2 模型创建1.3.3 输出模型预测结果0.前言经过前面的两章的知识点的学习，我可以对数数据的本身进行处理，比如数据本身的增删查补，还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据，我们做数据分析的目的也就是，运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模，搭建一个预测模型或者其他模型；我们从这个模型的到

2020-08-28 23:52:21 521

原创机器学习之分类模型（三）——SVM支持向量机

机器学习算法（二）: SVM支持向量机0. 前言1. SVM介绍1.1 问题引入1.2 软间隔1.3 超平面2. 天池实验室算法实战Step1:库函数导入Step2:构建数据集并进行模型训练Step3:模型参数查看Step4:模型预测Step5:模型可视化0. 前言支持向量机（Support Vector Machine，SVM）是一个非常优雅的算法，具有非常完善的数学理论，常用于数据分类，也可以用于数据的回归预测中，由于其优美的理论保证和利用核函数对于线性不可分问题的处理技巧，在上世纪90年代左右，

2020-08-25 23:46:47 1332

原创机器学习之分类模型（二）——决策树

机器学习算法（二）: 决策树0. 前言0.1 决策树介绍0.2 决策树应用0.3 决策树原理1. 天池实验室算法实战——企鹅数据1.0 代码流程预览1.1 Demo实践Step1: 库函数导入Step2:模型训练Step3:数据和模型可视化（需要用到graphviz可视化库）Step4:模型预测1.2 数据分析Step1：函数库导入Step2：数据读取/载入Step3：数据信息简单查看Step4:可视化描述1.3 建模预测1.3.1 利用决策树模型在二分类上进行训练和预测1.3.2 利用决策树模型

2020-08-22 20:07:44 3340

原创数据分析之Kaggle Titanic竞赛——第二章：数据清洗及特征处理、数据重构、可视化

动手学数据分析——第二章：数据清洗及特征处理、数据重构、可视化0. 前言1. 数据清洗及特征处理1.1 缺失值缺失值观察与处理2. 数据重构3. 数据可视化0. 前言前面一章的内容大家可以感觉到我们主要是对基础知识做一个梳理，让大家了解数据分析的一些操作，主要做了数据的各个角度的观察。那么在这里，我们主要是做数据分析的流程性学习，主要是包括了数据清洗以及数据的特征处理，数据重构以及数据可视化。这些内容是为数据分析最后的建模和模型评价做一个铺垫。1. 数据清洗及特征处理我们拿到的数据通常是不干净的，所

2020-08-21 23:21:32 1850 1

原创机器学习之分类模型（一）——逻辑回归

机器学习算法（一）: 基于逻辑回归的分类预测0.前言0.1逻辑回归介绍0.2逻辑回归应用1.数据载入&初步观察2.Pandas基础0.前言0.1逻辑回归介绍逻辑回归（Logistic regression/LR）虽然其中带有"回归"两个字，但逻辑回归其实是一个分类模型，并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热，但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。而对于逻辑回归而言，最为突出的两点就是其模型简单和模型的可解释性强。逻辑回归模型的优劣势:

2020-08-20 22:07:00 1441

原创数据分析之Kaggle Titanic竞赛——第一章：数据载入、Pandas基础、探索性分析

数据分析之——数据载入与探索：以Titanic为例0.前言1.数据载入&初步观察2.Pandas基础0.前言这门课程得主要目的是通过真实的数据，以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。知道了课程的目的之后，我们接下来我们要正式的开始数据分析的实战教学，完成kaggle上泰坦尼克的任务，实战数据分析全流程。这里有两份资料：教材《Python for Data Analysis》和 baidu.com & google.com（善用搜索引擎）1.数据载入&a

2020-08-20 16:42:33 912 1

Jelly's Blog