![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
基本机器学习方法整理
豫逸
这个作者很懒,什么都没留下…
展开
-
CH2 数据预处理
数据预处理文章目录数据预处理1 数据预处理的必要性1.1 存在脏数据1.2 数据处理的必要性1.3 数据质量1.4 数据预处理的主要任务1.5 数据预处理的形式2 数据清理2.1 现实数据中存在的问题:2.2 处理缺失值的方式2.3 处理噪音数据2.3.1 分箱2.4 聚类分析3 数据集成3.1 相关分析(数值分析)3.1.1 皮尔逊相关系数3.1.2 协方差3.1.3 通过卡方值进行衡量3.2 数据变换3.3 数据规范化4 数据归约4.1 数据规约策略4.2 数据立方体聚集4.1.1 基本概念4.1.2原创 2020-09-29 21:56:37 · 141 阅读 · 0 评论 -
数据挖掘课程笔记-ch3-模型评估
文章目录课程内容记录一、模型选择1. 评估方法1.1 留出法1.2交叉验证1.3 自助法1.4 “调参”与最终模型2. 性能度量2.1 性能度量指标:错误率vs.精度2.2 性能度量指标:查准率vs.查全率2.3 PR图、BEP2.4 F12.5 宏xxvs.微xx2.6 ROC、AUC2.7 非均等代价3.比较检验3.1 常用的检验方法3.1.1 二项检验3.1.2 t检验3.1.3 交叉验证t检验3.1.4 McNemar检验3.1.5 Friedman检验3.1.6 Friedman检验图二、误差分析原创 2020-09-28 18:54:08 · 452 阅读 · 0 评论 -
支持向量机
功能描述支持向量机(support vector machine,SVM)是一种分类算法,但是也可以做回归,根据输入的数据不同可做不同的模型。(若输入标签为连续值作回归问题处理,若输入标签为分类的离散值则可作分类问题处理。)它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。细节描述(公式 模型图示)原始的SVM只擅长处理二分类问题,在引入核函数之前,只能解决线性可分问题;在应对线性不可分问题的时候,支持向原创 2020-09-25 19:58:18 · 752 阅读 · 0 评论