机器学习
文章平均质量分 55
卓玛cug
这个作者很懒,什么都没留下…
展开
-
矩阵分解与PCA降维知识点整理
目录1 矩阵谱分解2 矩阵LU分解3 满秩分解4 QR分解5 特征值分解6 奇异值分解7 PCA1 矩阵谱分解2 矩阵LU分解n阶方阵可能通过初等变换变为上三角矩阵,不一定存在。3 满秩分解4 QR分解5 特征值分解6 奇异值分解7 PCA其中第二步详细过程:由第(3)式和...原创 2020-04-07 14:37:44 · 1097 阅读 · 0 评论 -
分类模型原理及优缺点整理总结
https://blog.csdn.net/qq_29153321/article/details/105299243除了上篇博客提到的决策树与剪枝、bagging与随机森林、极端随机树、Adaboost、GBDT算法外,还有以下几种算法:1 KNNKNN算法不仅可以用于分类,还可以用于回归。通过找出一个样本的k个最近邻居,将这些邻居的某个(些)属性的平均值赋给该样本,就可以得到该样本...原创 2020-04-06 23:40:07 · 7748 阅读 · 0 评论 -
决策树与剪枝、bagging与随机森林、极端随机树、Adaboost、GBDT算法原理详解
1、决策树基本概念:从一组无次序、无规则的实例中推理出决策树表示形式的分类规则。1.1 ID3具体方法是:从根节点开始,对节点计算所有可能的特征的信息增益,选择信息增益最大的特征作为节点的特征,由该特征的不同取值建立子节点;再对子节点递归调用以上方法,构建决策树。基础概念:- 熵:熵越大,随机变量的不确定性越大。- 条件熵:H(Y|X)表示在已知随机变量X的条件下...原创 2020-04-05 23:08:44 · 9610 阅读 · 0 评论 -
回归模型-kaggle房价预测
房价回归模型github链接:环境:python3本文目的1.机器学习的特征工程处理2.各种回归模型的应用本项目完整源码地址:https://github.com/angeliababy/houseprice_regression项目博客地址: https://blog.csdn.net/qq_29153321/article/details/103967670数据准备数据来源是...原创 2020-01-14 09:44:18 · 5794 阅读 · 1 评论 -
简单的聚类kmeans实现及k值个数选择
这篇文章主要参考https://github.com/moka11moka/kmeans-python/tree/master/kmeans点击打开链接https://www.cnblogs.com/pinard/p/6169370.html点击打开链接第一种是简单的二维数据集生成及kmeans聚类算法原理实现,第二种是借助sklearn实现聚类数据集生成及kmeans算法实现,并探索k值...原创 2018-04-21 16:39:57 · 2701 阅读 · 0 评论 -
泰坦尼克号遇难预测-朴素贝叶斯分类
题目来源https://www.kaggle.com/c/titanic,train.csv和test.csv分别为训练集和测试集(生还未知),建模之前必须进行必要的数据分析,比如将一些无关的列剔除掉,在这里只是简单的考量,实际工程中可能还要考虑数据的分布情况,比如均值、方差、每种属性下的存还比率等,并且将训练中的缺失记录剔除掉,利用平均值补齐测试集缺失值(也可以用预测的方法因为缺失不是很多)...原创 2018-04-21 00:43:35 · 4956 阅读 · 1 评论