- 博客(4)
- 收藏
- 关注
原创 机器学习(七) 奇异值分解-SVD
同步更新在个人网站:http://www.wangpengcufe.com/machinelearning/ml-ml7/降维(Dimensionality Reduction) 是机器学习中的一种重要的特征处理手段,它可以减少计算过程中考虑到的随机变量(即特征)的个数,其被广泛应用于各种机器学习问题中,用于消除噪声、对抗数据稀疏问题。它在尽可能维持原始数据的内在结构的前提下,得到一组描述原数...
2019-11-26 18:24:56 737
原创 机器学习 (六) 决策树
同步更新在个人网站:http://www.wangpengcufe.com/machinelearning/ml-ml6/一、概念决策树及其集合是分类和回归的机器学习任务的流行方法。 决策树被广泛使用,因为它们易于解释,处理分类特征,扩展到多类分类设置,不需要特征缩放,并且能够捕获非线性和特征交互。 诸如随机森林和增强的树集合算法是分类和回归任务的最佳表现者。决策树(decision tr...
2019-11-25 14:30:44 581
原创 机器学习 (五)逻辑斯蒂回归
一、概念逻辑斯蒂回归(logistic regression)是统计学习中的经典分类方法,属于对数线性模型。logistic回归的因变量可以是二分类的,也可以是多分类的。logistic回归的因变量可以是二分非线性差分方程类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。二、logistic分布设X是连续随机变量,X服从逻辑...
2019-11-21 12:25:45 601
原创 机器学习(四) 分类
同步更新在个人网站:http://www.wangpengcufe.com/machinelearning/ml-ml4/简书:https://www.jianshu.com/p/59274d7beb26分类分类旨在将项目分为不同类别。 最常见的分类类型是二元分类,其中有两类,通常分别为正数和负数。 如果有两个以上的类别,则称为多类分类。 spark.mllib支持两种线性分类方法:线性支...
2019-11-17 23:22:02 412
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人