- 博客(4)
- 收藏
- 关注
原创 【机器学习】基本概念
1. 基本术语机器学习:是基于数据建立模型并运用模型对数据进行预测和分析的一门学科。它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析和预测中。特征/属性:反映事件或对象在某方面的表现或性质的事项。样本:关于一个事件或对象的描述。数据集:多条样本记录的集合。输入空间/输出空间:输入和输出所有可能取值的集合。学习/训练:从数据中学得模型的过程...
2018-10-30 21:44:42 970
原创 【机器学习】多项逻辑斯蒂回归/softmax回归推导与求解
1. 多项逻辑斯蒂回归模型多项逻辑斯蒂回归模型(multi-nominal logistic regression model),又称为Softmax Regression,是一个用来预测离散型随机变量的不同可能结果的概率的模型,用于进行多项分类。前面在逻辑斯蒂回归原理推导与求解中讲到的逻辑斯蒂回归模型是二项分类模型,用于二分类。将其推广为多项分类,假设离散型随机变量的取值集合是,那么多项...
2018-10-14 22:17:15 9473 1
原创 【机器学习】逻辑斯蒂回归原理推导与求解
1.概念逻辑斯蒂回归又称为“对数几率回归”,虽然名字有回归,但是实际上却是一种经典的分类方法,其主要思想是:根据现有数据对分类边界线(Decision Boundary)建立回归公式,以此进行分类。2.特点1. 优点:计算代价不高,具有可解释性,易于实现。不仅可以预测出类别,而且可以得到近似概率预测,对许多需要利用概率辅助决策的任务很有用。2. 缺点:容易欠拟合,分类精度可能不高。...
2018-10-13 22:32:54 12115 3
原创 【机器学习】一文读懂正则化与LASSO回归,Ridge回归
该文已经收录到专题机器学习进阶之路当中,欢迎大家关注。1.过拟合当样本特征很多,样本数相对较少时,模型容易陷入过拟合。为了缓解过拟合问题,有两种方法: 方法一:减少特征数量(人工选择重要特征来保留,会丢弃部分信息)。 方法二:正则化(减少特征参数的数量级)。2.正则化(Regularization)正则化是结构风险(损失函数+正则化项)最小化策略的体...
2018-10-10 20:53:35 71372 15
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人