![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 84
七七喝椰奶
基本功决定高度
展开
-
机器学习——实践
比如风控或者入侵检测,这两类任务都具有严重的数据不平衡问题,可以在算法学习的时候,为少类样本设置更高的学习权重,从而让算法更加专注于少类样本的分类情况,提高对少类样本分类的查全率,但是也会将很多多类样本分类为少类样本,降低少类样本分类的查准率。下图是模型复杂度与误差的关系,一般来说,随着模型复杂度的增加,方差会逐渐增大,偏差会逐渐减小,在虚线处,差不多是模型复杂度的最恰当的选择,其“偏差”和“方差”也都适度,才能“适度拟合”。偏差Bias:描述的是预测值(估计值)的期望与真实值之间的差距。原创 2023-11-10 23:24:16 · 661 阅读 · 0 评论 -
机器学习——朴素贝叶斯
在这里的情况下,可能单词是['a', 'great', 'very', 'over', 'it', 'but', 'game', 'election', 'clean', 'close', 'the', 'was', 'forgettable', 'match']。学习联合概率的方法:利用训练数据学习P(X|Y)的估计,与先验的P(Y)相乘,得到 P(X,Y)=P(X|Y) P(Y)我们要求的是P(Y|X),根据生成模型定义我们可以求P(X,Y)和P(Y)。P(Not Sports )是⅖。原创 2023-11-10 17:26:15 · 649 阅读 · 0 评论 -
机器学习——逻辑回归
我们先定义其中一类为类型1(正类),其余数据为负类(rest);接下来去掉类型1数据,剩余部分再次进行二分类,分成类型2和负类;如果有n类,那就需要分类n-1次 步骤:①->②->③->……σ(z)代表一个常用的逻辑函数(logistic function)为S形函数(Sigmoid function);们先从用蓝色圆形数据定义为类型1,其余数据为类型2。只需要分类1次 步骤:①->②。当σ(z)大于等于0.5时,预测 y =1。当σ(z)小于0.5时,预测 y =0。当 λ 的值开始上升时,降低了方差。原创 2023-11-08 10:04:05 · 688 阅读 · 1 评论 -
机器学习——回归
线性回归(Linear Regression)是一种通过属性的线性组合来进行预测的线性模型,其目的是找到一条直线或者一个平面或者更高维的超平面,使得预测值与真实值之间的误差最小化。原创 2023-11-07 09:11:09 · 2766 阅读 · 3 评论 -
机器学习概论
通过这张图可以看出,各种不同算法在输入的数据量达到一定级数后,都有相近的高准确度。原创 2023-11-06 21:30:13 · 442 阅读 · 1 评论