![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
_missTu_
努力大于天赋的女孩,英语专八通过者,岗位是算法工程师。
展开
-
数据样本类别不平衡
标题训练集中类别不平衡,会引起什么评估指标最不准确?准确度(Accuracy)(注意与精度区分)对于二分类问题来说,正负样例比相差较大为99:1,模型更容易被训练成预测较大占比的类别。因为模型只需要对每个样例按照0.99的概率预测正类,该模型就能达到99%的准确率。样本不均衡(数据倾斜)解决办法?数据层面1. 上采样:Smote过采样方法,基于插值来为少数类合成新的样本(构建新的样本...原创 2019-05-24 14:08:45 · 990 阅读 · 0 评论 -
LR 逻辑回归模型
1. 原理LR虽然叫逻辑回归,但LR即可以用来回归,也可以用来分类,主要是二分类。LR可以被认为是一个被sigmoid函数所“归一化”后的结果。2. 算法步骤(1)寻找h函数(即hypothesis);(2)构造J函数(损失函数);(3) 想办法使得J函数最小并求得回归参数(θ)2.1 寻找h函数在线性回归中:h(θ)=θTX=θ0+θ1x1+θ2x2+......+θnxn h(...原创 2019-06-20 11:35:28 · 271 阅读 · 0 评论