![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
_missTu_
努力大于天赋的女孩,英语专八通过者,岗位是算法工程师。
展开
-
数据样本类别不平衡
标题训练集中类别不平衡,会引起什么评估指标最不准确? 准确度(Accuracy) (注意与精度区分) 对于二分类问题来说,正负样例比相差较大为99:1,模型更容易被训练成预测较大占比的类别。因为模型只需要对每个样例按照0.99的概率预测正类,该模型就能达到99%的准确率。 样本不均衡(数据倾斜)解决办法? 数据层面 1. 上采样: Smote过采样方法,基于插值来为少数类合成新的样本(构建新的样本...原创 2019-05-24 14:08:45 · 995 阅读 · 0 评论 -
LR 逻辑回归模型
1. 原理 LR虽然叫逻辑回归,但LR即可以用来回归,也可以用来分类,主要是二分类。LR可以被认为是一个被sigmoid函数所“归一化”后的结果。 2. 算法步骤 (1)寻找h函数(即hypothesis); (2)构造J函数(损失函数); (3) 想办法使得J函数最小并求得回归参数(θ) 2.1 寻找h函数 在线性回归中: h(θ)=θTX=θ0+θ1x1+θ2x2+......+θnxn h(...原创 2019-06-20 11:35:28 · 274 阅读 · 0 评论