![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
authorized_keys
这个作者很懒,什么都没留下…
展开
-
[转载] 在进行数据分析的时候,什么情况下需要对数据进行标准化处理?
主要从模型的伸缩不变性和迭代算法的效率两个角度考虑。转载 2021-02-20 17:35:34 · 2335 阅读 · 0 评论 -
Python imblearn 解决 类别不平衡问题
0. 问题背景及解决方法类别不平衡问题类别不平衡问题,顾名思义,即数据集中存在某一类样本,其数量远多于或远少于其他类样本,从而导致一些机器学习模型失效的问题。例如逻辑回归即不适合处理类别不平衡问题,例如逻辑回归在欺诈检测问题中,因为绝大多数样本都为正常样本,欺诈样本很少,逻辑回归算法会倾向于把大多数样本判定为正常样本,这样能达到很高的准确率,但是达不到很高的召回率。...原创 2019-11-12 13:07:11 · 1586 阅读 · 0 评论 -
pandas loc与iloc的区别
loc 可用“字符”、“整数”、“布尔值”作为索引,也就是标签索引注意:此处的“整数”将被解释为index的一个label而不是index的位置iloc 只允许“整数”作为索引,也就是位置索引,和列表索引类似,里面只能是数字注意:此处的“整数”将被解释为index的位置,前闭后开其中,loc是指location,i是指integer原创 2019-10-16 09:20:06 · 491 阅读 · 0 评论 -
categorical variable 分类变量的处理流程
# categorical variable 分类变量针对回归问题:设目标变量为Xi,因变量为y1. 检查变量Xi是否含有空值,若有,先补充一般要根据变量的实际意义,并参考其相关的变量进行补值。例,PoolQC: Pool quality Ex Excellent Gd Good TA Av...原创 2019-10-14 09:56:19 · 1649 阅读 · 0 评论