机器学习
jianminli2
这个作者很懒,什么都没留下…
展开
-
字节跳动数据挖掘算法工程师一面(记录)
1、在做LR的时候,对连续数据做离散化处理的优势是什么? 稀疏向量内积乘法运算速度快,计算结果方便存储,容易scalable(扩展)。 离散化后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄>30是1,否则0。如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大的干扰。 逻辑回归属于广义线性模型,表达能力受限;单变量离散化为N个后,每个变量有单独的权...原创 2019-12-17 18:26:24 · 1662 阅读 · 2 评论 -
深入浅出理解极大似然估计
在机器学习算法中,你能经常看到极大似然估计这个词语。比如在对逻辑回归求解全局最小值的时候就需要用上极大似然估计。极大似然估计是机器学习算法中必须掌握的一个知识点。 极大似然估计是什么意思? 首先,根据字面上来看,极大和估计都比较好理解,极大即最大化,估计即大约计算出来的样子。那么似然是什么意思呢?似然,即(likelihood),牛津词典的解释为可能性(同义词为probability)。所以极...原创 2019-11-20 10:31:50 · 891 阅读 · 0 评论