机器学习
云定止水
这个作者很懒,什么都没留下…
展开
-
文本分类
主题模型及其在文本情感分析中的应用原创 2017-01-12 17:16:36 · 438 阅读 · 0 评论 -
机器学习面试准备
距离度量文本相似度文本相似性算法推荐系统分类算法逻辑回归朴素贝叶斯KNN决策树过拟合同时在分类时,有时会遇到过拟合问题,怎么解决呢???? 1. 减少feature个数(人工定义留多少个feature、算法选取这些feature) 2. 规格化(留下所有的feature,但对于部分feature定义其parameter非常小) Stanford Machine Learning: (3). R原创 2016-12-20 22:21:15 · 383 阅读 · 0 评论 -
CTR预估
CTR预估算法小结深入FFM原理与实践 CTR预估中GBDT与LR融合方案杨鹏谈世纪佳缘推荐算法:基于Spark GraphX,弃GBDT和LR用FM原创 2017-01-12 21:41:59 · 552 阅读 · 0 评论 -
FTRL之初学笔记
理论FTRL的发展历程,见微博团队冯杨的在线最优化求解.pdf 网页版见在线最优化求解(Online Optimization)之五:FTRL原始论文:https://www.eecs.tufts.edu/~dsculley/papers/ad-click-prediction.pdf 原论文的中文总结:Google广告点击预估 [KDD2013],其他注释如:各大公司广泛使用的在线学习算法FT原创 2017-05-03 09:33:09 · 3150 阅读 · 0 评论 -
逻辑回归理论及实践
理论为了加深对logistic回归的理解,最好理解广义线性模型和逻辑回归的关系 斯坦福CS229机器学习课程笔记二:GLM广义线性模型与Logistic回归 从广义线性模型到逻辑回归实践源码编写Python实践之(七)逻辑回归(Logistic Regression)第三方工具pythonLogistic Regression in python 对应的中文版python实现逻辑回归Rucla的原创 2017-05-02 13:58:21 · 486 阅读 · 0 评论 -
大公司技术博客站点汇总
美团大数据平台&推荐算法 http://tech.meituan.com/原创 2017-01-12 20:00:31 · 588 阅读 · 0 评论 -
样本不均衡问题
概述learning-imbalanced-classes 非常好的一篇文章,里边提到了指标评估、不同解决方法的难易程度。核心是关注数据本身的特点,来进行选择。主流方法采样Sampling-based methods上采样 增加少数类的样本/正样本),如SMOTE,这种方法应用较多下采样 减少多数类的样本/负样本混合 增加正样例、同时减少负样例)(实际中,用的不原创 2018-01-29 14:37:27 · 1956 阅读 · 0 评论