机器学习&数据挖掘
JackieChen1992
看好多好多好书,交好多好多好朋友。
展开
-
机器学习常见的六大错误
机器学习的几大误区转载 2017-03-17 23:20:43 · 397 阅读 · 0 评论 -
机器学习实践1:基于logistic regression的性别预测
一、背景简介 XX公司用户性别预测是我进入机器学习领域的HelloWorld级工程实践。也是第一个从业务需求分析、数据源调研完整的工程。非常有幸能接触到这个难度不是很大,但是却很好将我带入机器学习的世界。前后大约花了4个月的时间做了三个版本,这是其中第二个版本,这个版本耗时大约1.5个月。二、整个预测流程1.基本信息 算法:采用LR算法 环原创 2017-04-18 03:16:37 · 4849 阅读 · 3 评论 -
机器学习系列笔记1:《统计学习》李航博士 第一章 统计学习方法概论
-经典决策树算法(Mark下,这周逐步更新相关学习进程、感想、个人实现代码)。原创 2017-08-21 23:00:27 · 455 阅读 · 0 评论 -
Mac上安装Python相关扩展包异常
安装scikit-learn1)报错提示pypi.v2ex.com不是受信的安全节点chenwenxindembp:bin chenwenxin$ pip install scikit-learnCollecting scikit-learn The repository located at pypi.v2ex.com is not a trusted or secure hos原创 2017-09-24 23:31:39 · 1377 阅读 · 0 评论 -
一个讲Bagging和Boosting很清晰的blog,转载和收藏
http://www.cnblogs.com/liuwu265/p/4690486.html转载 2017-09-15 11:44:27 · 257 阅读 · 0 评论 -
从论文中寻找知识、思路、最新研究成果
最近在看一篇Boosting的论文。论文题目《Resampling or Reweigting : A Comparsion of Boosting Implementations》。内容讲述的是Boosting的两种实现方式,“重采样法”、“重赋权法”。 通过论文大概了解两个知识:1.重赋权法、重采样法两种Boosting的实现方式;2.两种实现方式的对比。论文通过对10种Boosti原创 2017-08-29 23:22:17 · 502 阅读 · 0 评论 -
归一化
1.归一化让特征值在同一范围,可以加快模型训练时梯度下降的速度;2.归一化让模型训练结果(特征的权重值)有可比性,可以根据值大小判断特征的显著性;原创 2017-08-28 23:19:25 · 385 阅读 · 0 评论 -
统计学习三要素——模型、策略、算法
模型假设空间适合当前问题和数据集函数关系。简单来说就是使用什么映射函数(X和Y之间的关系F,以及参数)策略设定目标函数,最优化的方向。往往是损失函数和风险函数的组合。算法如何获取最优化的解。本质上就是计算机算法,怎么去求数学问题的最优化解。正规方程还是梯度下降等等。原创 2017-08-25 07:52:02 · 618 阅读 · 0 评论 -
机器学习十大课程
转载机器学习十大课程,原文链接:http://m.leiphone.com/news/201701/0milWCyQO4ZbBvuW.html?from=timeline&isappinstalled=0&viewType=weixin包括吴恩达的斯坦福机器学习课程等,尊重原创,可以去原文链接去看具体内容。转载 2017-04-16 00:05:15 · 619 阅读 · 1 评论 -
统计学习三要素引发的思考
李航博士,在《统计学习》一书中提到这统计学习三要素:模型、策略和算法。该文是对这三者之一的模型的探讨。原创 2017-03-15 00:53:21 · 748 阅读 · 0 评论 -
数据的准确性对模型效果的重要性
今天讲一个性别预测问题,采用 LR 模型,特征选择( App 的安装、卸载、操作、昵称、手机颜色、手机型号、手机前置摄像头使用、镜子 App 使用等维度)。下面是相同的特征工程,但是由于数据源的过滤策略不同问题,导致模型训练效果差别巨大。原创 2017-03-18 00:19:15 · 6236 阅读 · 0 评论 -
Github resources about MachineLearning,DeepLearning and relevant Interviews
声明:非利益相关,Git仓内资源非博主原创,来自github大佬,纯粹广而告之,侵删!1、内容截图2、Github地址直达:Github地址地址:https://github.com/imhuay/Algorithm_Interview_Notes-Chinese...原创 2018-10-07 00:37:16 · 198 阅读 · 0 评论