![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 62
glanose
用人类大脑学习机器学习
展开
-
第一次参加Kaggle
感受:真的能学到好多东西。感觉最大的不同就是kaggle里你是按照自己的想法去写代码的,想到哪里写哪里,如果一个语法写不出来就用别的办法绕过,所以基本上都能写出来。终于没有那种被python的奇葩语法各种烦的感觉了,可能是自己也熟一点了,也可能是感觉自己做的事情更有意义了。而且最后看看自己是怎么被大神各种虐的,学到一招两招,也是超爽的感觉。原创 2016-09-25 21:46:30 · 2718 阅读 · 6 评论 -
CART,回归树,GBDT,XGBoost,LightGBM一路理解过来
CART,回归树,GBDT,XGBoost,LightGBMCART:根据特征的阈值把叶子节点的类别归为离散的类别 XGBoost的四大改进:①改进残差函数不用Gini作为残差,用二阶泰勒展开+树的复杂度(正则项)带来如下好处:1.可以控制树的复杂度2.带有关于梯原创 2017-09-25 16:44:38 · 5797 阅读 · 0 评论 -
腾讯社交广告大赛回来的感悟
腾讯社交广告大赛回来的感悟参赛优秀队伍合照原创 2017-09-01 13:57:17 · 934 阅读 · 1 评论 -
XGBoost代码走读分析笔记
http://blog.csdn.net/a819825294/article/details/51206410#t6读了雪伦大佬的走读分析,非常清晰,我写一下自己的理解,狗尾续貂了XGBoost运行流程:简略来说,XGBoost只做两件事:1.main函数调用InitModel初始化模型,初始化的时候选择Loss,及分类器2.迭代用Boost方法更新模型(UpdateOneIter),每次更新的时候做几个操作:PredictRaw,GetGradient,DoBoost。分别是计算残差,计算原创 2017-09-25 17:28:18 · 837 阅读 · 0 评论 -
【面试复习系列】常用机器学习算法知识点及其解析,面试官会考的几乎都有,欢迎补充
分享复习笔记,常用机器学习算法知识点及其解析,面试官会考的几乎都有图片慢慢上传,看不到图片的请点这里:http://4521839a.wiz03.com/share/s/158oeq3LFAsF2duuJq0KKwt40G2y9O1Z6QIa2KErcq2NI_O_原创 2017-08-14 19:00:45 · 2800 阅读 · 0 评论 -
实习笔记——如何把实验室科研数据分析项目变成能部署到生产环境中的工程
如何把:实验室里是,脆弱的,低鲁邦的,强依赖的,工使用流程很麻烦的数据分析项目变成:仅有基本编程基础就可以调用的,应用到各个平台上的,兼顾性能和准确性的项目这篇文章主要想探讨其中的方法论,适用于所有数据分析项目的上线原创 2017-03-23 18:58:35 · 473 阅读 · 1 评论 -
在实习的公司遇到大量的无标签数据怎么办——利用SVM进行Active Learning主动学习
怎么办?进行Active Learning主动学习Active Learning是最近又流行起来了的概念,是一种半监督学习方法。一种典型的例子是:在没有太多数据的情况下,算法通过不断给出在决策边界上的样本,让打标者进行打标,使得算法明确分类边界,该算法结合On-Line的使用和灰度测试等方法,可以在有大量无标签数据和大量用户资源的时候,从无到有地创建良好的分类器。如何进行主动学原创 2017-10-15 15:56:36 · 7425 阅读 · 0 评论 -
如何从零开始写一份标准的TensorFlow代码(面向小白编程)
一步一步对照代码写出规范的TensorFlow代码,面向只会函数式Python编程的小白(如鄙人)原创 2017-06-30 16:48:59 · 5013 阅读 · 0 评论 -
机器学习的学习方法
先学会一些常用数学,统计,思考方式等工具。然后理解新的模型的“步骤”(当有工具的时候,大概了解在数学上和哲学上这些模型是怎么构筑的就行,详细的证明当数学熟练后可以推出)原创 2017-11-27 23:23:50 · 402 阅读 · 0 评论 -
XGBoost模型跟Logistic Regression模型的本质区别
把握机器学习算法关键点有两个1、loss function的理解(包括:特征X/标签Y配对的建模,X/Y配对建模的loss function的设计)。2、loss function的求解过程。这两点串接在一起构成了算法实现的主框架。原创 2017-09-24 22:41:24 · 11565 阅读 · 0 评论 -
腾讯校招基础研究岗相关:请解释LR/logistic regression/对数几率回归/逻辑回归/逻辑斯蒂回归
据说每一个机器学习学习者都会写一篇有关自己对LR的理解文章,查了很多资料后,我今天就写一下我的LR。本文的重点是:为什么要LR,为什么要用logistic函数,为什么要用对数几率,以及他们是怎么求出来的。(我不喜欢公式,但是有的时候比文字更清楚,所以这篇文章里的公式要么就是可以忽略的,要么两个公式之间一定是可以2分钟内推出来的,也就是说是能很简单的理解“为什么从这个公式能变成这个”的)原创 2017-09-02 12:17:57 · 1232 阅读 · 0 评论 -
LeCun 推荐!50 行 PyTorch 代码搞定 GAN
【转自新智元(微信号:AI_era)】Ian Goodfellow 提出令人惊叹的 GAN 用于无人监督的学习,是真正AI的“心头好”。而 PyTorch 虽然出世不久,但已俘获不少开发者。本文介绍如何在PyTorch中分5步、编写50行代码搞定GAN。下面一起来感受一下PyTorch的易用和强大吧。转载 2017-02-20 22:01:02 · 1424 阅读 · 0 评论 -
机器学习电话面/视频面 cheetsheet ——常用机器学习算法优缺点一览(可直接打印)
机器学习电话面/视频面 cheetsheet ——常用机器学习算法优缺点一览(可直接打印)原创 2017-03-03 11:27:30 · 943 阅读 · 1 评论 -
RandomizedSearchCV和GridSearchCV,在调用fit方法的时候产生'list' object has no attribute 'values'错误之处理方法
RandomizedSearchCV和GridSearchCV,在调用fit方法的时候产生'list' object has no attribute 'values'错误之处理方法【pyhon 版本 3.5.0 skit-learn版本<0.18.1>】原创 2017-02-24 10:29:41 · 18456 阅读 · 1 评论 -
【scikit-learn algorithm cheat sheet】【汉化版】scikit-learn算法选择路径图
英文原版链接:http://scikit-learn.org/stable/tutorial/machine_learning_map/看得有点累,做了个汉化版汉化版:(有很多名词合理地强行翻译了一下,否则全英文的词汇太多,查不到的时候,请看看下面的原版)英文原版(2016年9月30日最后更新):原创 2016-09-30 05:16:24 · 8274 阅读 · 1 评论 -
如何选择一个合适的深度学习网络
当面临一个具体的深度学习问题的时候,最好的办法当然是先查找相关方面的论文,借助前人设计好的网络架构开始,从前人的基础上出发。但是对于一些常用的问题,有一些常用的解题方法,这里展示一份来自deeplearning4j的小抄。(原文地址:https://deeplearning4j.org/neuralnetworktable#how-to-choose-a-neural-network)翻译 2017-03-28 09:45:55 · 2375 阅读 · 0 评论 -
TensorFlow 面向专家的Minist笔记(中文,简化版)(Deep MNIST for Experts)
placehoder数据类型:x = tf.placeholder(tf.float32, shape=[None, 784])表示placehoder的大小,任意行数,仅要求列数为784placehoder对数据的尺寸作自调整Variable数据类型:W = tf.Variable(tf.zeros([784,10]))Variable必须手动初始化才可使原创 2017-04-07 17:16:14 · 784 阅读 · 0 评论 -
机器学习问题的可解性的变化,不可能的事情正在慢慢变成现实
以前说美帝通过买给中国挖土机,通过挖土机里的芯片可以知道你哪里在开工建设,觉得有可能又有点不现实,大概是边界。现在觉得完全可以了,这方案已经很现实了不可能的东西,也存在了(例子:多角度物体识别)从某种角度来看,可能是VC维的问题,样本变多,低VC维的模型也被发明出来原创 2017-06-20 18:33:46 · 486 阅读 · 0 评论 -
机器学习趋向于平民化
机器学习趋向于平民化,但是盈利空间不明显。图像不明显,医学用上了,提升了,渐进的,所以不明显,蛋糕也不大。顺丰京东的前置仓储,也有可能因渐进跟提升性而……性能收敛后,就会趋于后台化,成为一个后台算法,所以要想清楚机器学习的意义:充分利用数据。考虑到nfl跟vc维,可能是数据量爆炸阶段的一个迟来的部件,有点像火花塞一样的东西,大家都有,性能差不多,贵的好一点,科技原创 2017-06-20 18:35:37 · 411 阅读 · 0 评论 -
机器学习初学者的TensorFlow笔记
最近在自学机器学习相关知识,感觉Google出的TensorFlow有一定的发展前途,于是进行了解了一下,并用最简单的语音尝试描述TensorFlow的使用方法和运作思路原创 2016-05-03 21:51:13 · 1647 阅读 · 0 评论 -
(更新)数据挖掘,自学一年拿了腾讯京东华为网易YY的Offer,方法与建议
成果秋招结束了,我最终获得了:腾讯京东华为网易游戏欢聚时代搜狐视频这几个offer,均待遇不错,收获颇丰。写作动机回想起一年多以前选择数据挖掘的时候,一度以为找不到工作,非常着急。幸好有令科,梅寒,志韬等师兄为我解答了很多迷津。于是也尝试记录一下自己的学习历程,鉴于往事,以资于后道。 全文分成6个阶段,文章有点长,各位可以直接去看自己的那个阶段,看看我过原创 2017-11-02 12:56:09 · 8533 阅读 · 4 评论