数据分析
文章平均质量分 66
glanose
用人类大脑学习机器学习
展开
-
LeCun 推荐!50 行 PyTorch 代码搞定 GAN
【转自新智元(微信号:AI_era)】Ian Goodfellow 提出令人惊叹的 GAN 用于无人监督的学习,是真正AI的“心头好”。而 PyTorch 虽然出世不久,但已俘获不少开发者。本文介绍如何在PyTorch中分5步、编写50行代码搞定GAN。下面一起来感受一下PyTorch的易用和强大吧。转载 2017-02-20 22:01:02 · 1438 阅读 · 0 评论 -
17年春,机器学习实习,腾讯四个BG,五次面试实录。
背景:本人就读于华南理工大学,是985。17年春,忽逢腾讯面试,中有WXG,CDG鲜美,IEG缤纷,TEG若有光。复前行,欲穷其面。原创 2017-09-01 13:56:21 · 8136 阅读 · 4 评论 -
实习笔记——如何把实验室科研数据分析项目变成能部署到生产环境中的工程
如何把:实验室里是,脆弱的,低鲁邦的,强依赖的,工使用流程很麻烦的数据分析项目变成:仅有基本编程基础就可以调用的,应用到各个平台上的,兼顾性能和准确性的项目这篇文章主要想探讨其中的方法论,适用于所有数据分析项目的上线原创 2017-03-23 18:58:35 · 489 阅读 · 1 评论 -
【面试复习系列】常用机器学习算法知识点及其解析,面试官会考的几乎都有,欢迎补充
分享复习笔记,常用机器学习算法知识点及其解析,面试官会考的几乎都有图片慢慢上传,看不到图片的请点这里:http://4521839a.wiz03.com/share/s/158oeq3LFAsF2duuJq0KKwt40G2y9O1Z6QIa2KErcq2NI_O_原创 2017-08-14 19:00:45 · 3105 阅读 · 0 评论 -
腾讯社交广告大赛回来的感悟
腾讯社交广告大赛回来的感悟参赛优秀队伍合照原创 2017-09-01 13:57:17 · 952 阅读 · 1 评论 -
CART,回归树,GBDT,XGBoost,LightGBM一路理解过来
CART,回归树,GBDT,XGBoost,LightGBMCART:根据特征的阈值把叶子节点的类别归为离散的类别 XGBoost的四大改进:①改进残差函数不用Gini作为残差,用二阶泰勒展开+树的复杂度(正则项)带来如下好处:1.可以控制树的复杂度2.带有关于梯原创 2017-09-25 16:44:38 · 5826 阅读 · 0 评论 -
XGBoost模型跟Logistic Regression模型的本质区别
把握机器学习算法关键点有两个1、loss function的理解(包括:特征X/标签Y配对的建模,X/Y配对建模的loss function的设计)。2、loss function的求解过程。这两点串接在一起构成了算法实现的主框架。原创 2017-09-24 22:41:24 · 11655 阅读 · 0 评论 -
腾讯校招基础研究岗相关:请解释LR/logistic regression/对数几率回归/逻辑回归/逻辑斯蒂回归
据说每一个机器学习学习者都会写一篇有关自己对LR的理解文章,查了很多资料后,我今天就写一下我的LR。本文的重点是:为什么要LR,为什么要用logistic函数,为什么要用对数几率,以及他们是怎么求出来的。(我不喜欢公式,但是有的时候比文字更清楚,所以这篇文章里的公式要么就是可以忽略的,要么两个公式之间一定是可以2分钟内推出来的,也就是说是能很简单的理解“为什么从这个公式能变成这个”的)原创 2017-09-02 12:17:57 · 1246 阅读 · 0 评论 -
数据分析,信息检索,分类体系中常用指标简明解释——关于准确率、召回率、F1、AP、mAP、ROC和AUC
数据分析,信息检索,分类体系中常用指标简明解释——关于准确率、召回率、F1、AP、mAP、ROC和AUC在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。转载 2016-10-20 18:04:40 · 6450 阅读 · 2 评论 -
机器学习趋向于平民化
机器学习趋向于平民化,但是盈利空间不明显。图像不明显,医学用上了,提升了,渐进的,所以不明显,蛋糕也不大。顺丰京东的前置仓储,也有可能因渐进跟提升性而……性能收敛后,就会趋于后台化,成为一个后台算法,所以要想清楚机器学习的意义:充分利用数据。考虑到nfl跟vc维,可能是数据量爆炸阶段的一个迟来的部件,有点像火花塞一样的东西,大家都有,性能差不多,贵的好一点,科技原创 2017-06-20 18:35:37 · 422 阅读 · 0 评论 -
机器学习问题的可解性的变化,不可能的事情正在慢慢变成现实
以前说美帝通过买给中国挖土机,通过挖土机里的芯片可以知道你哪里在开工建设,觉得有可能又有点不现实,大概是边界。现在觉得完全可以了,这方案已经很现实了不可能的东西,也存在了(例子:多角度物体识别)从某种角度来看,可能是VC维的问题,样本变多,低VC维的模型也被发明出来原创 2017-06-20 18:33:46 · 501 阅读 · 0 评论 -
RandomizedSearchCV和GridSearchCV,在调用fit方法的时候产生'list' object has no attribute 'values'错误之处理方法
RandomizedSearchCV和GridSearchCV,在调用fit方法的时候产生'list' object has no attribute 'values'错误之处理方法【pyhon 版本 3.5.0 skit-learn版本<0.18.1>】原创 2017-02-24 10:29:41 · 18496 阅读 · 1 评论 -
机器学习电话面/视频面 cheetsheet ——常用机器学习算法优缺点一览(可直接打印)
机器学习电话面/视频面 cheetsheet ——常用机器学习算法优缺点一览(可直接打印)原创 2017-03-03 11:27:30 · 958 阅读 · 1 评论 -
用python2.7 做sogou字典处理编码的时候踩过的坑——学习笔记【文字编码转换 decode chardet】
做完这一次有点不信任txt了太多编码了 utf-8 unicode gbk gbk的子集gb12236 ansi ansi方法的gbk....windows自带的是ansi方法的gbk要转码,wps>notepad++>subline>>windows自带。wps的转码最多最清楚,notepad++的自动识别比subline好,起码能读如果是unicode或者什么的原创 2017-02-14 17:37:43 · 543 阅读 · 0 评论 -
如何从零开始写一份标准的TensorFlow代码(面向小白编程)
一步一步对照代码写出规范的TensorFlow代码,面向只会函数式Python编程的小白(如鄙人)原创 2017-06-30 16:48:59 · 5033 阅读 · 0 评论