学习笔记
文章平均质量分 56
glanose
用人类大脑学习机器学习
展开
-
感谢python和pandas让我找回了刚学编程的时候的感觉
就是这样的感觉:迷茫,不知所措,一个很简单的东西搞了半天一事无成,我甚至怀疑自己会不会编程。原创 2016-09-22 21:48:17 · 535 阅读 · 0 评论 -
XGBoost代码走读分析笔记
http://blog.csdn.net/a819825294/article/details/51206410#t6读了雪伦大佬的走读分析,非常清晰,我写一下自己的理解,狗尾续貂了XGBoost运行流程:简略来说,XGBoost只做两件事:1.main函数调用InitModel初始化模型,初始化的时候选择Loss,及分类器2.迭代用Boost方法更新模型(UpdateOneIter),每次更新的时候做几个操作:PredictRaw,GetGradient,DoBoost。分别是计算残差,计算原创 2017-09-25 17:28:18 · 842 阅读 · 0 评论 -
机器学习中检验样本抽样的均匀——KL散度检验和K-S检验
最近做的一个项目中,需要对原来的数据进行一定量的采样形成训练集,因此需要保证采样的均匀性以保证样本参数的同分布性。样本数据是这样的:ID.wavDate可以看到,样本数据只有日期参数可以使用,所以我采用对抽样后的样本跟总体的日期参数进行分布检验的方法。因为日期的分布不具有分布假设,所以需要用非参数检验方法,直接比较两个分布的差异,我找到两种方法:1.机器学习中常用的KL散度方法2.社会统计学中常用...原创 2017-09-26 12:29:39 · 6796 阅读 · 0 评论 -
♥C++宏观技巧笔记
宏观问题:从最直观的的做法开始,一步一步优化,并不是每个人都能第一时间想到最优解,要让代码在第一时间内正确的运行才是首要的,然后在不影响代码的外观行为下改进代码。对于面向对象编程的程序员来说,自顶而下的思考方法才能发挥面向对象的真正威力,通过抽象,我们可以在编码的一开始就已经构建好整个框架,这样有利于我们工作进度的把握和测试,更加能够锻炼程序员的抽象能力,这在接口设计中非常重要,而接口的设原创 2017-09-01 14:06:03 · 356 阅读 · 0 评论 -
华为宣讲会记录,各个部门的人工智能的分工
中央软件院是造轮子的,云平台,平台类2012中央研究院,一堆做不同的东西的实验室,研究未来的技术研发能力中心,孵化器,产生点东西给其他bg,每个产品都只有几个消费者,待遇最好,交付压力最大,研究现在的技术不同的研发地点是否对应于不同的研发领域:否,每个bg都是什么都做的原创 2017-09-01 14:03:17 · 3816 阅读 · 0 评论 -
Voice Conversion 项目笔记(含从VCC 2016匿名比赛深挖的各前沿方法性能对比)
voice conversion 基本架构:voice conversion 任务主要由两个步骤构成,特征提取与特征参数转换,对于这两个步骤,都有相应的常用的技术,这两个步骤中常用的技术各种排列组合,就产生了众多VC系统,以下做小汇总。STEP1:Feature extraction STEP2:Feature conv原创 2017-09-01 13:40:03 · 10118 阅读 · 2 评论 -
【面试复习系列】常用机器学习算法知识点及其解析,面试官会考的几乎都有,欢迎补充
分享复习笔记,常用机器学习算法知识点及其解析,面试官会考的几乎都有图片慢慢上传,看不到图片的请点这里:http://4521839a.wiz03.com/share/s/158oeq3LFAsF2duuJq0KKwt40G2y9O1Z6QIa2KErcq2NI_O_原创 2017-08-14 19:00:45 · 2930 阅读 · 0 评论 -
在实习的公司遇到大量的无标签数据怎么办——利用SVM进行Active Learning主动学习
怎么办?进行Active Learning主动学习Active Learning是最近又流行起来了的概念,是一种半监督学习方法。一种典型的例子是:在没有太多数据的情况下,算法通过不断给出在决策边界上的样本,让打标者进行打标,使得算法明确分类边界,该算法结合On-Line的使用和灰度测试等方法,可以在有大量无标签数据和大量用户资源的时候,从无到有地创建良好的分类器。如何进行主动学原创 2017-10-15 15:56:36 · 7436 阅读 · 0 评论 -
《深度学习》/《Deep Learning》——深度学习圣经的读书笔记
学习方法对着书看一遍,把理解的内容写成笔记看完一章后,看着笔记和书,把内容复习一下,把需要画线的地方画好并理解逐层深入:这本书讲解基础概念讲得不生动,但是高层次上有很多不错的高瞻远瞩的见解,所以先看网文理解到基本的网络(如RNN-LSTM),然后看书深化理解*. JumpingJumping ReadRead:读某一章很痛苦的时候,先读后面一章,然后返回来读熟悉语音,VAE,tf,pytho原创 2017-11-03 22:15:17 · 17360 阅读 · 0 评论 -
400字重写深度学习的知识框架
跑模型太无聊,想重新整理自己对深度学习的理解,重写知识框架。本来300字应该能写完的,不过要加上例子就400字吧。原创 2017-11-19 23:23:27 · 562 阅读 · 0 评论 -
状态机编程
状态机编程原创 2017-09-25 16:52:06 · 515 阅读 · 0 评论 -
如何从零开始写一份标准的TensorFlow代码(面向小白编程)
一步一步对照代码写出规范的TensorFlow代码,面向只会函数式Python编程的小白(如鄙人)原创 2017-06-30 16:48:59 · 5022 阅读 · 0 评论 -
机器学习的学习方法
先学会一些常用数学,统计,思考方式等工具。然后理解新的模型的“步骤”(当有工具的时候,大概了解在数学上和哲学上这些模型是怎么构筑的就行,详细的证明当数学熟练后可以推出)原创 2017-11-27 23:23:50 · 405 阅读 · 0 评论 -
pytorch安装问题,使用soumith的conda源,下载安装很慢的解决方法
那个清华镜像的版本又太低,尝试了很多办法,最终方案却很简单:首先更新pip(非anaconda使用者请跳过这步):conda install pipconda update pip尝试用官网的pip源安装,如下:pip install http://download.pytorch.org/whl/cu80/torch-0.2.0.post3-cp35-cp35m-man原创 2017-12-04 13:45:43 · 23909 阅读 · 2 评论 -
官网安装tensroflow遇到Could not find a version that satisfies the requirement tensorflow-tensorboard
环境:Python 3.6.3Anaconda 5.0.1Ubuntu 16.04仿照官网安装tensorflow-gpu出错pip install --ignore-installed --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.5.0-cp36-cp36m-linux_x86_64...原创 2018-02-12 15:07:35 · 8633 阅读 · 2 评论 -
如何能紧紧跟上最新技术
深度学习中,经常出现某一些大佬突然整出了个很厉害的东西,把过去很多的尝试和努力都一下子清掉了。这种快速的发展让我感到危机感,并去思考如何保证能实时追踪最新技术。首先,提炼需求:实际上我们真正怕的就是有人闭门造车,而且还很牛逼的车,一下子把过去的努力秒掉了。如果是这样的话,大家一开始都是被秒的,以后看谁结合得快,跟行业结合得好有盈利,这应该就需要上面1+2的积累真正怕的不是闭门造车,而是车公布了以后...原创 2018-04-22 21:25:20 · 881 阅读 · 0 评论 -
腾讯社交广告大赛回来的感悟
腾讯社交广告大赛回来的感悟参赛优秀队伍合照原创 2017-09-01 13:57:17 · 938 阅读 · 1 评论 -
CART,回归树,GBDT,XGBoost,LightGBM一路理解过来
CART,回归树,GBDT,XGBoost,LightGBMCART:根据特征的阈值把叶子节点的类别归为离散的类别 XGBoost的四大改进:①改进残差函数不用Gini作为残差,用二阶泰勒展开+树的复杂度(正则项)带来如下好处:1.可以控制树的复杂度2.带有关于梯原创 2017-09-25 16:44:38 · 5809 阅读 · 0 评论 -
XGBoost模型跟Logistic Regression模型的本质区别
把握机器学习算法关键点有两个1、loss function的理解(包括:特征X/标签Y配对的建模,X/Y配对建模的loss function的设计)。2、loss function的求解过程。这两点串接在一起构成了算法实现的主框架。原创 2017-09-24 22:41:24 · 11602 阅读 · 0 评论 -
被python坑怕了,怀念java
今天有两个QQ群,要比较一下两个群的人,保证所有人都加了这里两个群。本来想用excel随便弄弄的,结果学了python,numpy,pandas这些东西差不多有半个月了,就想试着用结果搞了接近两个小时,吐血。。。。。在qq群管理里把数据粘到excel,清理,读入,这都很快,十来分钟就搞定了。结果后面一个多小时都在弄怎么把只出现了一次的值清理出来。百度,google,st原创 2016-09-22 15:02:31 · 1080 阅读 · 1 评论 -
第一次参加Kaggle
感受:真的能学到好多东西。感觉最大的不同就是kaggle里你是按照自己的想法去写代码的,想到哪里写哪里,如果一个语法写不出来就用别的办法绕过,所以基本上都能写出来。终于没有那种被python的奇葩语法各种烦的感觉了,可能是自己也熟一点了,也可能是感觉自己做的事情更有意义了。而且最后看看自己是怎么被大神各种虐的,学到一招两招,也是超爽的感觉。原创 2016-09-25 21:46:30 · 2730 阅读 · 6 评论 -
MySQL 初级助记笔记和标准文档里不会说到的但是也可以用的不规范用法
在实验楼上学习了一些MySQL,常用的查询可能够了,来分享笔记。绿色表示助记或者自己特别探索过的地方原创 2016-10-18 21:31:59 · 273 阅读 · 0 评论 -
数据科学家是怎么用“”加密的“”语言阻碍新手入门的——Data Science 数据分析术语表
数据科学家是怎么用“”加密的“”语言阻碍新手入门的原创 2016-10-20 17:33:33 · 383 阅读 · 0 评论 -
LeCun 推荐!50 行 PyTorch 代码搞定 GAN
【转自新智元(微信号:AI_era)】Ian Goodfellow 提出令人惊叹的 GAN 用于无人监督的学习,是真正AI的“心头好”。而 PyTorch 虽然出世不久,但已俘获不少开发者。本文介绍如何在PyTorch中分5步、编写50行代码搞定GAN。下面一起来感受一下PyTorch的易用和强大吧。转载 2017-02-20 22:01:02 · 1430 阅读 · 0 评论 -
程序猿进攻金融业【更新中】
金融业有很多模块,每个模块都有机会想转金融业的程序员,可以参考此图:转载 2017-01-04 11:58:20 · 331 阅读 · 0 评论 -
【python】 int整型数的除法将返回地板除的整形,例如 99/100 = 0
python int整型数的除法将返回地板除的整形,例如 99/100 = 0原创 2017-03-02 14:18:39 · 1487 阅读 · 0 评论 -
用python2.7 做sogou字典处理编码的时候踩过的坑——学习笔记【文字编码转换 decode chardet】
做完这一次有点不信任txt了太多编码了 utf-8 unicode gbk gbk的子集gb12236 ansi ansi方法的gbk....windows自带的是ansi方法的gbk要转码,wps>notepad++>subline>>windows自带。wps的转码最多最清楚,notepad++的自动识别比subline好,起码能读如果是unicode或者什么的原创 2017-02-14 17:37:43 · 536 阅读 · 0 评论 -
机器学习电话面/视频面 cheetsheet ——常用机器学习算法优缺点一览(可直接打印)
机器学习电话面/视频面 cheetsheet ——常用机器学习算法优缺点一览(可直接打印)原创 2017-03-03 11:27:30 · 948 阅读 · 1 评论 -
RandomizedSearchCV和GridSearchCV,在调用fit方法的时候产生'list' object has no attribute 'values'错误之处理方法
RandomizedSearchCV和GridSearchCV,在调用fit方法的时候产生'list' object has no attribute 'values'错误之处理方法【pyhon 版本 3.5.0 skit-learn版本<0.18.1>】原创 2017-02-24 10:29:41 · 18475 阅读 · 1 评论 -
【scikit-learn algorithm cheat sheet】【汉化版】scikit-learn算法选择路径图
英文原版链接:http://scikit-learn.org/stable/tutorial/machine_learning_map/看得有点累,做了个汉化版汉化版:(有很多名词合理地强行翻译了一下,否则全英文的词汇太多,查不到的时候,请看看下面的原版)英文原版(2016年9月30日最后更新):原创 2016-09-30 05:16:24 · 8311 阅读 · 1 评论 -
TensorFlow 面向专家的Minist笔记(中文,简化版)(Deep MNIST for Experts)
placehoder数据类型:x = tf.placeholder(tf.float32, shape=[None, 784])表示placehoder的大小,任意行数,仅要求列数为784placehoder对数据的尺寸作自调整Variable数据类型:W = tf.Variable(tf.zeros([784,10]))Variable必须手动初始化才可使原创 2017-04-07 17:16:14 · 794 阅读 · 0 评论 -
机器学习初学者的TensorFlow笔记
最近在自学机器学习相关知识,感觉Google出的TensorFlow有一定的发展前途,于是进行了解了一下,并用最简单的语音尝试描述TensorFlow的使用方法和运作思路原创 2016-05-03 21:51:13 · 1652 阅读 · 0 评论 -
tensorflow安装的时候,没有su权限,即使利用anaconda虚拟环境,pip仍没有权限的问题
没有su权限就应当用anaconda建立虚拟环境但是!!!建立了环境之后直接用pip安装新的包,还是没有权限的!!!!因为conda新建的环境里没有pip,其实用的还是系统自带的pip,所以没有权限。所以正确的虚拟环境建立方法是这样的!【anaconda3版本:4.4.0 】下载anacondawget https://repo.continuum.io原创 2017-06-23 21:16:58 · 3240 阅读 · 0 评论 -
数据分析,信息检索,分类体系中常用指标简明解释——关于准确率、召回率、F1、AP、mAP、ROC和AUC
数据分析,信息检索,分类体系中常用指标简明解释——关于准确率、召回率、F1、AP、mAP、ROC和AUC在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。转载 2016-10-20 18:04:40 · 6428 阅读 · 2 评论 -
腾讯校招基础研究岗相关:请解释LR/logistic regression/对数几率回归/逻辑回归/逻辑斯蒂回归
据说每一个机器学习学习者都会写一篇有关自己对LR的理解文章,查了很多资料后,我今天就写一下我的LR。本文的重点是:为什么要LR,为什么要用logistic函数,为什么要用对数几率,以及他们是怎么求出来的。(我不喜欢公式,但是有的时候比文字更清楚,所以这篇文章里的公式要么就是可以忽略的,要么两个公式之间一定是可以2分钟内推出来的,也就是说是能很简单的理解“为什么从这个公式能变成这个”的)原创 2017-09-02 12:17:57 · 1237 阅读 · 0 评论 -
PyQT5在pyCharm上的设置方法
program选择能import到PyQt的目录(比如在venv里创建的,就选择venv里的python);参数不变 -m PyQt5.uic.pyuic $FileName$ -o $FileNameWithoutExtension$.py ;项目目录,Ui文件存放的目录。原创 2018-04-22 21:30:36 · 683 阅读 · 0 评论