一番の宝物

ねね〜 https://github.com/PENGZhaoqing

从一阶线性模型到FFM

前言 FFM 从Linear Model开始 假设我们有下图这样的推荐数据,对于第一行样本,我们用语言翻译:用户1在语境3下对物体2有一个点击行为(click=1);这里,用户(user),语境(context)和物体(item)都是特征,点击行为是label,我们要用一个模型去拟合这个la...

2019-01-13 01:22:01

阅读数 9156

评论数 0

Sequential Monte Carlo Methods (SMC) 序列蒙特卡洛/粒子滤波/Bootstrap Filtering

Problem Statement 我们考虑一个具有马尔可夫性质、非线性、非高斯的状态空间模型(State Space Model):对于一个时间序列上的观测结果{yt,t∈N}\{ y_t , t \in N \}{yt​,t∈N},我们认为每个观测结果yty_tyt​的生成依赖于一个无法直接观...

2018-12-21 15:49:27

阅读数 2331

评论数 0

ssh反向代理实现NAT内网穿透[ssh版teamviewer]

由于实验室服务器没有公网IP,如果在校外网的话只能通过teamviewer远程桌面连接,然而teamviewer的数据传输是基于图像的,反应太慢了,所以一直在寻找ssh版的teamviewer,经过谷歌,发现只需要一台公网服务器作为中转站,就可以实现在任何地方登录处于内网的实验室服务器,前提是实验...

2018-12-20 17:02:24

阅读数 2080

评论数 1

进化策略优化算法CEM(Cross Entropy Method)

1. 进化策略与遗传算法 进化策略算法(Evolutionary Strategies,ES)是一种基于进化理论的算法,通过适者生存的自然法则来淘汰和筛选样本,目的是获得更好的样本(参数),与遗传算法一样,它也是通过参数扰动来探索更好的解,但是进化策略可以看做是遗传算法的一种扩展:在遗传算法中,...

2018-06-08 16:09:28

阅读数 3082

评论数 0

(Neural Turning Machine)神经图灵机理解和pytorch实现

motivation

2018-05-25 21:25:26

阅读数 2825

评论数 0

变分自动编码机(VAE)理解和实现(Tensorflow)

你需要知道的: 自动编码机Auto-Encoder (AE)由两部分encoder和decoder组成,encoder输入x数据,输出潜在变量z,decoder输入z然后输出一个x’,目的是让x’与x的分布尽量一致,当两者完全一样时,中间的潜在变量z可以看作是x的一种压缩状态,包含了x的全部f...

2018-05-04 10:21:58

阅读数 4928

评论数 8

Alphago杂谈

Alphago版本经历了Fan,Lee,Maser,以及后面的AlphaGo和AlphaZero,前三版Fan,Lee,Master用的是监督学习+强化学习训练,后两面Alphago Zero和AlphaZero则是直接使用强化学习训练。 DeepMind在这个topic上只公布了两篇Natru...

2018-04-17 12:52:52

阅读数 242

评论数 0

经典算法题汇总

链表 链表第一个公共节点:1) 利用栈先进后出,用两个栈对两个链表从头至尾遍历,那么栈顶就为链表的尾节点,依次弹出两个栈,直到弹出的元素不一样时,前一个相同的即为第一个公共节点. 2)分别遍历一次两个链表,算出长度差L,让长的链表的指针先走L步,然后两个指针同时移动,那么第一次指向同样节点的...

2018-04-05 10:38:32

阅读数 1442

评论数 0

机器学习和数据挖掘算法面试知识点

机器学习算法 决策树(DT) ID3: 基于信息增益的大小来逐层确定分类的特征。我们知道信息量的增加能消除对事件的不确定性,因此我们每次选择信息增益大的特征作为分类特征, 表示引入此特征后,信息量增加最多,能把对事件的不确定性降为最低,墒最低。信息增益g(D,A)(互信息)由熵H(D)...

2018-04-05 10:17:19

阅读数 357

评论数 0

深度强化学习汇总

从多臂赌博机问题到强化学习 多臂赌博机,每次投币后只能选择按下一个臂,这个臂会有一定的概率给出奖励,但是我们并不知道每个臂给奖励的概率分布,那么如何获得最大收益呢?我们有两种策略,探索和利用, 探索是把所有的机会均分给每个臂,根据历史获得奖励的频率去近似它的真实奖励概率;利用就是每次都选择获得奖...

2018-03-30 16:50:49

阅读数 902

评论数 0

研发工程师面试题整理

TCP, UDP区别和各自优缺 TCP提供一种面向连接的、可靠的字节流服务 在一个 TCP 连接中,仅有两方进行彼此通信。广播和多播不能用于 TCP TCP使用校验和,确认和重传机制来保证可靠传输 TCP 给数据分节进行排序,并使用累积确认保证数据的顺序不变和非重复 TCP使用滑动窗口机...

2018-02-28 15:35:10

阅读数 1296

评论数 0

[机器学习]逻辑回归公式推导及其梯度下降法的Python实现

一般来说,二项逻辑斯谛回归模型是一个二分类判别模型,由条件概率分布P(Y|X)P(Y|X)P(Y|X)表示,随机变量XXX为实数,YYY取值0或者1。我们通过比较P(Y=1|x)P(Y=1|x)P(Y=1|x)和P(Y=0|x)P(Y=0|x)P(Y=0|x)值大小来判断给定x的类别为1还是0。 ...

2018-02-09 22:43:39

阅读数 1633

评论数 0

[强化学习]区分Model-free和Model-based方法

所以,如果你想查看这个强化学习算法是model-based还是model-free的,你就问你自己这个问题:在agent执行它的动作之前,它是否能对下一步的状态和回报做出预测,如果可以,那么就是model-based方法,如果不能,即为model-free方法

2017-11-13 20:20:41

阅读数 12961

评论数 7

详解神经网络中矩阵实现的梯度计算

对神经网络有一定了解的同学知道:一般的神经网络的具体实现都是通过矩阵实现的,包括误差反向传导,梯度计算和更新等等,比如y=w*x+b,这里的所有变量都是矩阵,我们通常会叫w和b为参数矩阵,矩阵相乘首先效率比较高,然后也比较好操作,那么对于矩阵形式的导数该怎么计算?比如w矩阵的具体导数dw应该如何计...

2017-11-09 20:28:14

阅读数 9578

评论数 2

Git超级傻瓜教程[快速创建Git远程项目并上传本地代码]

这里我给出一个如何快速创建Git远程项目并上传本地代码的教程前提条件 注册并登录了Github 本地安装了git工具(Ubantu系统安装 sudo apt-get install git) Step 1在github上创建新的远程仓库, 这里我把这个项目取名为gitDemo, 然后点击确定:然后...

2017-11-08 23:54:09

阅读数 383

评论数 0

java.ulti中的接口和抽象类梳理与分析

梳理一下java中我们常用的java.ulti包中的数据结构对象,如set,list,map,collection,queue之间的关系, 以及实现的LinkedList, ArrayList,HashSet,TreeSet,HashTable,HashMap,TreeMap等等 1. 接口...

2017-10-13 15:56:13

阅读数 886

评论数 0

[天池智慧交通预测挑战赛]新手向的时间序列预测解决方案-前Top2%

本博客分享新人第一次参加天池比赛的实况记录,比较完整地给出了数据预处理,缺失值补全,特征分析过程以及训练和交叉验证的注意事项,适合数据挖掘新人找到解题思路,全程没有调参,没有模型融合,只凭一手简单的特征和xgboost,最后止步41/1716,基本上可以作为时间序列预测类的比赛的baseline....

2017-09-11 16:42:59

阅读数 9975

评论数 50

数据挖掘:如何通过百度地图API抓取物体周边地理位置信息

1.需求描述对于数据挖掘工程师来说,有时候需要抓取地理位置信息,比如统计房子周边基础设施信息,比如医院、公交车站、写字楼、地铁站、商场等,一般的爬虫可以采用python脚本爬取,有很多成型的框架如scrapy,但是想要爬百度地图就必须遵循它的JavaScript Api,那么肯定需要自己写Java...

2017-09-04 16:42:25

阅读数 10904

评论数 14

Heroku部署Rails应用流程

1.创建Heroku账号以及Heroku app2.将Heroku app与自己Github下的的项目进行连接4.下载配置Heroku CLI命令行工具5.在本机终端中使用heroku login命令行登陆,会要求heroku的账号密码6.登陆成功后,可以用heroku create在当前目录下创...

2017-09-02 01:19:11

阅读数 519

评论数 0

RNN聊天机器人与Beam Search [Tensorflow Seq2Seq]

本博客分析了一个Tensorflow实现的开源聊天机器人项目deepQA,首先从数据集上和一些重要代码上进行了说明和阐述,最后针对于测试的情况,在deepQA项目上实现了Beam Search的方法,让模型输出的句子更加准确,修改后的源码在这里。 DeepQA DeepQA是一个Tensorf...

2017-07-10 17:28:55

阅读数 8943

评论数 5

提示
确定要删除当前文章?
取消 删除