- 博客(7)
- 收藏
- 关注
原创 机器学习(统计学习方法)基础知识
统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。统计学习也称为统计机器学习(statistial machine learning)。统计学习分为监督学习,非监督学习,半监督学习和强化学习。本文内容以监督学习为主。 实现统计学习方法的步骤如下: 1) 得到一个有限的训练数据集合; 2) 确定包含所有可能的模型的...
2018-08-30 18:14:22 6474
原创 强化学习中常用的随机策略
随机策略可以理解为是概率分布,常用的有以下几种:贪婪策略π∗(a|s)={1 if a=arga∈Amaxq∗(s,a)0 otherwiseπ∗(a|s)={1 if a=arga∈Amaxq∗(s,a)0 otherwise\pi_*(a|s)=\begin{cases}1 if a=arg_{a \in A} max q_*(s,a)\\0 otherwise\\...
2018-08-21 16:14:32 9674 2
原创 强化学习之无模型方法二:时间差分
时间差分方法(TD)是强化学习中最核心的也是最新奇的方法,混合了动态规划(DP)和蒙特卡洛方法(MC) - 和MC类似,TD从历史经验中学习 - 和MDP类似,使用后继状态的值函数更新当前状态的值函数TD属于无模型方法,未知P和R,同时应用了采样和贝尔曼方程,可以从不完整的片段中学习,通过估计来更新估计时间差分评价时间差分策略评价算法目的:给定策略ππ\pi,求其对应的...
2018-08-14 23:51:55 3397
原创 Spark学习笔记(合集)
Part1:RDD操作 Part2:RDD键对操作 Part3:数据读取与保存 Part4:Spark进阶编程 Part5:集群运行Spark Part6:Spark调优与调试 Part7:Spark SQL
2018-08-03 14:47:01 746
转载 Markdown 语法攻略
参考: 1. https://www.zybuluo.com/codeep/note/163962 2. https://blog.csdn.net/qq_37656398/article/details/79308997 3. https://www.jianshu.com/p/a0aa94ef8ab2 4. https://blog.csdn.net/zdk930519/article...
2018-08-03 14:32:03 175
原创 FM系列算法解读(FM+FFM+DeepFM)
https://blog.csdn.net/jiangjiang_jian/article/details/80631180
2018-08-03 14:27:24 74578 3
原创 FTRL算法
概述GBDT算法是业界比较好用筛选特征的算法,在线学习考虑效率和数据量,经常用GBDT离线筛选特征,输入到在线模型进行实时训练,如今比较好用的方法有两个:FTRL和FM,下面将深入介绍各自的原理以及应用的案例离线特征筛选:GBDT线上模型(1):FTRL点击率预估(CTR)问题是计算广告中非常重要的模块,通过预估用户对广告的点击概率来对广告进行排序,进而提升广告效果和收益效率。对于...
2018-08-01 14:27:53 6673
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人