![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Yolandalt7777777
这个作者很懒,什么都没留下…
展开
-
TensorFlow使用笔记(入门)
一.安装见前面我的博客https://editor.csdn.net/md/?articleId=101542485https://editor.csdn.net/md/?articleId=107192706二.notestf.placeholder类型变量的输出调代码过程中,总会需要print一些变量看中间值,但是每次print到tf.placeholder变量时,总是很莫名,直接输出是这样的格式:tensor(“td_loss/sub:0”, shape=(?, ?), dtype=f原创 2020-07-14 09:13:04 · 211 阅读 · 0 评论 -
论文笔记——Contextual Multi-armed Bandit Algorithm for Semiparametric(半参数) Reward Model
Contextual Multi-armed Bandit Algorithm for Semiparametric(半参数) Reward Model摘要:事实证明,上下文多臂匪徒(MAB)算法有望在顺序决策任务(例如新闻推荐系统,网页广告放置算法和移动健康)中最大化累积reward。但是,大多数提出的上下文MAB算法都假定奖励和行为上下文之间存在线性关系。本文针对支持非平稳性的松弛,半参数...原创 2020-01-30 14:18:57 · 2289 阅读 · 0 评论 -
论文笔记——Thompson Sampling for Contextual Bandits with Linear Payoffs(线性收益)
Thompson Sampling for Contextual Bandits with Linear Payoffs(线性收益)参考论文:Agrawal S , Goyal N . Thompson Sampling for Contextual Bandits with Linear Payoffs[J]. 2012.摘要有关Thompson Sampling理论性能的许多问题仍未解...原创 2020-01-30 13:49:23 · 2586 阅读 · 1 评论 -
多臂赌博机Multi-Armed Bandit(MAB)
1.问题来源:多臂赌博机问题一个赌徒,要去摇老虎机,走进赌场一看,一排老虎机,外表一模一样,但是每个老虎机吐钱的概率可不一样,他不知道每个老虎机吐钱的概率分布是什么,那么每次该选择哪个老虎机可以做到最大化收益呢?1)有K台机器,每次选取其中一台拉动杠杆,该机器提供一个随机的回报reward,每一台机器的reward服从特定的概率分布。2)一个赌徒有N次拉杆的机会,他的目标是使得回报rewar...原创 2020-01-29 21:33:31 · 2873 阅读 · 0 评论 -
强化学习入门笔记
一、强化学习和机器学习的关系机器学习主要分为3个方向:分类、回归、关联性分析。强化学习则是机器学习的重要分支之一。机器学习的十大算法为:决策树、支持向量机SVM、随机森林算法、逻辑回归、朴素贝叶斯、KNN算法、K-means算法、AdaBoost算法、Apriori算法、PageRank算法。在机器学习里,其范式主要分为监督学习(Supervised Learning)、无监督学习(Unsup...原创 2020-01-29 20:03:15 · 856 阅读 · 0 评论 -
记第一次跑tensorflow
1.安装tensorflow CPU 版本安装教程https://blog.csdn.net/jesmine_gu/article/details/79370726该文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议2.安装numpy,scipy库https://blog.csdn.net/xiamoyanyulrq/article/details/80375544...原创 2020-01-19 11:23:48 · 164 阅读 · 0 评论 -
Yolov3实现安检机图片物体识别——环境配置(GPU驱动+cuda+cudnn+Opencv+darknet)
本文系统为Ubuntu16.04 ×64位1 GPU驱动安装GPU的使用对于大数据集的目标识别来说非常重要,一开始的时候嫌麻烦就没装,导致跑图片数据的时候,非常非常的慢。再加上电脑配置不行,设置的迭代次数比较小,基本是没有办法将数据跑出来的。NVIDIA驱动的安装一共有三种方法:从NVDIA官网下载你系统对应的驱动包,然后禁用你系统自带的驱动,再安装下载的驱动包。这种方法的风险特别大,...原创 2019-03-04 19:44:14 · 1667 阅读 · 0 评论