多臂赌博机与生涯规划

最新推荐文章于 2024-08-12 18:10:44 发布

Light.T

最新推荐文章于 2024-08-12 18:10:44 发布

阅读量185

点赞数

分类专栏：推荐系统文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41629800/article/details/106930167

版权

推荐系统专栏收录该内容

2 篇文章 1 订阅

订阅专栏

某个领域的新问题，在其他领域已经有成熟的解决方案可以借鉴。
我们会遇到探索未知和利用当下的问题，算法模型的抽象就是多臂赌博机。面对多台外观一样的赌博机，其吐钱概率未知，我们如何在有限次摇臂下使累计收益最大，或者说累计遗憾最少。
策略：不确定中通过试错找到合适的收益点，使累计遗憾减少。
方法有基于概率分布、置信区间、贪婪三种方法
1. 概率分布，给予好的和不确定的选项更多机会。
2. 置信区间，在选择好的同时，也给未选的方案更多机会。
3. 贪婪确定一个概率去随机探索，其余情况选择当下收益最好的。

感悟

前期多去探索，后期多选择收益好的，同时给其他未知选项机会。
不要完全随机和固步自封。不去探索闭门造车甚至比完全随机的结果更差，不要陷入局部最优，给自己留一点探索和学习的时间。只差0.05，就是最优方案和最差方案的区别。
人生漫长，不要纠结于某件事情的成败，。
积累小胜，不断优化。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
多臂赌博机与生涯规划

某个领域的新问题，在其他领域已经有成熟的解决方案可以借鉴。我们会遇到探索未知和利用当下的问题，算法模型的抽象就是多臂赌博机。面对多台外观一样的赌博机，其吐钱概率未知，我们如何在有限次摇臂下使累计收益最大，或者说累计遗憾最少。策略：不确定中通过试错找到合适的收益点，使累计遗憾减少。方法有基于概率分布、置信区间、贪婪三种方法概率分布，给予好的和不确定的选项更多机会。置信区间，在选择好的同时，也给未选的方案更多机会。贪婪确定一个概率去随机探索，其余情况选择当下收益最好的。感..
复制链接

扫一扫

专栏目录

Light.T CSDN认证博客专家 CSDN认证企业博客

码龄7年

92: 原创

6万+: 周排名

37万+: 总排名

9万+: 访问

: 等级

1630: 积分

27: 粉丝

45: 获赞

8: 评论

141: 收藏

私信

关注

热门文章

分类专栏

bug解决 1篇
NLP 1篇
前端面试指南 27篇
常识 23篇
算法 12篇
计算机基础 2篇
推荐系统 2篇
前端学习 14篇
Python 4篇
翻译 5篇
数据科学 5篇

最新评论

如何在vscode中初始化HTML文件？
bomagic: 需要下什么插件吗？
vue命令 npm run start 报错dev: `webpack-dev-server --inline --progress --config build/webpack.dev.conf.j
andonemax: $ webpack-dev-server --inline --progress --config build/webpack.dev.conf.js TypeError: Cannot read property 'emit' of undefined at CopyPlugin.apply (C:\Users\Mr.wu\Desktop\考试系统\SpringBoot-Vue-OnlineExam\exam\node_modules\copy-webpack-plugin\dist\index.js:56:20) at Compiler.apply (C:\Users\Mr.wu\Desktop\考试系统\SpringBoot-Vue-OnlineExam\exam\node_modules\tapable\lib\Tapable.js:375:16) at webpack (C:\Users\Mr.wu\Desktop\考试系统\SpringBoot-Vue-OnlineExam\exam\node_modules\webpack\lib\webpack.js:33:19) at startDevServer (C:\Users\Mr.wu\Desktop\考试系统\SpringBoot-Vue-OnlineExam\exam\node_modules\webpack-dev-server\bin\webpack-dev-server.js:367:16) at processOptions (C:\Users\Mr.wu\Desktop\考试系统\SpringBoot-Vue-OnlineExam\exam\node_modules\webpack-dev-server\bin\webpack-dev-server.js:350:5) at processTicksAndRejections (internal/process/task_queues.js:95:5) 这种情况是怎么回事
百度网盘网页端的视频如何调节播放倍速？
_Athie: 控制台提示videojs这个类找不到
wordpress错误【Parse error: syntax error, unexpected '.', expecting '&' or T_VARIABLE in ……】
Only0724.: 我的出现PHP Parse error: syntax error, unexpected '.', expecting '&' or variable (T_VARIABLE) in E:\wwwroot\only0724.cn\wp-includes\functions.php on line 1090 请问您知道怎么解决吗已经升级到PHP7.4
【讲座笔记】商业分析全攻略手册
普通网友: 商业分析全攻略——用数据分析方法解决商业问题网盘地址：https://pan.baidu.com/s/1ZRZkWDwq1mh4lksQ0jqYVg 提取码: x2pe

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。