机器学习-初级进阶（Thompson 抽样算法）

最新推荐文章于 2024-05-22 03:57:55 发布

背后——NULL

最新推荐文章于 2024-05-22 03:57:55 发布

阅读量1.4k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41433183/article/details/104328338

版权

机器学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

一、Thompson 抽样算法

原理

代码实现

数据

Ad 1  Ad 2  Ad 3  Ad 4  Ad 5  Ad 6  Ad 7  Ad 8  Ad 9  Ad 10
1     0     0     0     1     0     0     0     1      0
0     0     0     0     0     0     0     0     1      0
0     0     0     0     0     0     0     0     0      0
0     1     0     0     0     0     0     1     0      0
 ...

from matplotlib import pyplot as plt
import pandas as pd
import random

dataset = pd.read_csv("Ads_CTR_Optimisation.csv")

d = 10
N = 10000
numbers_of_rewards_1 = [0] * d
numbers_of_rewards_0 = [0] * d
ads_selected = []
total_reward = 0

for n in range(N):
    ad = 0
    max_random = 0
    for i in range(d):
        random_beta = random.betavariate(numbers_of_rewards_1[i] + 1, numbers_of_rewards_0[i] + 1)
        if random_beta > max_random:
            max_random = random_beta
            ad = i
    ads_selected.append(ad)
    reward = dataset.values[n, ad]
    if reward:
        numbers_of_rewards_1[ad] += 1
    else:
        numbers_of_rewards_0[ad] += 1
    total_reward += reward
print(total_reward)

plt.hist(ads_selected)
plt.title("Histogram of ads selections")
plt.xlabel("Ads")
plt.ylabel("Number of times each ad was selected")
plt.show()

在这里插入图片描述

由数据看出4号广告被投放的次数基本占据90%，并且10000次投放点击量2603这个数是变化的但基本在2600左右浮动，相比于置信区间上界算法有非常大的提升

Thompson抽样算法-TSA vs 置信区间上界-UCB

背后——NULL

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
机器学习-初级进阶（Thompson 抽样算法）

一、Thompson 抽样算法原理代码实现from matplotlib import pyplot as pltimport pandas as pdimport randomdataset = pd.read_csv("Ads_CTR_Optimisation.csv")d = 10N = 10000numbers_of_rewards_1 = [0] * d...
复制链接

扫一扫

专栏目录

背后——NULL CSDN认证博客专家 CSDN认证企业博客

码龄7年

166: 原创

24万+: 周排名

106万+: 总排名

14万+: 访问

: 等级

2807: 积分

48: 粉丝

64: 获赞

23: 评论

454: 收藏

私信

关注

热门文章

分类专栏

最新评论

python笔记(面向对象和之前的测试题)
菜鸟自学日常: old boy study？
python笔记(pymysql基本用法)
kiki%: 你好，执行登录语句时只出现个username，之后输入用户名称提示“str” object is not callable
python笔记(celery框架初识)
北风之神c: 写得赞，博主用心了，但主要还是celery太难用了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字，所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1) 整个项目目录结构,celery的目录结构和任务函数位置，有很大影响 2) @task入参 ,用户有没有主动设置装饰器的入参 name,设置了和没设置有很大不同，建议主动设置这个名字对函数名字和所处位置依赖减小 3) celery的配置，task_queues(在3.xx叫 CELERY_QUEUES )和task_routes (在3.xx叫 task_routes) 4) celery的配置 include （在3.xx叫 CELERY_INCLUDE）或者 imports (3.xx CELERY_IMPORTS) 或者 app.autodiscover_tasks的入参 5) cmd命令行启动参数 --queues= 的值 6) 用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 https://function-scheduling-distributed-framework.readthedocs.io/zh_CN/latest/index.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery，任何方面都是有过之而无不及。发布性能提高1000%，消费性能提高2000%
python笔记(封装(含类方法和静态方法))
玄境妙门: 似懂非懂
Django实现读取数据库时自动加密解密
Tisfy: 十分完美，正如：旌蔽日兮敌若云，矢交坠兮士争先。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。