- 博客(8)
- 收藏
- 关注
原创 【理论背后的直觉】MAB多臂老虎机与UCB算法
在强化学习中,多臂赌博机问题(Stochastic Bandits)是经典的探索与利用(Exploration vs. Exploitation)权衡问题。本文将介绍多臂赌博机的基本概念,探讨$\varepsilon$-贪婪策略和上置信界算法(UCB)的理论与实践表现,并总结其核心要点。
2024-10-11 00:00:15 1081
原创 【论文汇报】满足差分隐私性质的跨平台在线匹配
BIT: Privacy-preserving cooperative online matching over spatial crowdsourcing platforms
2024-01-09 15:54:50 901
原创 【声纹基础】TDNN怎么用的一维卷积?
时延神经网络常用于声纹识别领域,它可以视作一维卷积神经网络(1-d CNNs)。二维卷积我们并不陌生,可是,一维卷积到底如何理解?它和二维卷积又有什么联系?不妨通过实验,一探究竟。
2023-01-03 11:58:50 2009
原创 SWITCH——选择结构
①case后面的“常量表达式”相当于入口,break则相当于出口;②我们可以将将9.9近似看作9,那么需要列举的情况将被进一步简化。
2020-10-21 22:13:03 350 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人