算法学习
文章平均质量分 88
AgentSmart
就读于人大高瓴人工智能学院直博
展开
-
近期几篇有关All-Pay论文总结(博弈论+机制设计)
近期几篇有关All-Pay论文总结1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions2.Designing an optimal contest3.Optimal rewards in contests4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case5.Asymmetric All-Pay Auctio原创 2022-03-05 15:44:08 · 838 阅读 · 0 评论 -
Optimal rewards in contests(博弈论+机制设计) 论文阅读笔记
Optimal rewards in contests 论文阅读笔记一、基本信息二、文章摘要三、背景介绍四、本文模型五、核心结论六、总结展望一、基本信息题目:竞赛中的最优奖励作者:Chen Cohen, Todd R.Kaplan, Aner Sela二、文章摘要以下内容取自原文摘要部分:我们在不完全信息的设定下研究带有关乎于分数奖励的全支付竞赛。参赛者获胜的估值不仅仅与他的类型相关,还与设计者选择的独立于分数的奖励相关。我们针对设计者分析当他的目标函数要么是分数总和要么是最高分数时,最优原创 2022-03-04 14:55:25 · 312 阅读 · 0 评论 -
Designing an optimal contest(博弈论+机制设计) 论文阅读笔记
Designing an optimal contest 论文阅读笔记一、基本信息二、文章摘要三、背景介绍四、核心模型五、核心结论六、总结展望一、基本信息题目:设计一个最优竞赛作者:Ani Dasgupta,Kofi O. Nti二、文章摘要以下内容取自原文摘要部分:本文给竞赛研究带来一个机制设计的角度。我们考虑的问题是:当竞赛设计者也可能对奖项有估值时选择一个竞赛成功函数。我们表明:可以被凹且递增的竞赛成功函数实现的任意均衡结果都可以被线性竞赛成功函数复现。期望效用最大化的设计者应采用线原创 2022-02-27 16:49:24 · 480 阅读 · 0 评论 -
All-Pay Contests 论文定理推导(博弈论+机制设计)
All-Pay Contests 论文定理推导(博弈论+机制设计)一、Theorem 1 证明过程二、Theorem 2 证明过程三、Corollary 1 证明过程四、存在的问题本文针对于全支付竞赛(准确来说是标准竞赛)提出两大结论:Theorem 1有关标准竞赛中参赛者的均衡收益情况;Theorem 2有关标准竞赛中参赛者的均衡参与情况。 Theorem1、2需依赖于均衡存在性定理(原文中Corollary 1)。因此本文证明大体分为三部分。三部分的证明之间存在联系。Corollary 1证明独立原创 2022-02-23 17:39:19 · 662 阅读 · 0 评论 -
Strategy in contests:an introduction(博弈论+机制设计) 综述论文摘录(持续更新)
本文主要内容包括:竞赛理论常见应用领域、三种类型的竞赛(无噪声的一价全支付竞赛、有噪声的一价全支付竞赛、Tullock竞赛)、决策时序、均衡参与情况、代价函数设计、奖项结构设计、委派决策行为、外部性等内容。原创 2021-12-24 17:14:19 · 757 阅读 · 1 评论 -
Peer Effects Report(博弈论+机制设计)
Peer Effects Report一、领域概述二、论文总结三、研究可能一、领域概述Peer Effects翻译为同伴效应或者是同群效应,是指社交网络领域中,利用局部的调整作用来达到优化整体目标。首先这是一个社交网络领域的问题,社交网络可能搭载的是经济学行为或者是其他领域行为(如通信),换句话说网络可以有多种作用,不单单局限于经济学问题。研究方法是,对于所研究的具体领域问题进行建模,其中包括:网络结构、效用函数、相互作用机制等等,设计机制利用同伴效应来优化目标,最后通过博弈论的理论分析或者是模拟实验原创 2021-12-23 16:59:46 · 706 阅读 · 0 评论 -
Optimal Contest Design for Simple Agents(博弈论+机制设计) 论文阅读笔记
本文关注于针对简单代理者的最优竞赛设计,简单代理者是指决策在参与与不参与之间二选一。在两种模型分类下研究,在同质代价函数的设定下得出了最优竞赛的结构,在异质代价函数的设定下得出了近似性质的结果。原创 2021-12-22 17:28:11 · 1371 阅读 · 0 评论 -
Contest Design with Threshold Objectives(博弈论+机制设计) 论文阅读笔记
Contest Design with Threshold Objectives 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:作者:Edith Elkind、Abheek Ghosh、Paul W. Goldberg二、文章摘要以下内容取自原文摘要部分:我的总结:三、核心模型...原创 2021-12-20 17:47:15 · 395 阅读 · 0 评论 -
Optimal Contest Desigh:A General Approach(博弈论+机制设计) 论文阅读笔记
Optimal Contest Desigh:A General Approach 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:最优竞赛设计:一个通用方法作者:Igor Letina,Shuo Liu,Nick Netzer二、文章摘要以下内容取自原文摘要部分:我们考虑nnn位代理者参加的竞赛设计,其中负责人可以选择奖品组合以及竞赛成功函数。其中我们的框架包括图洛克竞赛(Tullock contests)、Lazear-Rosen锦标赛(Lazear-Rosen to原创 2021-12-16 17:16:19 · 302 阅读 · 0 评论 -
All-Pay Contests(博弈论+机制设计) 论文阅读笔记
本文聚焦全支付竞赛(拍卖),提出了可分离竞赛、一般化竞赛两大概念。着重研究一般化竞赛的性质,定理1有关一般化竞赛的收益性质,定理2有关一般化竞赛的参与性质。这些性质未来可作为竞赛设计的理论指导。原创 2021-12-13 17:53:57 · 2673 阅读 · 0 评论 -
Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preference(博弈论+机制设计) 论文阅读笔记
我们考虑两个候选人的选举,其中投票者的偏好取决于一个不可直接观察的状态变量。每个投票者接收到一个与状态变量相关的私人信号。投票者可能是“视情况而定”的,也就是说不同状态下偏好不同,也有可能是“事先注定”的,不同状态下有相同偏好。**在这种设定下,即便每个投票者都是视情况而定的,代理者依据私人信息投票并不一定导致普遍偏好的候选者胜出,这是因为信号可能存在系统偏差**。我们提出一种易于部署的机制去引出并汇聚投票者的私人信号,并且输出被绝大多数投票者偏好的候选者。具体来说,**投票者真实汇报自己的信号从而形成强贝原创 2021-12-01 15:43:53 · 408 阅读 · 0 评论 -
Optimal Mechanisms with Budget For User Generated Contents(博弈论+机制设计) 论文阅读笔记
Optimal Mechanisms with Budget For User Generated Contents 论文阅读笔记一、基本信息二、文章摘要三、核心模型四、机制算法一、基本信息题目:设计带预算的最优机制激励用户生产高质量内容作者:Mengjing Chen,Pingzhong Tang,Zihe Wang,Shenke Xiao,Xiwang Yang二、文章摘要以下内容取自原文摘要部分:本文中,我们设计总产量最大化机制用以激励用户在UGC网络中上传高质量内容。我们发现,广泛原创 2021-11-30 16:22:20 · 327 阅读 · 0 评论 -
Peer pressure in extortion game can resolve social dilemma(博弈论+机制设计) 论文阅读笔记
Peer pressure in extortion game can resolve social dilemma 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:勒索博弈中的同伴压力可以解决社会困境作者:Qing Chang,Yang Zhang二、文章摘要以下内容取自原文摘要部分:勒索策略是零行列式策略的一个重要子集,它保证参与者得到的收益不低于对手的收益,引起了许多学者的关注。同伴压力已经证实在动态演化博弈的自私个体之间维持合作是一个很有效的机制。因此本文中,我们使原创 2021-11-29 17:38:28 · 557 阅读 · 1 评论 -
Peer Pressure and Partnerships(博弈论+机制设计) 论文阅读笔记
Peer Pressure and Partnerships 论文阅读笔记一、基本信息二、文章摘要一、基本信息题目:同伴压力与同伴关系作者:Eugene Kandel、Edward P. Lazear二、文章摘要以下内容取自原文摘要部分:合作被视为我们所期待的社会准则。在这项工作中,建立基于空间公共货物博弈论的框架去研究同伴压力与激励机制是如何影响合作演化的。建立了一个参数可调的统一模型来代表纯个人机制、带有同伴压力的个人机制和社会机制的影响,表明当背叛者感受到的同伴压力和奖励之和大于合作的原创 2021-11-26 17:59:47 · 434 阅读 · 0 评论 -
Peer pressure and incentive mechanisms in social networks(博弈论+机制设计) 论文阅读笔记
Peer pressure and incentive mechanisms in social networks 论文阅读笔记一、基本信息二、文章摘要一、基本信息题目:社会网络中的同伴压力以及激励机制作者:Chuang Deng、Chao Ye、Lin Wang、Zhihai Rong、Xiaofan Wang二、文章摘要以下内容取自原文摘要部分:...原创 2021-11-24 17:23:57 · 282 阅读 · 0 评论 -
Peer Pressure(博弈论+机制设计) 论文阅读笔记
Peer Pressure 论文阅读笔记一、基本信息二、文章摘要三、核心模型四、本文总结一、基本信息题目含义:同伴(邻居)压力作者:Antoni Calvó-Armengol、Matthew O. Jackson二、文章摘要以下内容摘自原文摘要部分:我们提出一种模型,在该模型中代理者关心邻居的动作并且可以施压压力来让他们采取既定的动作。施加压力对于施加者来说是代价昂贵的,并且可以通过降低采取动作代价(积极压力)或者提高不采取动作代价(消极压力)的方式来逼迫邻居。我们表明,当行动是策略互补时原创 2021-11-22 17:38:42 · 635 阅读 · 0 评论 -
Inducing Peer Pressure to Promote Cooperation(博弈论+机制设计) 论文阅读笔记
Inducing Peer Pressure to Promote Cooperation 论文阅读笔记一、文章摘要二、核心模型一、文章摘要题目含义:设计机制引导同伴施压以达到促进合作的目的。以下内容取自原文摘要部分:众所周知当个体决策的外部性在整个社会中传播的时候,在由自利个体组成的大社会中合作是很难达成的。这也就导致了所谓的“公地悲剧”,也就是说理性自利举动最终导致每个人得到更坏的结果。传统促进合作的方法包括:庇古税(庇古提出的环境税)或者发放津贴使得个体带来的外部性内部化。我们提出一种新方法原创 2021-11-20 19:31:03 · 419 阅读 · 0 评论 -
《斯坦福算法博弈论二十讲》学习笔记(持续更新)
《斯坦福算法博弈论二十讲》学习笔记(持续更新)第一章 简介和实例第二章 机制设计基础第三章 迈尔森引理第四章 算法机制设计第一章 简介和实例羽毛球比赛中的规则漏洞12年伦敦奥运会的羽毛球赛事中发生了一件钻规则漏洞的“丑闻”。赛制规则如下:共分为两个小组,每个小组四只队伍,小组赛阶段各个小组的前两名晋级,A组第1名对阵B组第2名,A组第2名对阵B组第1名,之后进行两两淘汰赛。TZ是本届赛事公认的强队,已经提前小组赛出线。WY与JK进行一场小组赛,二者之间的胜者将会对阵TZ,因此两只队伍都不想赢,都在原创 2021-11-08 16:37:25 · 3645 阅读 · 4 评论 -
进阶博弈论 Advanced Game Theory (Stanford+UBC)学习笔记
进阶博弈论(Advanced Game Theory)学习笔记(持续更新)1-1 Social Choice:Taste1-2 Social Choice:Voting Schemes1-1 Social Choice:Taste投票选举系统非常复杂,并且现有的选举系统并不十分公平合理。我们想通过所学的知识去设想设计一个更优的投票选举系统。1-2 Social Choice:Voting Schemes本章节我们来学习投票机制的基本形式化表达以及几种常见投票机制。投票问题大体指:有一系列候选原创 2021-10-15 19:53:22 · 1021 阅读 · 0 评论 -
博弈论(Game Theory)入门学习笔记(持续更新)
博弈论(Game Theory)入门学习笔记课程介绍1-1 Taste-Backoff1-2 Self-Interested Agents and Utility Theory1-3 Define1-4 Examples1-5 Nash Equilibrium Intro1-6 Strategic Reasoning课程介绍博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。1-1 Taste-Backoff以一个经典案例引出博弈论原创 2021-09-21 23:40:41 · 18346 阅读 · 10 评论 -
数学建模、运筹学之非线性规划
数学建模、运筹学之非线性规划一、最优化问题理论体系二、梯度下降法——无约束非线性规划三、牛顿法——无约束非线性规划四、只包含等值约束的拉格朗日乘子法五、KKT条件一、最优化问题理论体系最优化问题旨在寻找全局最优值(或为最大值,或为最小值)。最优化问题一般可以分为两个部分:目标函数与约束条件。该问题的进一步细分也是根据这两部分的差异。最优化问题根据变量的取值范围不同可以划分为一般规划与整数规划。一般规划与整数规划都可以对应两种线性与非线性的,只不过非线性规划问题针对一般规划就十分复杂更别说针对整数规划原创 2021-09-18 15:25:44 · 1682 阅读 · 0 评论 -
数学建模、运筹学之整数规划(原理、例题、代码)
数学建模、运筹学之整数规划(原理、例题、代码)一、何为整数规划?二、整数规划与线性规划三、分枝定界法一、何为整数规划?整数规划具有深远的实际应用价值,因为现实生活中的规划、最优化问题大部分不是实数范围的规划而是整数规划,比如工人的数量、所需多台机器的数量等等。而整数规划并不像看起来那么简单,单纯将线性规划最优解取整得到的甚至都不一定是可行解。因此整数规划需要区分于线性规划独立设计算法解决,目前仍未针对整数规划发现多项式级别的算法。不加特别说明的情况下,我们所说的整数规划实际上是整数线性规划。本文仍旧原创 2021-09-14 11:19:19 · 6385 阅读 · 2 评论 -
迭代优化之单纯形法简单理解(笔记)
迭代优化之单纯形法简单理解(笔记)原创 2021-09-01 16:32:29 · 418 阅读 · 0 评论