机器学习
文章平均质量分 91
AgentSmart
就读于人大高瓴人工智能学院直博
展开
-
【数学思维】论文阅读中的逆变换定理
论文阅读中的逆变换定理原创 2022-09-05 18:32:04 · 352 阅读 · 0 评论 -
Competition Among Parallel Contests(博弈论+机制设计) 论文阅读笔记
我们研究一个多个竞赛同时举行的模型,其中每个参赛者选择其中一个竞赛参与以及每个竞赛的设计者决定奖项结构从而竞争以吸引参赛者的参与。首先我们分析了参赛者的策略行为并且完全刻画了对称贝叶斯纳什均衡BNE。对于竞赛设计者的策略,当其他设计者的策略是已知的时候,我们表示计算最优响应是NP-Hard问题并且提出了一个输出1−ϵ1-\epsilon1−ϵ近似最优响应的完全多项式时间的近似算法FPTAS。当其他设计者的策略未知时,我们给出了对于单个设计者策略的最坏情况分析。...原创 2022-08-29 15:03:14 · 283 阅读 · 0 评论 -
近期几篇有关All-Pay论文总结(博弈论+机制设计)
近期几篇有关All-Pay论文总结1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions2.Designing an optimal contest3.Optimal rewards in contests4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case5.Asymmetric All-Pay Auctio原创 2022-03-05 15:44:08 · 818 阅读 · 0 评论 -
Optimal rewards in contests(博弈论+机制设计) 论文阅读笔记
Optimal rewards in contests 论文阅读笔记一、基本信息二、文章摘要三、背景介绍四、本文模型五、核心结论六、总结展望一、基本信息题目:竞赛中的最优奖励作者:Chen Cohen, Todd R.Kaplan, Aner Sela二、文章摘要以下内容取自原文摘要部分:我们在不完全信息的设定下研究带有关乎于分数奖励的全支付竞赛。参赛者获胜的估值不仅仅与他的类型相关,还与设计者选择的独立于分数的奖励相关。我们针对设计者分析当他的目标函数要么是分数总和要么是最高分数时,最优原创 2022-03-04 14:55:25 · 305 阅读 · 0 评论 -
Designing an optimal contest(博弈论+机制设计) 论文阅读笔记
Designing an optimal contest 论文阅读笔记一、基本信息二、文章摘要三、背景介绍四、核心模型五、核心结论六、总结展望一、基本信息题目:设计一个最优竞赛作者:Ani Dasgupta,Kofi O. Nti二、文章摘要以下内容取自原文摘要部分:本文给竞赛研究带来一个机制设计的角度。我们考虑的问题是:当竞赛设计者也可能对奖项有估值时选择一个竞赛成功函数。我们表明:可以被凹且递增的竞赛成功函数实现的任意均衡结果都可以被线性竞赛成功函数复现。期望效用最大化的设计者应采用线原创 2022-02-27 16:49:24 · 465 阅读 · 0 评论 -
All-Pay Contests 论文定理推导(博弈论+机制设计)
All-Pay Contests 论文定理推导(博弈论+机制设计)一、Theorem 1 证明过程二、Theorem 2 证明过程三、Corollary 1 证明过程四、存在的问题本文针对于全支付竞赛(准确来说是标准竞赛)提出两大结论:Theorem 1有关标准竞赛中参赛者的均衡收益情况;Theorem 2有关标准竞赛中参赛者的均衡参与情况。 Theorem1、2需依赖于均衡存在性定理(原文中Corollary 1)。因此本文证明大体分为三部分。三部分的证明之间存在联系。Corollary 1证明独立原创 2022-02-23 17:39:19 · 652 阅读 · 0 评论 -
All-Pay Contests 论文问题思考与解答(博弈论+机制设计)
All-Pay Contests 论文问题思考与解答1.啥叫Sunk investment?2.啥叫Rent-Seeking,Lobbying?3.啥叫Irreversible Investments?1.啥叫Sunk investment?直译为沉默投资,更常见的说法是投资中的沉默成本。沉默成本是指过去所付出的时间、金钱等成本,可能对当下决策不会造成任何影响。简单理解为“过去所做的毫无用处的付出”,给人一种鸡肋的感觉,食之无味弃之可惜。本文中指全支付竞赛中,未获胜者也需支付自己的竞价,对参赛者来说是原创 2022-02-10 17:44:21 · 230 阅读 · 1 评论 -
Strategy in contests:an introduction(博弈论+机制设计) 综述论文摘录(持续更新)
本文主要内容包括:竞赛理论常见应用领域、三种类型的竞赛(无噪声的一价全支付竞赛、有噪声的一价全支付竞赛、Tullock竞赛)、决策时序、均衡参与情况、代价函数设计、奖项结构设计、委派决策行为、外部性等内容。原创 2021-12-24 17:14:19 · 714 阅读 · 1 评论 -
Peer Effects Report(博弈论+机制设计)
Peer Effects Report一、领域概述二、论文总结三、研究可能一、领域概述Peer Effects翻译为同伴效应或者是同群效应,是指社交网络领域中,利用局部的调整作用来达到优化整体目标。首先这是一个社交网络领域的问题,社交网络可能搭载的是经济学行为或者是其他领域行为(如通信),换句话说网络可以有多种作用,不单单局限于经济学问题。研究方法是,对于所研究的具体领域问题进行建模,其中包括:网络结构、效用函数、相互作用机制等等,设计机制利用同伴效应来优化目标,最后通过博弈论的理论分析或者是模拟实验原创 2021-12-23 16:59:46 · 679 阅读 · 0 评论 -
Optimal Contest Design for Simple Agents(博弈论+机制设计) 论文阅读笔记
本文关注于针对简单代理者的最优竞赛设计,简单代理者是指决策在参与与不参与之间二选一。在两种模型分类下研究,在同质代价函数的设定下得出了最优竞赛的结构,在异质代价函数的设定下得出了近似性质的结果。原创 2021-12-22 17:28:11 · 1363 阅读 · 0 评论 -
Contest Design with Threshold Objectives(博弈论+机制设计) 论文阅读笔记
Contest Design with Threshold Objectives 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:作者:Edith Elkind、Abheek Ghosh、Paul W. Goldberg二、文章摘要以下内容取自原文摘要部分:我的总结:三、核心模型...原创 2021-12-20 17:47:15 · 388 阅读 · 0 评论 -
Optimal Contest Desigh:A General Approach(博弈论+机制设计) 论文阅读笔记
Optimal Contest Desigh:A General Approach 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:最优竞赛设计:一个通用方法作者:Igor Letina,Shuo Liu,Nick Netzer二、文章摘要以下内容取自原文摘要部分:我们考虑nnn位代理者参加的竞赛设计,其中负责人可以选择奖品组合以及竞赛成功函数。其中我们的框架包括图洛克竞赛(Tullock contests)、Lazear-Rosen锦标赛(Lazear-Rosen to原创 2021-12-16 17:16:19 · 297 阅读 · 0 评论 -
All-Pay Contests(博弈论+机制设计) 论文阅读笔记
本文聚焦全支付竞赛(拍卖),提出了可分离竞赛、一般化竞赛两大概念。着重研究一般化竞赛的性质,定理1有关一般化竞赛的收益性质,定理2有关一般化竞赛的参与性质。这些性质未来可作为竞赛设计的理论指导。原创 2021-12-13 17:53:57 · 2648 阅读 · 0 评论 -
Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preference(博弈论+机制设计) 论文阅读笔记
我们考虑两个候选人的选举,其中投票者的偏好取决于一个不可直接观察的状态变量。每个投票者接收到一个与状态变量相关的私人信号。投票者可能是“视情况而定”的,也就是说不同状态下偏好不同,也有可能是“事先注定”的,不同状态下有相同偏好。**在这种设定下,即便每个投票者都是视情况而定的,代理者依据私人信息投票并不一定导致普遍偏好的候选者胜出,这是因为信号可能存在系统偏差**。我们提出一种易于部署的机制去引出并汇聚投票者的私人信号,并且输出被绝大多数投票者偏好的候选者。具体来说,**投票者真实汇报自己的信号从而形成强贝原创 2021-12-01 15:43:53 · 402 阅读 · 0 评论 -
Optimal Mechanisms with Budget For User Generated Contents(博弈论+机制设计) 论文阅读笔记
Optimal Mechanisms with Budget For User Generated Contents 论文阅读笔记一、基本信息二、文章摘要三、核心模型四、机制算法一、基本信息题目:设计带预算的最优机制激励用户生产高质量内容作者:Mengjing Chen,Pingzhong Tang,Zihe Wang,Shenke Xiao,Xiwang Yang二、文章摘要以下内容取自原文摘要部分:本文中,我们设计总产量最大化机制用以激励用户在UGC网络中上传高质量内容。我们发现,广泛原创 2021-11-30 16:22:20 · 317 阅读 · 0 评论 -
Peer pressure in extortion game can resolve social dilemma(博弈论+机制设计) 论文阅读笔记
Peer pressure in extortion game can resolve social dilemma 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:勒索博弈中的同伴压力可以解决社会困境作者:Qing Chang,Yang Zhang二、文章摘要以下内容取自原文摘要部分:勒索策略是零行列式策略的一个重要子集,它保证参与者得到的收益不低于对手的收益,引起了许多学者的关注。同伴压力已经证实在动态演化博弈的自私个体之间维持合作是一个很有效的机制。因此本文中,我们使原创 2021-11-29 17:38:28 · 552 阅读 · 1 评论 -
Peer Pressure and Partnerships(博弈论+机制设计) 论文阅读笔记
Peer Pressure and Partnerships 论文阅读笔记一、基本信息二、文章摘要一、基本信息题目:同伴压力与同伴关系作者:Eugene Kandel、Edward P. Lazear二、文章摘要以下内容取自原文摘要部分:合作被视为我们所期待的社会准则。在这项工作中,建立基于空间公共货物博弈论的框架去研究同伴压力与激励机制是如何影响合作演化的。建立了一个参数可调的统一模型来代表纯个人机制、带有同伴压力的个人机制和社会机制的影响,表明当背叛者感受到的同伴压力和奖励之和大于合作的原创 2021-11-26 17:59:47 · 429 阅读 · 0 评论 -
Peer pressure and incentive mechanisms in social networks(博弈论+机制设计) 论文阅读笔记
Peer pressure and incentive mechanisms in social networks 论文阅读笔记一、基本信息二、文章摘要一、基本信息题目:社会网络中的同伴压力以及激励机制作者:Chuang Deng、Chao Ye、Lin Wang、Zhihai Rong、Xiaofan Wang二、文章摘要以下内容取自原文摘要部分:...原创 2021-11-24 17:23:57 · 279 阅读 · 0 评论 -
Peer Pressure(博弈论+机制设计) 论文阅读笔记
Peer Pressure 论文阅读笔记一、基本信息二、文章摘要三、核心模型四、本文总结一、基本信息题目含义:同伴(邻居)压力作者:Antoni Calvó-Armengol、Matthew O. Jackson二、文章摘要以下内容摘自原文摘要部分:我们提出一种模型,在该模型中代理者关心邻居的动作并且可以施压压力来让他们采取既定的动作。施加压力对于施加者来说是代价昂贵的,并且可以通过降低采取动作代价(积极压力)或者提高不采取动作代价(消极压力)的方式来逼迫邻居。我们表明,当行动是策略互补时原创 2021-11-22 17:38:42 · 622 阅读 · 0 评论 -
Inducing Peer Pressure to Promote Cooperation(博弈论+机制设计) 论文阅读笔记
Inducing Peer Pressure to Promote Cooperation 论文阅读笔记一、文章摘要二、核心模型一、文章摘要题目含义:设计机制引导同伴施压以达到促进合作的目的。以下内容取自原文摘要部分:众所周知当个体决策的外部性在整个社会中传播的时候,在由自利个体组成的大社会中合作是很难达成的。这也就导致了所谓的“公地悲剧”,也就是说理性自利举动最终导致每个人得到更坏的结果。传统促进合作的方法包括:庇古税(庇古提出的环境税)或者发放津贴使得个体带来的外部性内部化。我们提出一种新方法原创 2021-11-20 19:31:03 · 415 阅读 · 0 评论 -
《斯坦福算法博弈论二十讲》学习笔记(持续更新)
《斯坦福算法博弈论二十讲》学习笔记(持续更新)第一章 简介和实例第二章 机制设计基础第三章 迈尔森引理第四章 算法机制设计第一章 简介和实例羽毛球比赛中的规则漏洞12年伦敦奥运会的羽毛球赛事中发生了一件钻规则漏洞的“丑闻”。赛制规则如下:共分为两个小组,每个小组四只队伍,小组赛阶段各个小组的前两名晋级,A组第1名对阵B组第2名,A组第2名对阵B组第1名,之后进行两两淘汰赛。TZ是本届赛事公认的强队,已经提前小组赛出线。WY与JK进行一场小组赛,二者之间的胜者将会对阵TZ,因此两只队伍都不想赢,都在原创 2021-11-08 16:37:25 · 3442 阅读 · 4 评论 -
进阶博弈论 Advanced Game Theory (Stanford+UBC)学习笔记
进阶博弈论(Advanced Game Theory)学习笔记(持续更新)1-1 Social Choice:Taste1-2 Social Choice:Voting Schemes1-1 Social Choice:Taste投票选举系统非常复杂,并且现有的选举系统并不十分公平合理。我们想通过所学的知识去设想设计一个更优的投票选举系统。1-2 Social Choice:Voting Schemes本章节我们来学习投票机制的基本形式化表达以及几种常见投票机制。投票问题大体指:有一系列候选原创 2021-10-15 19:53:22 · 971 阅读 · 0 评论 -
博弈论(Game Theory)入门学习笔记(持续更新)
博弈论(Game Theory)入门学习笔记课程介绍1-1 Taste-Backoff1-2 Self-Interested Agents and Utility Theory1-3 Define1-4 Examples1-5 Nash Equilibrium Intro1-6 Strategic Reasoning课程介绍博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。1-1 Taste-Backoff以一个经典案例引出博弈论原创 2021-09-21 23:40:41 · 16652 阅读 · 10 评论 -
机器学习笔记——集成学习EnsembleLearning+代码详解
机器学习笔记——集成学习“三巨头”EnsembleLearning一、集成学习初步了解1.1 集成学习基本思想1.2 集成学习分类二、AdaBoost2.1 AdaBoost基本思想2.2 AdaBoost算法三、GBM/GBDT四、RandomForest一、集成学习初步了解1.1 集成学习基本思想集成学习(Ensemble Learning)通过构建并结合多个学习器来完成学习任务,有时也可以被称为多分类器系统或者是基于委员会的学习等等。集成学习基本由两部分组成,选择个体学习器种类并生成一定量的原创 2020-12-17 14:30:08 · 1831 阅读 · 4 评论 -
机器学习笔记——小白都能看懂的决策树
机器学习笔记——决策树Decision Tree一、决策树初步了解二、特征选择2.1 熵与条件熵2.2 信息增益2.3 信息增益比一、决策树初步了解决策树是一种基本的分类与回归方法,但更常用于解决分类问题。决策树顾名思义呈树形结构,这对于我们学过数据结构的同学来说不会陌生,决策树有一个根节点,若干内部节点若干叶子节点。根节点表示所有样本的全集,内部节点表示一个特征或属性,叶子节点表示一个类。每个叶子节点也就是一个类对应从根节点到叶子节点的唯一路径。决策树用于解决分类问题的基本思想是,根据训练样本数据原创 2020-11-27 16:45:00 · 452 阅读 · 0 评论 -
机器学习笔记——超详细!多方整合SVM
机器学习笔记——支持向量机SVM一、间隔margins的理解一、间隔margins的理解在系统详细地接触SVM之前,我们需要明白SVM到底是来做什么的,或者说优化的方向是什么,那么我们不得不对间隔margins做进一步的理解。这也或许是学习SVM过程中为数不多的容易理解的地方…给定训练样本集D={(x1,y1),(x2,y2),...,(xm,ym)}D=\{(x_1,y_1),(x_2,y_2),...,(x_m,y_m)\}D={(x1,y1),(x2,y2),...,(xm,y原创 2020-11-22 15:01:08 · 529 阅读 · 2 评论 -
机器学习笔记——神经网络与深度学习
机器学习笔记——神经网络与深度学习一、神经网络引言二、神经元模型与激活函数2.1 神经元模型2.2 激活函数2.2.1 sigmoid & tanh2.2.2 ReLU激活函数2.2.3 Leaky Relu & Parametric ReLU三、反向传播 BP算法四、深度学习初步感知一、神经网络引言神经网络常常用于解决分类问题,实际生活中遇到的分类问题往往特征维度特别高,而我们的模型一旦阶数比较高,就会出现数据爆炸的情况。比如说上图我们无法用线性函数实现分类,因此随着模型复杂度提原创 2020-11-08 15:00:52 · 539 阅读 · 0 评论 -
机器学习笔记——梯度下降优化方案(
机器学习笔记——梯度下降优化方案一、梯度下降粒度优化1.1 Batch gradient descent1.2 Stochastic gradient descent1.3 Mini-batch gradient descent1.4 三种方法的代码分析二、梯度下降参数优化2.1 步长与梯度的关系2.2 AdaGrad 与 RMSProp2.4 AdaDelta2.5 Momentum 与 Nesterov Momentum2.6 Adam2.7 AdaBelief一、梯度下降粒度优化1.1 Batch原创 2020-10-31 11:03:50 · 1305 阅读 · 4 评论 -
机器学习笔记——多分类与softmax
机器学习笔记——多分类与softmax一、多分类问题1.问题简述2.“一对一” OvO3.“一对多” OvR4.“多对多” MvM5.类别不平衡问题5.1再缩放5.2欠采样与过采样二、softmax函数1.基本了解2.作为函数与计算方式3.作为多分类处理方法一、多分类问题1.问题简述通过之前的学习,我们掌握了使用对数几率回归解决二分类问题的方法和思想,也就是掌握了二分类学习器。但在实际生活中,分类问题可不仅仅设计二分类,我们需要基于一些基本策略利用二分类学习器来解决多分类问题。多分类问题的基本解决原创 2020-10-25 14:42:45 · 2234 阅读 · 0 评论 -
机器学习笔记——模型选择与正则化
机器学习笔记——模型选择与正则化一、模型选择1.方差与偏差2.过拟合与欠拟合3.模型选择的平衡二、正则化一、模型选择1.方差与偏差我们设定h(x)h(x)h(x)为近似值,y(x)y(x)y(x)为真实值。我们有如下式子:近似值的bias我们设定为所有样本近似值与真实值之间差值的期望。近似值的var我们设定为所有样本近似值与近似值的期望之间差距的期望的平方(有点绕…,其实去掉平方的标准差更好理解)。我们可以看到bias与近似值h(x)h(x)h(x)、真实值y(x)y(x)y(x)相关。而va原创 2020-10-17 11:19:30 · 1687 阅读 · 0 评论 -
机器学习笔记——逻辑回归之二分类
机器学习笔记——逻辑回归之二分类一、什么是逻辑回归?一、什么是逻辑回归?原创 2020-10-03 15:36:43 · 1973 阅读 · 0 评论 -
机器学习笔记——线性回归与梯度下降代码初体验
机器学习笔记——线性回归与梯度下降代码初体验一、引言二、简单模拟线性回归三、简单梯度下降实现一、引言之前的几篇博文我们学习了线性回归、梯度下降的基础思想与操作方法,但也只限于纸上谈兵。机器学习是一门更看重应用与问题解决的学科,因此动手实操尤为重要。本篇博文我们会详细叙述线性回归与梯度下降初步用python语言实现的过程,为日后研究学习大型项目打下基础。本次实验的目的是复习掌握线性回归与梯度下降的思想,并且熟悉使用python语言实现机器学习。二、简单模拟线性回归首先生成x列向量,设定好真实线原创 2020-09-28 16:30:32 · 165 阅读 · 0 评论 -
机器学习笔记——9.25课堂补充
机器学习笔记——9.25课堂补充一、泰勒展开二阶近似向量形式一、泰勒展开二阶近似向量形式在之前的博文中我们使用泰勒公式证明了梯度下降方法的正确性。我们根据一元泰勒公式做了两项变换以应用于梯度下降方法的证明:1.标量公式改为向量形式书写。2.对泰勒展开做二阶近似(即最大只保留到二阶项)。一元泰勒公式:一元泰勒公式做二阶近似:多元泰勒公式:多元泰勒公式+向量矩阵化表示+二阶近似:上式比较抽象因为涉及到向量矩阵表示,下面进行详细推导:...原创 2020-09-26 13:54:42 · 1795 阅读 · 1 评论 -
机器学习笔记——深入梯度下降细节
机器学习笔记——梯度下降一、梯度下降回顾二、学习率的调整1.学习率对梯度下降的影响2.Adagrad动态调整学习率三、随机梯度下降(Stochastic)四、特征缩放(Feature Scaling)五、数学证明六、我的疑问一、梯度下降回顾在回归分析的步骤3中我们需要解决的是如下的优化问题:θ∗=argminθL(θ)\theta^*=argmin_{\theta}L(\theta)θ∗=argminθL(θ)其中L是函数的函数,但我们也可以用函数的参数来代替此函数。θ\thetaθ代表的是一组参原创 2020-09-24 13:20:42 · 460 阅读 · 2 评论 -
机器学习笔记——误差哪来的?
机器学习笔记——误差哪来的?一、回顾案例二、误差所在1.误差来源2.bias 与 variance四种组合三、解决方法一、回顾案例上一篇博文中我们通过宝可梦进化的案例初步了解了回归分析的过程。从模型选择->损失函数构建->梯度下降得到最优参数->模型变量高次化复杂模型->多输入变量复杂模型。无论是通过高次化变量还是增加考虑因素,复杂化后的模型确实在训练数据集中表现更加优异,但规律并不同等适合于测试数据集。我们也因此发现了过拟合(Overfitting)的现象。那我们就像要原创 2020-09-21 17:36:02 · 353 阅读 · 0 评论 -
机器学习笔记——基础导论
机器学习笔记——导论一、写在前面二、到底什么是机器学习呢?1.李宏毅教授的看法2.梁毅雄教授的看法三、机器学习有哪些分类?1.监督学习(Supervised Learning)功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入一、写原创 2020-09-19 16:28:07 · 676 阅读 · 3 评论 -
机器学习笔记——回归(Regression)
机器学习笔记——回归(Regression)一、何为回归二、案例背景三、研究过程1.选择模型2.衡量函数的好坏3.选择最优的函数4.梯度下降(Gradient Descent)4.1单变量梯度下降4.2双变量梯度下降4.3偏微分的求解方法5.拟合分析四、研究结论一、何为回归回归是一种预测性的建模技术,研究的是自变量与因变量之间的关系,通常使用曲线来拟合数据点,想要使得拟合曲线到各个数据点之间的误差总和最小。当达到一定预测精度后,就可以用该拟合曲线来代表该自变量与因变量之间的关系,并且可以用他来处理更多原创 2020-09-20 17:33:04 · 1290 阅读 · 0 评论