干货 | 纽约大学陈溪: AlphaGo Zero技术演进的必然性(附PPT)

纽约大学陈溪教授分享了AlphaGo Zero技术如何结合机器学习与决策,强调了深度强化学习在解决复杂决策问题中的重要性。讲解了从描述性分析到指定性决策的五个阶段,并探讨了在商业应用中面临的挑战,如动态推荐系统和多层选择模型。
摘要由CSDN通过智能技术生成

640?wx_fmt=png


本讲座选自纽约大学助理教授陈溪近日在2018第二届杉数科技AI大师圆桌会上所做的题为《 AlphaGo Zero技术演进的必然性-机器学习与决策的有机结合》的演讲。


后台回复关键词“0822”获取完整版演讲PPT~


陈溪:今天我要跟大家分享一下为什么要把机器学习和运筹学这两个学科结合起来,才能有效地解决很多实际的问题。


一、机器学习


640?wx_fmt=png


什么是机器学习?首先需要有一堆数据,然后有机器学习的算法,对于数据的统计建模、概率建模和数据的假设来作为算法的支撑。机器学习一般常用的应用是对数据进行预测,比如预测明天股票的价格,这种都是一些基础的预测,更重要的是通过机器学习,去学习数据中的一些模式。


640?wx_fmt=png


机器学习从大的角度分成两类:监督学习与无监督学习(Supervised Learning & Unsupervised Learning)。比如我们通过房间里的照片来识别人脸,用某些方式进行一定的标注来确定人脸在什么地方,这时候我们就叫做有监督的学习。监督学习的框架如上图所示,根据预测的函数,把机器学习的特征映射到值域上。


640?wx_fmt=png

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值