ML读书笔记(人工智能的热门应用)

A. 计算广告

转化率的数据很稀少,可以退而求其次,用二次跳转、加入购物车等,近似转化率;

CRT预估的公开数据集:Criteo(7天4000万条训练数据,1天600万条测试数据)

PC端广告点击率: 0.1%~1%; 样本严重不均衡,可以在负例样本集里采样;

评估:线下AUC和LogLoss; 线上A/B测试点击率(or+停留时长,转化率)

根据Query来召回:查询扩展(给出一个查询,扩展出多个同义近义查询),解决模糊匹配问题;

要对曝光率低的广告进行“探索”,使其有展示的机会才好统计点击率(探索和利用)(可使用强化学习)

合约广告:没有CTR预估;用M个广告和N类展示机会(每个广告映射到不同的几个展示机会),二分图匹配问题(带约束的最优化),最大化收益;

 

B. 游戏

AlphaGo Zero,揭示了有规则足够,数据可以机器自动生成

明棋,对弈双方持有对称的信息,即“完美信息”,搜索+剪枝即可;(国际象棋、西洋陆琪等状态空间小,用MinMax树搜索;围棋状态空间大,用蒙特卡洛树搜索

德州扑克等,暗牌,有隐藏信息,搜索空间非常大;AI必须要让自己的移动随机化,基于别人已有策略得到的新策略要尽可能地少被别人利用;

DeepMind的Q-Learning玩游戏;OpenAI的工具包Gym,评估和训练AI的平台Universe;

 

C. 自动驾驶

L0~L5; L5之前的都是限定场景的“自动驾驶”,都不靠谱儿;

两个技术分支:1.把路都标准化;2.把车变智能;

占据栅格:1.事先知道的,存储好坐标和大小的物体们;2.汽车传感器实时识别出来的周边物体;

不确定性锥:物体+移动速度,危险范围;(静止的消防栓,则是细锥;跑动的人,则是粗锥)(视线死角,要有锥,因为可能鬼探头)

 

D. 机器翻译

1. 基于规则:规则编写费时费力,规则之间可能有冲突;

2. 基于统计:使用双语平行语料库做训练;包括:A. 翻译模型(估算单词、短语之间互相翻译的概率),B.调序模型(对翻译后的语言片段排序进行建模),C.语言模型(计算生成的译文是否符合目标语言的表达习惯);

3. 基于神经网络:RNN, Attention, Transformer

 

E. 人机交互

多模态,人性化(不一定要拟人化)

互动偏见:聊天机器人由于数据的影响,开始说脏话;

数据偏见:训练数据因素造成的,比如搜索医生出来的都是男性;

模型偏见:因数据缺失造成的,比如给女性推荐低薪工作;

黑盒化引起人们的不信任,要在“黑盒化”和“透明化”之间达成妥协;(推荐系统提供推荐解释,智能策略给出辅助信息供人来决策,智能策略更保守些)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值