A. 计算广告
转化率的数据很稀少,可以退而求其次,用二次跳转、加入购物车等,近似转化率;
CRT预估的公开数据集:Criteo(7天4000万条训练数据,1天600万条测试数据)
PC端广告点击率: 0.1%~1%; 样本严重不均衡,可以在负例样本集里采样;
评估:线下AUC和LogLoss; 线上A/B测试点击率(or+停留时长,转化率)
根据Query来召回:查询扩展(给出一个查询,扩展出多个同义近义查询),解决模糊匹配问题;
要对曝光率低的广告进行“探索”,使其有展示的机会才好统计点击率(探索和利用)(可使用强化学习)
合约广告:没有CTR预估;用M个广告和N类展示机会(每个广告映射到不同的几个展示机会),二分图匹配问题(带约束的最优化),最大化收益;
B. 游戏
AlphaGo Zero,揭示了有规则足够,数据可以机器自动生成;
明棋,对弈双方持有对称的信息,即“完美信息”,搜索+剪枝即可;(国际象棋、西洋陆琪等状态空间小,用MinMax树搜索;围棋状态空间大,用蒙特卡洛树搜索)
德州扑克等,暗牌,有隐藏信息,搜索空间非常大;AI必须要让自己的移动随机化,基于别人已有策略得到的新策略要尽可能地少被别人利用;
DeepMind的Q-Learning玩游戏;OpenAI的工具包Gym,评估和训练AI的平台Universe;
C. 自动驾驶
L0~L5; L5之前的都是限定场景的“自动驾驶”,都不靠谱儿;
两个技术分支:1.把路都标准化;2.把车变智能;
占据栅格:1.事先知道的,存储好坐标和大小的物体们;2.汽车传感器实时识别出来的周边物体;
不确定性锥:物体+移动速度,危险范围;(静止的消防栓,则是细锥;跑动的人,则是粗锥)(视线死角,要有锥,因为可能鬼探头)
D. 机器翻译
1. 基于规则:规则编写费时费力,规则之间可能有冲突;
2. 基于统计:使用双语平行语料库做训练;包括:A. 翻译模型(估算单词、短语之间互相翻译的概率),B.调序模型(对翻译后的语言片段排序进行建模),C.语言模型(计算生成的译文是否符合目标语言的表达习惯);
3. 基于神经网络:RNN, Attention, Transformer
E. 人机交互
多模态,人性化(不一定要拟人化)
互动偏见:聊天机器人由于数据的影响,开始说脏话;
数据偏见:训练数据因素造成的,比如搜索医生出来的都是男性;
模型偏见:因数据缺失造成的,比如给女性推荐低薪工作;
黑盒化引起人们的不信任,要在“黑盒化”和“透明化”之间达成妥协;(推荐系统提供推荐解释,智能策略给出辅助信息供人来决策,智能策略更保守些)