cncc2017day1 下午tf论坛总结

最新推荐文章于 2024-07-15 15:20:24 发布

trainsn

最新推荐文章于 2024-07-15 15:20:24 发布

阅读量784

点赞数

文章标签：人工智能

本文链接：https://blog.csdn.net/trainsn/article/details/78386368

版权

下午的TF论坛主要是一些企业界的大佬来做了一些企业界现在所做的一些成果以及企业界面对的一些问题，来的有不同领域的大佬，包括新闻信息方面的头条、微博，以及OTO平台的美团和滴滴。

- 微博——如何应对极端访问

微博面对的问题是在一个突发事件发生的时候，访问量会在短时间有显著的增加。这不同于一般的可以预见的访问量增加的情况，比如春晚和双十一。所以在这种情况下增加集群的方法显得过于机械，并且公司一般不会允许平时有那么多的服务器空关。
（微博的内容之后再补全吧……）

- 阿里——人工智能

阿里主要涉及的是如下几方面：

information retrivel
:: search
:: recommend system

Speech tech

NLP

Image/Video Content Analysis

图像检索方面，阿里目前的成果是Visual search：拍立淘，这是一个通过深度学习来识别图像中的商品，和数据库中的对应条目进行匹配。
1-拍立淘
接下来提出的是一个deep rank的训练方法，这还是类似于一个在imagenet上进行训练的方法，专业的名词应该是叫triplet training（这个概念还不是很懂），大概的意思就是从user log当中，找出用户查询的图片，用户点击的图片，用户未点击的图片，将这三类图片输入到三个deep cnn当中（前面的部分共享参数，后面全连接层的时候各个网络才使用各自的参数），生成三个特征向量，最后的损失函数用的是rank loss
这里写图片描述

另一方面是文本检索。文本检索的主要思想是将文本和图像表示到同一个语义空间进行处理（可以看做cross-media的一个基础）。文本检索的方式和之前的deep rank方式基本相同，所不同的只是将原来的输入图像变为用户的输入文本，将对图像进行处理的CNN改为了BLSTM。其他的处理方式基本没有什么变化，最终还是使用rank loss得到最后的损失值。值得一提的是，这种对跨媒体方式的处理是现在研究的一个热点，day3甚至有专门针对跨媒体的论坛。这点之后再提。
这里写图片描述
接下来的一方面探讨的是有关图像分割的问题。这个问题其实是由之前的检索引申开来的，因为用户所希望的是查找模特身上对应的衣服，而不希望背景对最终结果有所影响。所以在把图像扔到最后的网络当中之前，我们要对图像进行分割处理。分割当中面临两个问题：一个是背景和要检测的物体在颜色和问题上比较相近，一个是模特摆出比较不太正常的姿态的时候不好识别。阿里采用的解决方法是采用3个网络，前面两个分别用于估计背景和估计姿态，最后一个网络用于生成分割。这个图像分割还有一个应用就是分割杂志中的模特图片来制造训练服饰搭配网络的训练集。
这里写图片描述

后面记的就不是那么详细了，随便记了一些：阿里遇到的一些问题：1.语义的gap，存在相同事物的不同表达问题，记得举了一个例子:带娃神器，然后后面给了一长串比较具体的物件……
然后还提到了知识图谱，个性推荐（从用户的行为来判断，提到了binary nerual network）以及强化学习（CEM和DDPG）

- 滴滴

首先提了一下滴滴的核心项目：我对一下几个印象还是比较深的

路径规划；

ETA(预估到达时间)

智能分单；

司乘判责

ETA/路径规划学习路线：
这里写图片描述
最左边的是滴滴的数据来源，特别的提一句，我认为滴滴在数据的质量上，是要高于百度、高德这些提供导航的地图服务的。根据他的数据仓库和历史订单数据结合，我们用机器学习提取特征，预估用户的ETA以及给用户的路径规划。
得到用户的ETA，这个问题需要考虑的特征确实比较多，比如当前道路的交通状况、天气原因、出车司机的开车速度、距离……而且确实随机性比较高，一个路口的红灯可能就可以影响几分钟的ETA。
智能分单也是滴滴分享的一个点。我们可以首先考虑一个贪心的方法，给每一个车派ETA最小的用户。但是这个思路存在很明显的漏洞，假设当前对于某一个车来说，最近的用户在2公里开外，但是10ms后，冒出了一个距离他只有200m的用户，在这种情况下，10ms前的最优很明显不是10ms后的当前最优。所以我们需要考虑一个时序（即考虑一段时间内的最优）的问题。当然这个时间间隔的选取也是一个问题，选取过小，相当于时序的思路不起作用，时序过长，可能服务器受不了（我猜），当然最终的结果应该也不会很好。滴滴目前采用的是2s，考虑2s内的用户和车辆的情况，生成一个派单矩阵，对这个派单矩阵进行处理。

还提到的是拼车和司乘判责的问题。拼车利用的是同车乘客的路径相似度计算。司乘判责滴滴目前采用的也是机器学习，用特征提取来进行判断的方法。
btw 有同学提问希望滴滴解决由于堵车带来的车辆超时到达而用户不能无责取消的问题，滴滴的回答是最终的解决方法还是在提高ETA判断的精准度上。不过有人用的时候说滴滴现在已经支持超时用户无责取消了？

- 今日头条

这里写图片描述
然后是今日头条的李磊。今日头条目前在技术上的一个成就是实现了AI写作。现在今日头条的AI写作已经支持了写一些体育比赛，简单的金融文章和寻人启事。
以AI写作写体育比赛为例，神经网络的输入包括体育比赛的实时比分（包括什么时间，什么人进的球)，比赛的现场图片，比赛的文字直播（可以从中提取出一些主播的观点）。在处理这些数据的时候用到的让我印象比较深的技术是对句子进行提取特征（也就是把句子用向量进行表示），然后在欧式空间中选择句子，使得他们张成的空间最大。这样做的结果就是句子不那么相似，我们可以得到对比赛比较完整的概括。

除了这一点之外，李磊还提到了今日头条在做的一些技术，比如机器摘要(从大文章中摘出摘要)，QA方面的研究（比如对于一些简单的问题，我们可以将问题转化为类SQL语言）

trainsn

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
cncc2017day1 下午tf论坛总结

cncc2017day1 下午tf论坛总结下午的TF论坛主要是一些企业界的大佬来做了一些企业界现在所做的一些成果以及企业界面对的一些问题，来的有不同领域的大佬，包括新闻信息方面的头条、微博，以及OTO平台的美团和滴滴。
复制链接

扫一扫