论场景在研发中的重要性

最新推荐文章于 2023-07-08 19:44:50 发布

佟学强

最新推荐文章于 2023-07-08 19:44:50 发布

阅读量2k

点赞数 2

分类专栏： nlp语义理解

本文链接：https://blog.csdn.net/randy_01/article/details/79973249

版权

nlp语义理解专栏收录该内容

18 篇文章 2 订阅

订阅专栏

随着技术驱动的创业公司崛起，场景成为AI研发的重要考量。文章指出，真正解决问题的人需要理解场景，例如招聘匹配问题，学术界和工业界的专家可能无法提供最佳答案。强调在研发AI方案前要理解场景逻辑，抽象出数学模型，考虑规则和描述性文本的场景应用。深度学习在某些场景下有效，但在规则性强的场景中，统计建模可能更适用。AI领域的理论创新主要由谷歌大脑等公司引领，国内则侧重工程化应用。对于AI研究，跨学科结合和深入场景分析至关重要。

摘要由CSDN通过智能技术生成

随着中国改革开放程度的加深，互联网行业也逐渐出现变革，典型的变化就是由原来的低端重复性造轮子，逐步转向高端，以技术创新为主导。一个有力的证明就是近年来以技术驱动的创业公司越来越多，这在10年前是不可想象的。在高端研究人才要求上，对工作经验不再那么看重，而更加重视求职者的学历，专业，背景，最低是博士要求，具备研究能力。

在这样的背景下，一些原来传统的互联网大公司，将逐步失去竞争优势。当然事实上也没这么邪火，这个变化是缓慢的，也有许多公司不愿意接受应届硕士，嫌弃他们没有Ai经验。因为他们认为学术界和工业界有鸿沟。但是一些真正以技术创新驱动的Ai公司，更加青睐于高学历，有研发背景的海归。说句实话，目前国内的Ai，能够搞的起来的，也就那么几家而已，其余的都是炒作。一些新兴的Ai创业公司，除了商汤，依图，云从，旷视外，nlp领域并没有出现独角兽。所以重点谈一下nlp。

3月10号北理工举办了一场知识图谱研讨会，与会邀请了9位学术界和工业界的专家。在最后1个小时的问答环节里，有听众向专家提出了这么一个问题：招聘网站要做求职者和jd的匹配度，如何解决这样的问题?专家捣鼓了半天，最后也没给出令人满意的答案来。其实我认为，真正能解决问题的人，还不一定就是这些学术界的专家。都说场景是Ai第一要素，如果一个人整天指望着发论文活着，那么他的思维里，对场景的概念应该是淡化的。迄今为止，见到过的最务实的研发应该数阿里的达摩院了。阿里有真实海量的数据，有明确的落地场景，在这样的背景下砸1000亿搞研发，是比较靠谱的。

之前我有一个观点，那就是研发Ai方案之前，一定要把人类自身对于特定场景的逻辑搞明白了，从中抽象出数学模型出来。然后做现有算法模型与场景的匹配度，如果全都匹配不上，那就在原来的基础上重新整合出的模型出来。但是很遗憾，很多工业界的程序员并没有意识到这个问题，对于一个算法，他的核心从来不是公式推导，而是这个算法是如何产生的，能解决哪些问题，不能解决哪些问题，以及算法的缺陷和改进的方向。说白了，研发就是把握好大的方向，比如深度学习在语义理解中承担什么样的角色？很多学者追捧如何改进seq2seq,论文满天飞，从我的角度来看，这些工作是没有太大的实际意义的。包括机器翻译，单纯依靠NMT也是不切实际的。当然，seq2seq对于描述性的文本，是很好的。对于描述性的文本，深度学习都会发挥很好的效果。原因就是描述性的文本，规则不是很强，更需要向量这种语义表示来做语义相似度运算，这就是场景的问题了。而对于规则性强的场景，翻译就得靠规则和语义相似度替换了，而对于商品标题这类问题，由于大部分标题都是拼凑的，并不是很符合语法，所以用seq2seq效果会很差的，这个时候统计建模就会发挥作用了。

以前面提到的招聘网站jd匹配问题，专家在筛选简历的时候和hr肯定不一样。由于hr不懂技术，在看简历的时候，更多是依靠规则，一条一条地比对，而每条规则的比重是不同的。比如老板要求学历是至高无上的，那么hr在看简历时，往往先看学历，一看不是海归，或者985硕士博士，直接pass掉了。这就基于规则的逻辑，一条一条地看，评分，最后给出综合的印象。而同样的场景，技术专家筛选简历，除了这些规则外，他们会重点关注候选人的技术，自学能力，潜力，尤其是一些描述性的文本，会重点关注。所以往往hr认为不合适的，技术专家反而认为合适。那么，这样的一个场景，很显然我们做模型匹配度的时候，是必须考虑两者的因素的。对于第一因素规则，这些规则其实是有优先级关系的，比如划分为重要，必要，次要三个级别，每个级别对最后综合得分的贡献度不同，也就是权重不同。在人工干预的阶段，把这些规则全都罗列出来做处理。而这些规则会大量出现在结构化的文本中，因为一篇简历，整体会包括结构化的文本和描述性的文本两部分。比如公司的实验室想招聘AI研发人员，那么学历，学校，专业的优先级就是重要的，获奖情况，背景平台是必要的，那么毕业时间等其他因素就是次要的。这些规则的权重不同，最后加权求和得到基于规则的得分。

具体方案如上图所示：其中u为根据规则得到的相似度分数，最后求总分的时候引入平滑系数，是因为两部分的比重在实际中是不同的，需要手动调节。F2部分为描述性文本采用siamese lstm获取相似度得分，最后采用MSE作为损失函数。另外在jd中，有的描述，比如能够修改lucene源代码等，如果采用规则，效果会非常差，因为大部分程序员都是仅仅会使用lucene而已。所以简历中出现了lucene,并不代表就合适。

之前有人问过我，他们公司做的抽取，要求抽取出高管，基于规则非常差，准确率只有70%多，不知道怎么解决。一句话，知识图谱是良方。

学会case by case，远比死学算法知识重要，还是那个观点，对于AI算法，数学，物理学，计算机学科，神经生物学科是基础，结合场景研究。目前AI界的理论创新基本都是谷歌大脑等公司提出然后进入长达10年左右的探索阶段，国内基本上是享受别人的理论成果然后工程化，研究人员相对保守，比如对于神经规则推理的研究非常少，学术界没有影响力的论文满天飞，犹如养鸡场下的蛋，流于形式。

由于AI是交叉学科，搞下一代理论研究的话，不仅需要数学，更需要从物理学等学科中吸取灵感，包括心理学。比如太阳系中太阳是中心，但是机器并不知道。给你8大行星和太阳的一些基础数据，如何用最简单的方法确定谁是中心。这个过程对于神经规则推理有何启发？实体的全局属性如何确定？局部属性的更新策略是什么？以下为本人对目前的深度学习的一些粗浅的思考：

深度学习最初模拟大脑视觉神经模式识别的机制，第一层是保角映射。高级神经联结是局部的，有空间关系归纳偏置的效果。信号传递时到达节点经过聚合后再激活，一层一层传递，原始信号经过处理后得到终极的高级信号，这个过程和傅立叶变换相似，相当于实现了信号的空间转换。这些信号应该不仅限于图像的像素，还包括行为，动作，比如小球的自由落体运动。经过视觉传达后人能知道这是自由落体，这个过程涉及到了逻辑推理。逻辑推理的基本要素：信号单元，信号之间的关系以及信号之间如何交互的规则。在信号层层传递的过程中，人实际上在进行推理，而不仅仅是简单的模式识别。因此，联结主义和规则，结构化方法融合势在必行。语义表示和规则两者交互，完成推理需要人为制定规则和图结构的初始化，然后借助神经网络完成这个过程。这是本人思考的一个基本出发点。

以色列特拉维夫大学和哈弗大学之前的一篇论文在无向图推理方面已经有了一些进展，后续对于有向图的推理以及目前整个AI界算法的统一，如何实现推理需要继续深入研究。一个本人比较感兴趣的问题就是一篇文章，如何梳理出作者的创作思路和其中的情感倾向，而不是目前工业界粗糙的情感分类这么初级，人的情感很难分类，需要梳理出路径出来，也就是情感走向或者倾向。目前很多nlp工作人员用的都是过去的工具，缺乏研究未来的学者。比如目前AutoML很火热，有很多博士生在研究遗传算法用于神经网络参数的自动优化问题，这个很好很有用。多研究一些基础学科才是正道。