Python
Syler_Wan
这个作者很懒,什么都没留下…
展开
-
跳跃NLP曲线:自然语言处理研究综述(一)(翻译)
自然语言处理(NLP)是一种在计算机领域中以理论为驱动,用于人类语言的自动分析和表示的技术。NLP研究从打卡和批量处理的时代发展而来(其中一句话的分析可能就需要7分钟),到现在的谷歌时代和它的推荐系统(可在不到一秒的时间内处理数百万个网页)。本综述文章借鉴了NLP研究的最新进展,以全新的视角审视NLP技术的过去、现在和未来。借鉴商业管理和营销预测领域的“跳跃曲线”范式,这篇调查文章将NLP研究的演...翻译 2018-09-12 19:37:19 · 403 阅读 · 0 评论 -
跳跃NLP曲线:自然语言处理研究综述(二)(翻译)
2. 背景自1950年成立以来,NLP研究就主要集中于任务上,比如机器翻译、信息检索、文本摘要、问答系统、信息提取、主题建模和最近的意见(opinion)挖掘。许多的NLP早期开展的研究主要集中在语法上,部分原因是句法处理显然是必要的,部分是通过隐含或明确认可语法驱动处理的思想。虽然NLP的语义问题和需求从一开始就很清楚,研究界采用的策略是首先解决语法问题,以便更直接地应用机器学习技术。然...翻译 2018-09-12 19:45:00 · 312 阅读 · 0 评论 -
跳跃NLP曲线:自然语言处理研究综述(三)(翻译)
3. 重叠NLP曲线随着互联网时代的到来,文明经历了深刻的影响,我们现在比以往任何时候都经历的快很多。即使是适应、发展和创新技术,也会让人感到恍惚,即淘汰就在眼前。特别是NLP研究在过去15年中并没有像其它技术那样发展。虽然NLP研究在执行人工智能行为方面取得了很大进展,比如,谷歌IBM的Watson,Apple的Siri,这些NLP框架都没有真正了解它们正在做什么—使它们与鹦鹉没有什么不...翻译 2018-09-12 19:50:07 · 554 阅读 · 0 评论 -
跳跃NLP曲线:自然语言处理研究综述(四)(翻译)
5. 冲浪语义曲线基于语义的NLP集中于与自然语言文本相关的内在意义。基于语义的方法不是简单地在语法级处理文档,而是依赖于与自然语言文本相关联的隐式外延特征,因此不再盲目使用关键字和单词出现次数。与纯粹的语法技术不同,基于概念的方法也能够检测以微妙方法表达的语义,比如,通过分析未明确传达相关信息的概念,但是与其他概念隐含地联系在一起。基于语义的NLP方法可以大致分为两大类:利用外部知识的技术,...翻译 2018-09-12 19:59:02 · 370 阅读 · 0 评论 -
跳跃NLP曲线:自然语言处理研究综述(五)(翻译)
6. 展望语义曲线叙事理解和生成是推理,决策和“意识形成”的核心。除了作为人与人交流的关键部分之外,叙事也是构建现实和进行规划的手段。解读人类大脑如何生成和处理叙事可能最终导致我们真正理解和解释人类的智慧和意识。计算机建模是研究叙事理解的有效方法。在知识表达,常识推理,社会认知,学习和NLP的保护下,人工智能研究人员一直关注导致人类理解或产生叙事的许多认知过程。一旦NLP研究能够在与人类文本处...翻译 2018-09-12 20:01:50 · 310 阅读 · 2 评论 -
CNN-中文文本分类-开源项目-自定义数据集
最近参加学校的一个数据分析比赛,因为自己前面自学了一些基本的机器学习算法,但其实还处于入门阶段,便参加了。选择了一道中文文本分类的题目。今日头条用户画像选题背景:随着机器创作能力越来越强,今后社会媒体上将会产生越来越多的机器创作者自动生产的内容。有效识别出哪些是人类作者生产的内容,哪些是机器作者生产的内容(包括机器写作、机器翻译、机器自动摘要),对于媒体内容的审核、分发、推荐等,具有十分重...原创 2018-11-08 18:30:20 · 10818 阅读 · 23 评论