AI For Everyone-memorable peri
文章平均质量分 94
ZSYGOOOD
这个作者很懒,什么都没留下…
展开
-
笔记-NLP相关调研
由于实验室目前研究方向偏重于NLP和知识图谱,在学习了一段时间机器学习相关内容后,也决定暂时侧重于NLP相关内容的研究。对NLP方面的相关调研工作做一个总结,顺序不分先后。这部分内容可能和笔记-深度学习场景调研有交集,在此就不重复写已有的东西。依存句法分析(Dependency Parsing,DP)、语义依存分析(Samantic Dependency Parsing,SDP)、语义角色标注...原创 2018-06-29 11:41:17 · 430 阅读 · 1 评论 -
笔记-CRF
CRF在序列标注任务上有着广泛的应用,由于使用了全局的信息,能取得比HMM更好的效果。学习参考链接如下:如何用简单易懂的例子解释条件随机场(CRF)模型?它和HMM有什么区别?基于CRF序列标注的中文依存句法分析器的Java实现简明条件随机场CRF介绍 | 附带纯Keras实现DL4NLP —— 序列标注:BiLSTM-CRF模型做基于字的中文命名实体识别sequence-la...原创 2018-06-29 12:47:50 · 295 阅读 · 0 评论 -
笔记-AutoML
深度学习发展至今,虽然取得了很多成果,但其使用门槛依旧很高。对神经网络进行调参从而达到解决问题的效果,需要使用者具有一定的机器学习背景和调参经验,现实情况往往是(不论工业界还是学术界)使用学术界经过沉淀后的经典模型与典型参数设置,并在之上做细微的调整。这极大地限制了人们的思维,网络结构仍然是基于人的经验。既然计算机算法到目前为止已经具有了相当的智能水平,能否让算法来设计神经网络架构并评判优劣呢?G...原创 2018-06-29 13:32:53 · 774 阅读 · 0 评论 -
笔记-变分自编码器(Variational Auto Encoder,VAE)
从大数据时代——>人工智能,生活中各场景下的大数据问题都能用大数据+人工智能算法的配方进行求解。诸如分类、回归等有监督学习问题都得到了很好的解决,但监督学习需要大量标注数据,这一限制使得很多场景无法依靠人工智能的红利。因此,无监督学习正慢慢成为研究热点。VAE便是其中的典型代表。VAE的设计结构具有严谨的数学理论指导,粗略看了一遍,没有太理解,在此mark住,以后有需要再回来学习。链接如下:...原创 2018-06-29 13:42:39 · 678 阅读 · 0 评论 -
笔记-文本分类
文本分类是NLP领域最基本的应用场景,现实生活中很多问题都能划归为文本分类问题,诸如垃圾邮件分类、有害评论检测、新闻主题分类等。学术界里文本分类也是研究热点,从最初的模式识别方法到机器学习方法,再到近年来的深度学习方法,各类新型的算法都会尝试在文本分类上验证效果。而文本分类问题的普遍性也使得其成为了人工智能落地的一个重要案例。学习文本分类相关问题的解决方案,能在屏蔽NLP底层基础技术(诸如分词、词...原创 2018-06-29 14:14:21 · 439 阅读 · 0 评论 -
笔记-图嵌入(Graph Embedding)
图嵌入(Graph Embedding,也叫Network Embedding)是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题。知识图谱属于异构图数据,即节点与边不只一种类型。了解图嵌入能帮助理解图数据的处理过程,拓展思考问题的思路(传统ML基本都是table类型的数据),也能对未来可能的知识图谱研究做一些铺垫准备。学习参考链接如...原创 2018-06-29 14:26:37 · 13983 阅读 · 0 评论 -
笔记(总结)-神经语言模型和词向量
之前笔记(总结)-统计语言模型主要介绍了统计语言模型。可以看到,最终对句子的建模为(以二元文法为例): P(S)=p(w1)p(w2|w1)...p(wn|wn−1)P(S)=p(w1)p(w2|w1)...p(wn|wn−1)P(S)=p(w_1)p(w_2|w_1)...p(w_n|w_{n-1})核心问题在于如何计算参数p(wi|wi−1)p(wi|wi−1)p(w_i|w_{i-1}...原创 2018-07-09 16:15:36 · 2920 阅读 · 0 评论