- 博客(7)
- 收藏
- 关注
原创 笔记-图嵌入(Graph Embedding)
图嵌入(Graph Embedding,也叫Network Embedding)是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题。知识图谱属于异构图数据,即节点与边不只一种类型。了解图嵌入能帮助理解图数据的处理过程,拓展思考问题的思路(传统ML基本都是table类型的数据),也能对未来可能的知识图谱研究做一些铺垫准备。学习参考链接如...
2018-06-29 14:26:37 13983
原创 笔记-文本分类
文本分类是NLP领域最基本的应用场景,现实生活中很多问题都能划归为文本分类问题,诸如垃圾邮件分类、有害评论检测、新闻主题分类等。学术界里文本分类也是研究热点,从最初的模式识别方法到机器学习方法,再到近年来的深度学习方法,各类新型的算法都会尝试在文本分类上验证效果。而文本分类问题的普遍性也使得其成为了人工智能落地的一个重要案例。学习文本分类相关问题的解决方案,能在屏蔽NLP底层基础技术(诸如分词、词...
2018-06-29 14:14:21 439
原创 笔记-变分自编码器(Variational Auto Encoder,VAE)
从大数据时代——>人工智能,生活中各场景下的大数据问题都能用大数据+人工智能算法的配方进行求解。诸如分类、回归等有监督学习问题都得到了很好的解决,但监督学习需要大量标注数据,这一限制使得很多场景无法依靠人工智能的红利。因此,无监督学习正慢慢成为研究热点。VAE便是其中的典型代表。VAE的设计结构具有严谨的数学理论指导,粗略看了一遍,没有太理解,在此mark住,以后有需要再回来学习。链接如下:...
2018-06-29 13:42:39 679
原创 笔记-AutoML
深度学习发展至今,虽然取得了很多成果,但其使用门槛依旧很高。对神经网络进行调参从而达到解决问题的效果,需要使用者具有一定的机器学习背景和调参经验,现实情况往往是(不论工业界还是学术界)使用学术界经过沉淀后的经典模型与典型参数设置,并在之上做细微的调整。这极大地限制了人们的思维,网络结构仍然是基于人的经验。既然计算机算法到目前为止已经具有了相当的智能水平,能否让算法来设计神经网络架构并评判优劣呢?G...
2018-06-29 13:32:53 774
原创 笔记-CRF
CRF在序列标注任务上有着广泛的应用,由于使用了全局的信息,能取得比HMM更好的效果。学习参考链接如下:如何用简单易懂的例子解释条件随机场(CRF)模型?它和HMM有什么区别?基于CRF序列标注的中文依存句法分析器的Java实现简明条件随机场CRF介绍 | 附带纯Keras实现DL4NLP —— 序列标注:BiLSTM-CRF模型做基于字的中文命名实体识别sequence-la...
2018-06-29 12:47:50 295
原创 笔记-NLP相关调研
由于实验室目前研究方向偏重于NLP和知识图谱,在学习了一段时间机器学习相关内容后,也决定暂时侧重于NLP相关内容的研究。对NLP方面的相关调研工作做一个总结,顺序不分先后。这部分内容可能和笔记-深度学习场景调研有交集,在此就不重复写已有的东西。依存句法分析(Dependency Parsing,DP)、语义依存分析(Samantic Dependency Parsing,SDP)、语义角色标注...
2018-06-29 11:41:17 430 1
原创 笔记-深度学习场景调研
深度学习的大潮如火如荼,但深度学习并非所有问题的最好答案。那么哪些方向已经较为成熟应用了深度学习并取得了较好效果呢,通过了解深度学习如何解决不同的问题,从而更深入理解深度学习算法的特点与适用性,做了相关调研,附上链接如下:深度学习在图像领域的应用,图像分类、图像识别、语义分割、视频检测…这是深度学习最初放光的领域,也是当前研究的最热点,不同类型的网络层出不穷,很少的一部分沉淀下来成为了经典。理...
2018-06-29 10:56:55 633
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人