- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 word2vec理解及pytorch实现
word2vec理解及pytorch实现欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导...
2019-01-29 16:03:24 7501 2
原创 cw2vec解析及代码实现
序言cw2vec来自于蚂蚁金服的论文:《cw2vec: Learning Chinese Word Embeddings with Stroke n-gram Information》,本文主要对论文中的一些关键点进行解析,并讲解pytorch版本实现。一、相关知识词向量算法是自然语言处理领域的基础算法,在序列标注、问答系统和机器翻译等诸多任务中都发挥了重要作用。词向量算法最早由谷歌在...
2019-01-14 20:19:06 2187 5
转载 Transformer:The base of BERT
本文转载自《机器学习算和自然语言处理》Transformer由论文《Attention is All You Need》提出,现在是谷歌云TPU推荐的参考模型。论文相关的Tensorflow的代码可以从GitHub获取,其作为Tensor2Tensor包的一部分。哈佛的NLP团队也实现了一个基于PyTorch的版本,并注释该论文。在本文中,我们将试图把模型简化一点,并逐一介绍里面的核...
2019-01-14 19:27:05 326
原创 cw2vec: Learning Chinese Word Embeddings with Stroke n-gram Information
Abstract我们提出了一种新的汉字嵌入学习方法cw2vec。根据我们的观察,笔划层次的信息对于提高汉字单词嵌入的学习是至关重要的。具体来说,我们设计了一种极简主义的方法来利用这些特征,通过使用笔画n-gram来捕捉汉字单词的语义和构词层面的信息。通过定性分析,我们证明了我们的模型能够提取现有方法无法捕获的语义信息。在单词相似性、单词类比、文本分类和命名实体识别任务方面的实验结果表明,该方法...
2019-01-09 09:15:31 1499
转载 字符串相似度计算算法
本文参考:https://zhuanlan.zhihu.com/p/36892462,https://zhuanlan.zhihu.com/p/335672681. 字符串子串查找算法KMP给定一个主串(以 S 代替)和模式串(以 P 代替),要求找出 P 在 S 中出现的位置,此即串的模式匹配问题。Knuth-Morris-Pratt 算法(简称 KMP)是解决这一问题的常用算法之一。...
2019-01-06 10:33:40 5560 1
17flowers dataset for computer vision
2018-10-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人