自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 word2vec理解及pytorch实现

word2vec理解及pytorch实现欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导...

2019-01-29 16:03:24 7501 2

原创 cw2vec解析及代码实现

序言cw2vec来自于蚂蚁金服的论文:《cw2vec: Learning Chinese Word Embeddings with Stroke n-gram Information》,本文主要对论文中的一些关键点进行解析,并讲解pytorch版本实现。一、相关知识词向量算法是自然语言处理领域的基础算法,在序列标注、问答系统和机器翻译等诸多任务中都发挥了重要作用。词向量算法最早由谷歌在...

2019-01-14 20:19:06 2187 5

转载 Transformer:The base of BERT

本文转载自《机器学习算和自然语言处理》Transformer由论文《Attention is All You Need》提出,现在是谷歌云TPU推荐的参考模型。论文相关的Tensorflow的代码可以从GitHub获取,其作为Tensor2Tensor包的一部分。哈佛的NLP团队也实现了一个基于PyTorch的版本,并注释该论文。在本文中,我们将试图把模型简化一点,并逐一介绍里面的核...

2019-01-14 19:27:05 326

原创 cw2vec: Learning Chinese Word Embeddings with Stroke n-gram Information

Abstract我们提出了一种新的汉字嵌入学习方法cw2vec。根据我们的观察,笔划层次的信息对于提高汉字单词嵌入的学习是至关重要的。具体来说,我们设计了一种极简主义的方法来利用这些特征,通过使用笔画n-gram来捕捉汉字单词的语义和构词层面的信息。通过定性分析,我们证明了我们的模型能够提取现有方法无法捕获的语义信息。在单词相似性、单词类比、文本分类和命名实体识别任务方面的实验结果表明,该方法...

2019-01-09 09:15:31 1499

转载 字符串相似度计算算法

本文参考:https://zhuanlan.zhihu.com/p/36892462,https://zhuanlan.zhihu.com/p/335672681. 字符串子串查找算法KMP给定一个主串(以 S 代替)和模式串(以 P 代替),要求找出 P 在 S 中出现的位置,此即串的模式匹配问题。Knuth-Morris-Pratt 算法(简称 KMP)是解决这一问题的常用算法之一。...

2019-01-06 10:33:40 5560 1

17flowers dataset for computer vision

牛津大学17类花卉数据集,每个类别有80个图像。选择的花是英国的一些常见花。图像具有大规模,姿势和光线变化,并且在类中也存在具有大量图像的类并且与其他类非常相似。类别可以在下图中看到。我们将数据集随机分成3个不同的训练,验证和测试集。已经将图像的子集标记为用于分割。

2018-10-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除