NLP
爆浆大鸡排
个人主页:https://www.hijerry.cn/
Github:https://github.com/JerryCheese/
展开
-
NLP会议介绍 2019
我的原文:https://www.hijerry.cn/p/13983.html我以前在博客引用过 初学者如何查阅自然语言处理(NLP)领域学术资料 一文,里面比较详细的说明了NLP的学术会议。这次主要是罗列这些会议和CCF等级,把收集的信息汇总起来,以备以后自查,也记录了各个会议的截稿时间、会议时间、投稿数量、录取率等数据信息,以及一些比较有用网站链接。国外会议主要会议NLP领域四大顶...原创 2019-03-18 15:01:29 · 6530 阅读 · 1 评论 -
2019-CS224n-Assignment3
我的原文:2019-CS224n-Assignment3上个礼拜做完了,今天做个总结,主要方法和2017年差不多。机器学习和神经网络 (8分)这一节没什么难度,认真看 a3.pdf 就行。Adam的论文:ADAM: A METHOD FOR STOCHASTIC OPTIMIZATIONDropout论文:Dropout: A Simple Way to Prevent Neural N...原创 2019-03-21 17:12:30 · 1892 阅读 · 2 评论 -
2019-CS224n-Assignment1
我的原文:https://www.hijerry.cn/p/54554.html去年冬季学习了cs224n的2017课程,做了三个assignments,用的是TensorFlow。今年cs224n再次放课,一共有5个assignments,使用PyTorch,主讲还是Manning,特别喜欢这个老师,讲课生动有趣还挺可爱的哈哈哈~~Assignment1(点击下载) 的任务是探索词向量。以基...原创 2019-03-12 12:19:25 · 4243 阅读 · 3 评论 -
2019-CS224n-Assignment2
我的原文:2019-CS224n-Assignment2这次复习cs224n主要是先熟悉python和pytorch,方便之后进行论文复现等工作,同时也回顾一下模型和数学公式推导,找找感觉。解答:理解词向量(23分)我们先快速回顾一下word2vec算法,它的核心思想是“一个词的含义取决于它周围的词”。具体来说,我们有一个中心词(center word) c,和这个词 c 周围上下文构成的窗...原创 2019-03-14 19:31:07 · 3558 阅读 · 1 评论 -
使用字符级的RNN做姓名分类
原文:CLASSIFYING NAMES WITH A CHARACTER-LEVEL RNN作者:Sean Robertson翻译:Jerry日期:2019-01-24Preparing the Data从此处下载数据,将txt文件解压至同目录的data/names下数据集共有18个文本文件,命名规则是“[语种].txt”。文件内容每一行是一个姓名,许多是罗马字母(但是我们需要将其从...原创 2019-01-24 22:03:13 · 1187 阅读 · 0 评论 -
NLTK之词性标注
我的原文:http://blog.hijerry.cn/p/63432.html词性标注重要性回想学英语的时候,老师就开始讲词性,通过分析句子中某个单词的词性,我们可以推测这个词的意思,猜测这个词在句子中的作用,这对理解句子意思有极大的帮助。小弟也还是初学,以后若发现词性有更多作用时会继续补充~标注语料库NLTK(3.2.5)中提供了一些已经标注好词性的文本,通过下面代码可以查原创 2018-01-19 20:33:48 · 5922 阅读 · 0 评论 -
NLTK之词频
我的原文:http://blog.hijerry.cn/p/45749.htmlFreqDist类官方文档:nltk.probability.FreqDist介绍:词的概率分布类,包含一些概率学的方法。所在文件:probability.py ,大约在63~427行创建定义:__init__(self, samples=None)import nltkfro原创 2018-01-19 20:32:40 · 2319 阅读 · 1 评论 -
NLTK常用操作和语料库
我的原文:http://blog.hijerry.cn/p/22281.html安装NLTK按照官方步骤:Installing NLTK在安装完nltk后,通过下述命令可查看nltk版本:import nltkprint nltk.__doc__输出:The Natural Language Toolkit (NLTK) is an open source P原创 2018-01-19 20:30:05 · 16905 阅读 · 1 评论 -
2019-CS224n-Assignment4
我的原文:2019-CS224n-Assignment4这一次的内容甚至可以作为一个项目了,我最终得到BLEU是22.66。点击 这里 下载实验指导文档,这里 下载实验的预备代码RNN和神经机器翻译机器翻译是指,给定一个源句子(比如西班牙语),输出一个目标句子(比如英语)。本次作业中要实现的是一个带注意力机制的Seq2Seq神经模型,用于构建神经机器翻译(NMT)系统。首先我们来看NMT系...原创 2019-03-22 09:15:45 · 6058 阅读 · 4 评论