自然语言处理
BruceWu1234
遇见最好的自己
展开
-
beam search及pytorch实现
主要记录两种不同的beam search版本版本一,使用类似层次遍历的方式进行搜索,用队列进行维护,每次循环对当前层的所有节点进行搜索,这些节点每个分别对应topk个节点作为下一层候选节点,取所有候选节点的前tok个作为下一层节点加入队列bfs with width constraint. 启发式搜索的一种. 属于贪心算法. 如果k -> inf,那么等价于bfs.从根节点开始(),...原创 2019-07-13 00:12:01 · 10393 阅读 · 3 评论 -
pyltp的使用
pyltp 是 LTP 的 Python 封装,提供了分词,词性标注,命名实体识别,依存句法分析,语义角色标注的功能。使用前请先下载完整模型请先下载完整的 LTP 模型文件下载地址 - 百度云当前模型版本 - 3.4.0请确保下载的模型版本与当前版本的 pyltp 对应,否则会导致程序无法正确加载模型。请注意编码pyltp 的所有输入的分析文本和输出的结果的编码均为 UTF-8。如...原创 2019-06-14 00:33:11 · 1530 阅读 · 0 评论 -
seq2seq以及attention模型的pytorch实现(以机器翻译为例)
前言本系列教程为pytorch官网文档翻译。本文对应官网地址:https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html系列教程总目录传送门:我是一个传送门本系列教程\对应的 jupyter notebook 可以在我的Github仓库下载:下载地址:https://github.com/Hol...原创 2019-04-20 00:25:53 · 4624 阅读 · 2 评论 -
文本分类系列(2):TextRNN及其pytorch实现
[文本分类系列(1):TextCNN及其pytorch实现](https://blog.csdn.net/u014514939/article/details/88834548)TextRNN尽管TextCNN能够在很多任务里面能有不错的表现,但CNN有个最大问题是固定 filter_size 的视野,一方面无法建模更长的序列信息,另一方面 filter_size 的超参调节也很繁琐。CNN...原创 2019-03-27 18:18:32 · 6340 阅读 · 8 评论 -
文本分类系列(1):textcnn及其pytorch实现
textcnn原理:核心点在于使用卷积来捕捉局部相关性,具体到文本分类任务中可以利用CNN来提取句子中类似 n-gram 的关键信息。textcnn详细过程:第一层是图中最左边的7乘5的句子矩阵,每行是词向量,维度=5,这个可以类比为图像中的原始像素点了。然后经过不同 filter_size的一维卷积层(这里是2,3,4),每个filter_size 有filter_num(这里是2)个输...原创 2019-03-27 02:15:45 · 11846 阅读 · 7 评论