NLP
以文本分类为主的自然语言处理学习与总结——笔记
初学者wwl
这个作者很懒,什么都没留下…
展开
-
清晰易懂Transformer(转载)
Attention is all your need 谷歌的超强特征提取网络——Transformer转载 2020-06-26 12:18:20 · 204 阅读 · 0 评论 -
深度学习——卷积神经网络之卷积(转载2)
卷积转载 2020-02-03 13:24:00 · 100 阅读 · 0 评论 -
深度学习——卷积神经网络之卷积的理解(转载1)
卷积的理解转载 2020-02-03 13:22:50 · 128 阅读 · 0 评论 -
每日一滴——更新pycharm_nltk包中模块的安装
nltk包中模块安装:安装nltk之后,当用到一些模块时还需要进行安装;例如,punkt模块import nltknltk.download('punkt')或者——直接打开下载界面进行安装:import nltknltk.download()第一种方法容易遇到一些错误,例如【10054】;第二种方法由于下载的东西比较小,所以不容易出现错误。...原创 2020-01-20 22:24:52 · 1866 阅读 · 0 评论 -
每日一滴(实践)——NLP之处理停用词
停用词:顾名思义,没用的单词,也叫停止词;即,执行信息检索任务或其他自然语言任务时需要过滤掉的词(例如:‘to’,‘is’,‘the’);这些词对句子整体的理解没多大作用,考虑到处理效率,则需要在处理数据前将这些词去掉(这也是数据标准化中的一步)。处理停用词即将待处理文本中的停用词去掉。代码:from nltk.corpus import stopwordsstops=set(stop...原创 2020-01-12 23:37:32 · 1460 阅读 · 0 评论 -
CS224n——lecture14--TreeRNN与句法分析
CS224n笔记14 Tree RNN与短语句法分析转载 2020-01-20 12:04:44 · 381 阅读 · 0 评论 -
每日一滴之第一个小任务总结————数据预处理并在Linux上运行(尾篇)
接上一篇:以上:安装好anaconda并且以及创建好anaconda环境了。进入环境的方法:Last login: Sun Jan 26 19:01:07 2020 from 219.217.207.151wlwang@ubuntu:~$ source /home/wlwang/.bashrcwlwang@ubuntu:~$ source activate wlwang(wlwang...原创 2020-01-26 23:07:36 · 207 阅读 · 0 评论 -
每日一滴之第一个小任务总结————数据预处理并在Linux上运行(前篇)
前言:本文主要是,最近几天学习文本分类,做的一个小任务:文本预处理,统计词频、标签出现的频率(即,train_500000_tg.txt);这里主要讲的是,Linux环境的配置以及python相关包.py脚本...原创 2020-01-26 23:15:34 · 376 阅读 · 0 评论 -
文本分类——预处理
前言:文本分类,NLP领域比较经典的使用场景;文本分类一般分为:特征工程+分类器+结果评价与反馈。特征工程分为:文本预处理+特征提取+文本表示。本文主要是文本预处理;先文本标准化——便于对文本的后序操作,再...原创 2020-01-20 11:58:37 · 1406 阅读 · 0 评论