自然语言处理
文章平均质量分 66
非零因子
终身学习
展开
-
RNN-LSTM
one to one:图像分类 image classificationone to many:看图说话 image captioningmany to one:情感分析 sentiment classification/音乐分类many to many:机器翻译 senquence to sequencemany to many:语言模型/NER tagging结构:只有输入x和隐藏状态h递归,RNN是一个链式结构,每个时间片使用的是相同的参数。以序列(sequence)为输入,在序列的演进方向递归在时间原创 2022-07-02 14:31:34 · 304 阅读 · 0 评论 -
字符级文本生成LSTM
LSTM生成字符级文本原创 2022-06-30 00:52:27 · 435 阅读 · 0 评论 -
自然语言处理——word2vec项目实战——从Word2Vec到FastText
从Word2Vec到FastTextWord2Vec在深度学习中的应⽤⽂本⽣成(Word2Vec + RNN/LSTM)⽂本分类(Word2Vec + CNN)文本生成神经网络:一堆公式组成的非线性回归模型普通神经网络[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5L4DEtMn-1653990033441)(E:/A%20wangdanxu/%E6%9D%82%E7%89%A9/typore/image-20220531162244167.png)]带记原创 2022-05-31 17:41:34 · 227 阅读 · 0 评论 -
自然语言处理——word2vec项目实战—— 情感分析
bag of words + 随机森林(有标签数据)import osimport reimport numpy as npimport pandas as pdfrom bs4 import BeautifulSoupfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics impor原创 2022-05-28 20:41:09 · 657 阅读 · 0 评论 -
自然语言处理——word2vec项目实战—— Word2VEec理论基础
Word2VEec理论基础NLP常见任务自动摘要指代消解(小明放学了,妈妈去接【他】)机器翻译(小心地滑->Slide carefully)词性标注(heat(v.) water(n.) in(p.) a(det.) pot(n.))分词(中文日文等) 大水沟/很/难/过主题识别文本分类NLP处理方法传统:基于规则现代:基于统计机器学习HMM,CRF,SVM,LDA,CNN …“规则”隐含在模型参数里图像是原始数据,但是自然语言是人的智慧的结晶,所以利用机器学原创 2022-05-16 13:33:06 · 561 阅读 · 0 评论 -
自然语言处理——word2vec项目实战—— NLP理论基础
NLP理论基础语料库NLTK : pip install nltkhttp://www.nltk.org//(40条消息) NLTK安装方法_一脑子RMC136的博客-CSDN博客_nltk安装教程文本处理流程句子→预处理→分词(Tokenize)→特征工程(make features)→机器学习(machine learning)分词(Tokenize)把长句子拆成“有意义”的小部件英文from nltk.tokenize import word_tokenizesentences原创 2022-05-11 19:17:19 · 664 阅读 · 0 评论