NLP
文章平均质量分 73
zoe9698
Nothing
展开
-
亲测最完善的文本清楚中英文标点符号的方法
【代码】亲测最完善的文本清楚中英文标点符号的方法。原创 2022-11-02 11:16:29 · 164 阅读 · 0 评论 -
Python NLP 基础常见code 技巧
pytorch每日一学20(torch.arange()、torch.range()、torch.linespace()、torch.logspace())根据步长创造一维tensor_Fluid_ray的博客-CSDN博客_torch。arangepytorch.range() 和 pytorch.arange() 的区别_Who is abc的博客-CSDN博客_torch.arrange 参数解释:start:创建的tensor元素的起始值(不一定一定第一个元素就是start),默认为0。en原创 2022-07-14 10:47:06 · 318 阅读 · 0 评论 -
(情感倾向分类)2分类文本任务,Bert微调详细教程
🎀Dataset:SST-2Model:bert-base-cased✨transformers库的使用【三】对预训练模型进行微调Transformers实战——使用Trainer类训练和评估自己的数据和模型HuggingFace从在线库中载入SST2数据集from datasets import load_datasetdataset = load_dataset('glue','sst2')Tokenizer:将input转换为模型可以处理的格式。from原创 2022-05-04 23:23:20 · 2441 阅读 · 0 评论 -
关键词提取一:构造共现矩阵
因为TFIDF算法的提取关键词的准确性很差,tfidf提取出的关键词很难看出文本的主旨,于是考虑结合文本语义对词汇的权重(IDF)重新分配,于是想要借鉴SKE算法,即将词语语义特征融入关键词提取过程中,构建词语语义相似度网络并利用居间度密度度量词语语义关键度。因为构造词语网络需要先构造关键词共现图,关键词共现图需要先构造关键词共现矩阵,所以第一步就是构造关键词共现矩阵。构造关键词共现矩阵的原创 2018-01-28 21:48:22 · 14272 阅读 · 2 评论 -
自然语言处理组2017论文研读1:ME-MD:一个有效的神经系统框架
ME-MD:一个有效的神经系统框架具有多个编码器和解码器的机器翻译Jinchao Zhang1 Qun Liu3,1 Jie Zhou2 1Key Laboratory of IntelligentInformation Processing, Institute of Computing Technology, CAS. 2Baidu Research- Institute of Deep Le...翻译 2018-06-22 20:19:13 · 801 阅读 · 0 评论