nlp
文章平均质量分 73
Catherine_In_Data
这个作者很懒,什么都没留下…
展开
-
NLP之文本分类(三)---TextCNN
0. 背景:TextCNN对文本浅层特征的抽取能力很强,在短文本领域如搜索、对话领域专注于意图分类时效果很好,应用广泛,且速度快,一般是首选;对长文本领域,TextCNN主要靠filter窗口抽取特征,在长距离建模方面能力受限,且对语序不敏感paper:Convolutional Neural Networks for Sentence Classificationpaper: A Sensitivity Analysis of (and Practitioners’ Guide to) Conv原创 2022-05-07 15:44:35 · 401 阅读 · 0 评论 -
NLP之文本分类(一)---文本分类描述
0 背景主要是参考对文本分类的描述,相关数据集,常用算法,选取一些核心点,同时加上自身实践遇到的一些问题, 以及面试中会问到的关于文本分类的问题,共学习使用。后面做进一步补充。原创 2022-05-07 15:33:01 · 2232 阅读 · 0 评论 -
NLP之文本分类(五)---多标签分类实践
多标签分类原创 2022-05-07 10:57:27 · 4513 阅读 · 0 评论 -
NLP之文本分类(四)---多标签分类初探
1. 多标签分类多标签学习[MLL]由一个样例和一个集合标签组成。任务分解: MLL包括主要任务: 多标签分类(MLC)和标签排序(LR)阈值校准: 设定排序的阈值任务 特点:(1)不同数据集多标签程度不同。衡量多标签程度自然方式: 即样本平均标签数。标签密度用标签集大小来规范化标签基数标签多样性: 数据集中不同标签集合的数量,可以用数据及大小规范化。(2)标签具有相互关系多标签数据集中学习的关键挑战在于难以控制巨型输出空间,即标签集合的数量随着类别数量指数及增原创 2022-05-07 10:36:51 · 3164 阅读 · 0 评论 -
NLP之文本分类(二)---FastText
参考资料:https://blog.csdn.net/feilong_csdn/article/details/88655927https://fasttext.cc/docs/en/supervised-tutorial.htmlhttps://fasttext.cc1. 背景:fasttext文本分类效率较高,可以快速生成文本分类baseline, 本文主要是了解fasttext核心优化点,以及熟悉官网python版本模型训练与预测。将doc的词以及n-gram向量叠加平均得到文档向量,然原创 2022-05-05 20:39:32 · 1534 阅读 · 0 评论 -
NLP开源
做学习使用, 持续更新中。。。(1)nlp 常见任务与数据集,以下链接写的比较详细,请参考原文https://www.cnblogs.com/guozw/p/13369757.html原创 2022-02-16 16:16:43 · 426 阅读 · 0 评论 -
nlp ---无标签文本数据标准简单方法
数据标注的思路(1)数据标注标准定义1)初步定义标注数据标准。2)标注小批量数据晚上数据标准标准。(2)标准样本选取1)聚类方法,转tfidf,然后用聚类,主要是查看数据整体分布如何2)标注小批量数据后,用模型预测, 然后继续标注准确预测准确率不高的数据。...原创 2020-11-04 11:16:24 · 739 阅读 · 0 评论