![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
分类算法
自然语言处理 关于文本分类方面介绍
微知girl
我是NLP相关方向研究生,小白一枚,梦想自己有一天能混成业界大牛,文章或代码有任何错误欢迎指出,不胜感激~ 如果觉得对您有用请关注点赞,(#^.^#) 希望大家能一起探讨相关方面问题,互相学习,互相进步,(●'◡'●)~~
展开
-
分类算法 —— 相关链接
分类算法(一)—— 概述分类算法(二)—— FastText(原理介绍)分类算法(二)—— FastText分类算法(三)—— LR NB SVM KNN 调用示例分类算法(四) —— SVM分类算法(五) —— xgboost 安装分类算法(六)——softmax和sigmoid,二分类、多分类、多标签分类关系分类算法(七)—— 短文本分类我这里的介绍目前还在机器学习阶段,深度学习的算法都还没有介绍到(后续会慢慢补充),下面推送下博客园的一些深度学习文本分类的介...原创 2020-12-02 10:34:16 · 126 阅读 · 0 评论 -
分类算法(七)—— 短文本分类
深入做文本分类的同学都知道,短文本分类相对来说比较难。因为较短的文本包含的信息较少,有时候模型很难学到关键特征。 参考https://www.zhihu.com/question/326770917/answer/698646465,指出:对于短文本,CNN配合Max-pooling池化(如TextCNN模型)速度快,而且效果也很好。因为短文本上的关键词比较容易找到,而且Max-pooling会直接过滤掉模型认为不重要特征。具体工作机制是:卷积窗口沿着长度为n的文本一个个滑动,类似于n-gr...原创 2020-11-02 14:01:07 · 2073 阅读 · 0 评论 -
分类算法(六)——softmax和sigmoid,二分类、多分类、多标签分类关系
这两个函数想必很多人会有所混淆,这里简单介绍一下,包括二分类、多分类、多标签分类之间的关系以及如何应用softmax和sigmoid。 其实说起来也简单,先来介绍下基本信息。softmaxsoftmax 多分类比较常用一些,主要用途是把一些输入映射为0-1之间的实数,并且归一化保证和为1,而多分类的概率之和也刚好为1。https://blog.csdn.net/bitcarmanlee/article/details/82320853这里盗的图,哈哈哈代价函数一般...原创 2020-09-01 16:09:29 · 4933 阅读 · 0 评论 -
分类算法(二)—— FastText(原理介绍)
分类算法(二)—— FastText包括文本分类相关调用和操作文本表示(一)—— word2vec(skip-gram CBOW) glove, transformer, BERT这里整理FastText的相关原理介绍 参考link简介fasttext是facebook开源的一个词向量与文本分类工具,在2016年开源,典型应用场景是“带监督的文本分类问题”。提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。fastText架构类似于wor...原创 2020-09-01 11:38:14 · 2086 阅读 · 0 评论 -
分类算法(五) —— xgboost 安装
win7下 xgboost安装踩了一堆坑,记录一下参考链接:https://blog.csdn.net/u013738531/article/details/70299611 总体概述,扫一眼,跳到下个链接 https://blog.csdn.net/ychanmy/article/details/50972530 首先按照这个逻辑一步步安装(具体一点看http://www.th7.cn/sy...原创 2018-06-13 19:21:59 · 162 阅读 · 0 评论 -
分类算法(四) —— SVM
SVM 算法一种效果比较好的分类算法,相对来说训练速度较其他方法可能慢一些# -*- encoding=utf-8 -*-from sklearn import svmfrom sklearn import neighbors, linear_modelfrom sklearn import metricsfrom sklearn.feature_extraction.text imp...原创 2018-06-05 14:20:31 · 352 阅读 · 0 评论 -
分类算法(三)—— LR NB SVM KNN 调用示例
# -*- encoding=utf-8 -*-from sklearn import svmfrom sklearn import neighbors, linear_modelfrom sklearn import metricsfrom sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.nai...原创 2018-06-05 14:05:41 · 1522 阅读 · 0 评论 -
分类算法(一)—— 概述
机器学习分类算法有很多,LR、SVM、贝叶斯、随机森林、FastText、KNN、DL、GBDT等,相关变种更是数不胜数。 个人认为SVM还是比较有效的方法,可以作为基准,当然这些方法都各有优劣。不同分类算法的优缺点介绍了svm、LR、贝叶斯、决策树等分类方法的优缺点。 后面相关专题会对不同分类方法进行简单介绍,以及Python调用相关代码。...原创 2018-06-05 13:46:47 · 632 阅读 · 0 评论 -
分类算法(二)—— FastText
原理介绍 fasttext是facebook开源的一个词向量与文本分类工具,在2016年开源,典型应用场景是“带监督的文本分类问题”。提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。 fastText的架构和word2vec中的CBOW的架构类似,因为它们的作者都是Facebook的科学家Tomas Mikolov,而且确实fastText也算是words2ve...原创 2018-06-05 14:02:18 · 1825 阅读 · 0 评论