![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
特征提取
文章平均质量分 87
九点澡堂子
这个作者很懒,什么都没留下…
展开
-
2021-06-15
听说堂妹用AI技术给自己改头换面?本文章同步更新在个人微信公众号“九点澡堂子”,原创:九点澡堂子各位客官好,我是堂妹。 大家知道,我现在的文章封面基本都是自己的照骗,还是不露正脸的那种。 俗称"背影杀手"。 一般这样的,没有别的原因,就是因为丑,起码对于我这样。 当然,我不仅因为丑,还因为手残。 作为程序媛,我属于化妆上班那一趴, 但基本仅限于粉底、口红、眉毛,顶多加个腮红????♀️。 十年如一日,没有任何花样。 再看看我身边的学公关、艺术、人文等专业的女朋友们,原创 2021-06-16 00:19:15 · 343 阅读 · 0 评论 -
sklearn——CountVectorizer详解
参考如下链接整理: http://stackoverflow.com/questions/27488446/scikit-learn-countvectorizer http://www.itkeyword.com/doc/4813494854317445586/TfidfVectorizer-sklearn-CountVectorizer 这个链接写的很棒,主要参考他的: https:/...原创 2018-09-02 22:32:34 · 150462 阅读 · 27 评论 -
文本分类任务特征工程和分类器介绍
文本分类任务基本框架文本特征工程:决定模型的上限分类器:逼近模型的上限类别文本特征提取的主要方法分类1. 经典文本特征——前人研究成熟理论1). TF 词频 2). TFIDF 词频逆文档 3). Doc2vec 深度学习 词向量按位相加形成一个向量,或者拼接形成长向量 4). Word2vec 深度学习2. 手工构...原创 2018-09-11 17:32:26 · 2021 阅读 · 1 评论 -
文本分类任务的基础实现(一)——机器学习部分_特征工程_代码分解
本文主要介绍文本分类任务的基础实现,主要基于机器学习sklearn/lightgbm包实现。机器学习部分主要包含特征工程和分类器两大部分:特征工程部分主要针对文本分类任务的hash/lsa/lda/doc2vec特征提取/特征选择/特征组合/特征构造进行了实现;分类器部分主要有逻辑回归/SVM/随机森林/Bagging/Adaboost/GBDT /Xgboost /LightGBM等。...原创 2018-09-12 16:15:40 · 1375 阅读 · 1 评论 -
文本分类任务的基础实现(三)——机器学习部分——特征提取_tf特征+LDA特征原理介绍
本文介绍前文用到的特征提取方法的原理介绍。tf特征+LDA特征1. tf特征(term frequency词频特征)将原始数据数字化为tf特征from sklearn.feature_extraction.text import CountVectorizervectorizer = CountVectorizer(ngram_range=(1, 2), min_df=...原创 2018-09-13 11:08:34 · 2599 阅读 · 1 评论 -
文本分类任务的基础实现(四)——机器学习部分——特征提取_tf-idf特征+LSA特征原理介绍
本文介绍前文用到的特征提取方法的原理介绍。TF-IDF特征+LSA特征1. TF-IDF特征将原始数据数字化为tfidf特征from sklearn.feature_extraction.text import TfidfVectorizervectorizer = TfidfVectorizer(ngram_range=(1, 2), min_df=3, ...原创 2018-09-14 10:44:24 · 2316 阅读 · 1 评论 -
文本分类任务的基础实现(五)——机器学习部分——特征提取_Doc2vec特征+hash特征原理介绍
本文介绍前文用到的特征提取方法的原理介绍。 【写的不好,理解的不透彻,理解深刻了回来再补充,去吃公司下午茶了,嘻嘻嘻】Doc2vec特征 & hash特征1. Doc2Vec将原始数据数字化为doc2vec特征from gensim.models.doc2vec import Doc2Vec, TaggedDocument """=============...原创 2018-09-14 17:53:10 · 1703 阅读 · 1 评论 -
fit_transform,fit,transform区别和作用详解!!!!!!
1. 写在前面fit和transform没有任何关系,仅仅是数据处理的两个不同环节,之所以出来这么个函数名,仅仅是为了写代码方便。所以会发现transform()和fit_transform()的运行结果是一样的。注意:运行结果一模一样不代表这两个函数可以互相替换,绝对不可以!!!transform函数是一定可以替换为fit_transform函数的,fit_transform函数不能替换为...原创 2018-10-08 18:14:47 · 170198 阅读 · 16 评论