数据挖掘
你冻了我的冬天
剖析技术的底层原理
展开
-
特征工程
特征工程 1.特征提取 :计数向量器(Countvectorizer) 、词频-逆向文件频率(TF-IDF)、词转向量(Word2Vec) 2.特征转换 :连续型数据转换成离散数据、字符串和索引相互转换、正则化(Normalizer)、规范化(StandardScaler)、主成分分析 (PCA) 、向量-索引变换(VectorIndexer)、SQL转换器(SQLTransformer) 独热编码(OneHotEncoder)、最大值-最小值缩放(MinMaxScaler)特征向量合并(Ve原创 2021-02-10 19:25:04 · 321 阅读 · 0 评论 -
Python--python数据挖掘领域工具包
原文:http://qxde01.blog.163.com/blog/static/67335744201368101922991/ Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括: 一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线转载 2017-08-18 15:12:42 · 1868 阅读 · 0 评论