- 博客(4)
- 收藏
- 关注
原创 kafka基础概念及环境搭建
一、kafka基础概念 1、kafka架构: producer:生产者,就是生产馒头(老妈) consumer:消费者,就是吃馒头的(你) borker:篮子 1个kafka <=> 1个borker topic:主题,给馒头带一个标签,topica的馒头是给你吃的,topicd的馒头是给你弟弟吃的 二、kafka部署及使用 1、kafka部署及使用 单节点单broker部署及使用 单节点多broker部署及使用 多节点多broker部署及使用 2、前提是已经有zookeeper #
2021-12-25 16:18:44 1347
原创 特征工程-数据预处理
特征工程-数据预处理 1、标准化 值转换为0,方差为1的分布 如SVM的RBF核和线性模型的L1和L2正则化项,都假设所有特征的均值都为零,并且方差在同一个数量级。如果一个特征的方差比其余特征的方差大许多个数量级,那么该特征将会主导整个目标函数,使得模型不能从其余特征学习到数据的特征 from sklearn import preprocessing X_scaled = preprocessing.scale(X,with_mean=True,with_std=True) #
2021-05-09 20:40:46 199
原创 python-pandas/sklearn中进行的编码方法
python-pandas/sklearn中进行的编码方法 1、进行将字符串一个或多个特征属性下的多个类别进行转化为1,2,3 … 1)、进行导入的库 from sklearn.preprocessing import LabelEncoder 2)、举例说明 data[object_data]=data[object_data].apply(LabelEncoder().fit_transform) 2、使用字符串独热进行转换 1)、方法一:使用pandas中进行独热编码 (1)、进行导入的库 imp
2021-05-05 21:17:41 1438
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人