自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 kafka基础概念及环境搭建

一、kafka基础概念 1、kafka架构: producer:生产者,就是生产馒头(老妈) consumer:消费者,就是吃馒头的(你) borker:篮子 1个kafka <=> 1个borker topic:主题,给馒头带一个标签,topica的馒头是给你吃的,topicd的馒头是给你弟弟吃的 二、kafka部署及使用 1、kafka部署及使用 单节点单broker部署及使用 单节点多broker部署及使用 多节点多broker部署及使用 2、前提是已经有zookeeper #

2021-12-25 16:18:44 1347

原创 Flume基础概念及其环境配置

Flume基础概念及其环境配置+实战

2021-12-18 18:57:06 1504

原创 特征工程-数据预处理

特征工程-数据预处理 1、标准化 值转换为0,方差为1的分布 如SVM的RBF核和线性模型的L1和L2正则化项,都假设所有特征的均值都为零,并且方差在同一个数量级。如果一个特征的方差比其余特征的方差大许多个数量级,那么该特征将会主导整个目标函数,使得模型不能从其余特征学习到数据的特征 from sklearn import preprocessing X_scaled = preprocessing.scale(X,with_mean=True,with_std=True) #

2021-05-09 20:40:46 199

原创 python-pandas/sklearn中进行的编码方法

python-pandas/sklearn中进行的编码方法 1、进行将字符串一个或多个特征属性下的多个类别进行转化为1,2,3 … 1)、进行导入的库 from sklearn.preprocessing import LabelEncoder 2)、举例说明 data[object_data]=data[object_data].apply(LabelEncoder().fit_transform) 2、使用字符串独热进行转换 1)、方法一:使用pandas中进行独热编码 (1)、进行导入的库 imp

2021-05-05 21:17:41 1438

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除