sklearn 知识点总结

最新推荐文章于 2024-08-16 23:31:18 发布

eryihahaha

最新推荐文章于 2024-08-16 23:31:18 发布

阅读量249

点赞数

分类专栏： sklearn 文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_45683677/article/details/107893678

版权

sklearn 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

sklearn 是一个功能强大的机器学习库，在本篇博文中，博主将记录自己在使用sklearn中的一些问题，思考

1. sklearn中的fit与transform

在sklearn中经常可见：

fit():计算数据的参数，\mu（均值），\sigma（标准差），并存储在对象中（例如实例化的CountVectorizer()等）。
transform():将这些参数应用到数据集，进行标准化（尺度化）。
fit_transform()：将前两种方法合并，fit + transform，然后对数据集使用。
```
 test数据集只使用transfrom() 使得分布符合训练集
```

2.sklearn中的缺失值处理方法

Sklearn Impute SimpleImputer 处理缺失值

在这里插入图片描述
示例：

from sklearn.impute import SimpleImputer #导入模块
imp_mean=SimpleImputer(missing_values=np.nan,strategy='mean')  #实例化，均值填充
imp_mean=imp_mean.fit_transform(age)     #fit_transform一步完成调取结果

eryihahaha

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sklearn 知识点总结

sklearn 是一个功能强大的机器学习库，在本篇博文中，博主将记录自己在使用sklearn中的一些问题，思考1. sklearn中的fit与transform在sklearn中经常可见：fit():计算数据的参数，\mu（均值），\sigma（标准差），并存储在对象中（例如实例化的CountVectorizer()等）。transform():将这些参数应用到数据集，进行标准化（尺度化）。fit_transform()：将前两种方法合并，fit + transform，然后对数据集
复制链接

扫一扫

专栏目录