我对机器学习的整理理解

最新推荐文章于 2022-07-02 19:16:10 发布

Fitz_p

最新推荐文章于 2022-07-02 19:16:10 发布

阅读量415

点赞数

分类专栏： Tensorflow 人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fitz_p/article/details/103450818

版权

机器学习同时被 3 个专栏收录

19 篇文章 0 订阅

订阅专栏

14 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

在机器学习通常来说，特征工程对模型性能影响最大，参数调优一般提升不如特征工程提升。
首先需要对数据进行充分探索，如属性是字符串类型、日期类型还是数值类型；若提供的数据存在几张表中，表中数据是否存在关联，是否可以进行统计、聚合；从业务理解上，可能影响模型性能的因素有哪些，表中数据能否构造该因素。
其次，我们需要对数据进行预处理。对字符串、categories 一般来说我们可以：
1.直接删去，不使用该列数据。这种处理方式对模型效果影响较大
2.进行LabelEncoder处理。可用sklearn提供的LabelEncoder API将categories映射到数值（1，2，3…）上去，或者自定义一个映射标准，通常来说自定义映射标准会更好，如果我们的数据是会变动的，某天可能新增一个类型，自定义映射可保证映射结果一致。LabelEncoder这种处理方式会引入顺序，隐含类2 > 1 的意思在里面。对树模型影响不大，对距离模型影响稍微大一点
3.进行one_hot编码，通过sklearn 提供的 API：OneHotEncoder(handle_unknown=‘ignore’, sparse=False)可以将属性返回numpy形式，可以一定程度解决稀疏问题。
对于数值来说，一般需要观察是否具有缺失值（插补、舍去）、异常值（修正、舍去）、离群点（修正、舍去），而后对其进行相应的操作。

下图为我对机器学习的整体认知，并详细标注了数据预处理 & 特征工程的处理方式：
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
我对机器学习的整理理解

在机器学习通常来说，特征工程对模型性能影响最大，参数调优一般提升不如特征工程提升。首先需要对数据进行充分探索，如属性是字符串类型、日期类型还是数值类型；若提供的数据存在几张表中，表中数据是否存在关联，是否可以进行统计、聚合；从业务理解上，可能影响模型性能的因素有哪些，表中数据能否构造该因素。其次，我们需要对数据进行预处理。对字符串、categories 一般来说我们可以： ...
复制链接

扫一扫

专栏目录

Fitz_p CSDN认证博客专家 CSDN认证企业博客

码龄6年

30: 原创

14万+: 周排名

149万+: 总排名

6万+: 访问

: 等级

951: 积分

10: 粉丝

23: 获赞

15: 评论

99: 收藏

私信

关注

热门文章

分类专栏

java 1篇
Mysql 1篇
每天学点算法 2篇
Tensorflow 4篇
强化学习 3篇
python 11篇
linux 1篇
爬虫 1篇
人工智能 14篇
神经网络 7篇
机器学习 19篇
android 1篇
recyclerview 2篇
listview 2篇
算法 7篇
数据结构 5篇

最新评论

每天学点算法->强化学习->Q_learning走迷宫
ℳjokerい: 作者大大你好，就是环境那块红色方块怎么移动不太明白 def step(self, action): s = self.canvas.coords(self.rect) base_action = np.array([0, 0]) if action == 0: # up if s[1] > UNIT: base_action[1] -= UNIT elif action == 1: # down if s[1] < (MAZE_H - 1) * UNIT: base_action[1] += UNIT elif action == 2: # right if s[0] < (MAZE_W - 1) * UNIT: base_action[0] += UNIT elif action == 3: # left if s[0] > UNIT: base_action[0] -= UNIT self.canvas.move(self.rect, base_action[0], base_action[1]) # move agent 能稍微讲解一下它的意思吗，例如action==0，s[1]>UNIT,base_action[1]-=UNIT 麻烦作者大大指点一下，不太明白它这个具体怎么动的
svc实战fashion-mnist图像分类
秋雨寂庭: 感谢博主~~
每天学点算法->强化学习->Q_learning走迷宫
DoPamine...: 为什么我无法运行呢，maze_env库那里出现了问题
每天学点算法->强化学习->Q_learning走迷宫
MaxxJ1e 回复 Fitz_p: 我知道，我换个问法吧。怎么将tkinter里的坐标[a,b,c,d]对应成我们可以理解的(x,y)坐标形式呢？
每天学点算法->强化学习->Q_learning走迷宫
Fitz_p 回复 MaxxJ1e: S_是坐标，环境里搜这行代码：s_ = self.canvas.coords(self.rect)

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。