谷歌机器学习课程笔记

最新推荐文章于 2024-05-14 22:19:28 发布

__LeeKuanYew

最新推荐文章于 2024-05-14 22:19:28 发布

阅读量128

点赞数

1，特征缩放，有以下几大好处：

a，帮助梯度下降法更快的收敛；

b，帮助避免“nan”陷阱，如果模型中某个值为nan（即如果某个值在训练期间超出浮点数精度时），模型中其他数值也会因为这个数值导致变成nan；

c，确保某个特征的权重不那么大，不然模型可能对范围比较大的特征投入比较大的精力。

2，特征缩放的方法：

a，特征减去均值或者最小值，除以范围（即最大值减最小值）；

b，特征减去均值除以方差。

3，如何处理极端值的情况，极端值即大部分点在某个范围呢，小部分点离该范围较远，比如有一个非常长的尾巴：

a，对每个特征取对数，log（x+1）；

b，大于某个值时，将大于的值都赋值为该值，这样造成了在阈值处有一个小峰值；

c，分箱，分箱有两种方法，一种是均匀分箱，一种是通过分位数分箱，按照分位数分箱，这会确保每个箱子内的样本点数量是一样的，按照分位数分箱无需考虑离群值。

4，垃圾数据包括以下几个方面；

a，遗漏值，某个特征的值缺失；

b，重复值；

c，不良标签，有个把标签给弄错了；

d，不良特征，把特征给记录错了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

__LeeKuanYew CSDN认证博客专家 CSDN认证企业博客

码龄11年

139: 原创

4万+: 周排名

2万+: 总排名

43万+: 访问

: 等级

4479: 积分

212: 粉丝

135: 获赞

48: 评论

549: 收藏

私信

关注

热门文章

分类专栏

最新评论

关于利用talib.macd函数计算macd指标与同花顺不一致的问题
kogj: 使用fengwo模块直接解决，可以跟同花顺完全一致 pip install fengwo即可安装 fengwo模块一样使用C/C++编译而成，更适合中国人使用而且还有COST、WINNER等中国专用的指标 fengwo.MACD(CLOSE)即可调用同花顺默认参数计算DIF，DEA，MACD三个数值
大智慧、通达信winner函数python代码实现
kogj: 现有模块可以直接实现，速度很快 pip install fengwo fengwo.COST(HIGH,LOW,VOL,TurnRate,获利比例)即可获指定获利比例的价格 fengwo.WINNER(HIGH,LOW,VOL,TurnRate,CLOSE)即可获得收盘价的获利比例速度又快有准，用不着自己实现
大智慧、通达信winner函数python代码实现
2301_79636246: 你好, 有兩個問題, 1. 有无COST函數? 2. 有无可能在通达信实现没有WINNER和COST但仍可给出類似函数的答案?
python获取上一季度最后一天
维也纳之音: 取整就完事了 (today.month - 1) // 3 + 1
大智慧、通达信winner函数python代码实现
我帮你看看: 您好，新算法可以分享一下吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。