Python机器学习笔记二

最新推荐文章于 2024-04-08 22:12:17 发布

糖逗

最新推荐文章于 2024-04-08 22:12:17 发布

阅读量216

点赞数

分类专栏： Python机器学习文章标签： Adaboost Python机器学习

Python机器学习专栏收录该内容

4 篇文章 2 订阅

订阅专栏

1.Sklearn中Adaboost类库概述

参考链接：http://www.cnblogs.com/pinard/p/6136914.html

2.随机数据生成

（1）numpy随机数据生成

1.rand(d0, d1, ..., dn) 生成d0xd1x...dn维的数组。数组的值在[0,1]之间 1

2.randn((d0, d1, ..., dn), 生成d0xd1x...dn维的数组。不过数组的值服从N(0,1)的标准正态分布

如果需要服从N(μ,σ2)的正态分布，只需要在randn上每个生成的值x上做变换即可

3.randint(low[, high, size])，生成随机大小为size的数据，size可以为整数、矩阵维数，张量维数。

值位于半开区间 [low, high)。

例如：np.random.randint(3, size=[2,3,4])返回维数维2x3x4的数据。取值范围为最大值为3的整数

4.random_integers(low[, high, size]),与randint类似，区别在与取值范围是闭区间[low, high]

　　 5.random_sample([size]), 返回随机的浮点数，在半开区间 [0.0, 1.0)。

如果是其他区间[a,b),可以加以转换(b - a) * random_sample([size]) + a

　　　　例如： (5-2)*np.random.random_sample(3)+2 返回[2,5)之间的3个随机数。

（2）. scikit-learn随机数据生成API介绍

和numpy比起来，可以用来生成适合特定机器学习模型的数据。常用的API有：

　　　　1) 用make_regression 生成回归模型的数据

　　　　2) 用make_hastie_10_2，make_classification或make_multilabel_classification生成分类模型数据

　　　　3) 用make_blobs生成聚类模型数据

　　　　4) 用make_gaussian_quantiles生成分组多维正态分布的数据

参考链接：http://www.cnblogs.com/pinard/p/6047802.html

3.gridsearchcv(网格搜索)

网格搜索算法是一种通过遍历给定的参数组合来优化模型表现的方法。

参考链接：https://www.deeplearn.me/1699.html

　　　

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。