w3school上的机器学习笔记

最新推荐文章于 2024-07-23 14:36:35 发布

道奇野猫

最新推荐文章于 2024-07-23 14:36:35 发布

阅读量1.4k

点赞数

文章标签： python 机器学习

本文链接：https://blog.csdn.net/weixin_51343138/article/details/124390483

版权

均值：numpy.mean(array[])

中位数：numpy.median(array[])

众数：scipy.mode(array[])

标准差：numpy.std(array[])

方差：numpy.var(array[])

百分位数：什么是百分位数？

array[1,2,3,4,5,6,7,,8,9,10]的50分位数是5.5（（5+6）/2）

表示有小于5.5的数有50%

numpy.percentile(array,50)

如何获得大数据集？

numpy.random()创建数据集

创建一个包含 250 个介于 0 到 5 之间的随机浮点数的数组：

import numpy

x = numpy.random.uniform(0.0, 5.0, 250)

print(x)

数据分布

直方图、

matplotlib模块

为了可视化数据集，我们可以对收集的数据绘制直方图。

我们将使用 Python 模块 Matplotlib 绘制直方图：

绘制直方图：

import numpy
import matplotlib.pyplot as plt

x = numpy.random.uniform(0.0, 5.0, 250)

plt.hist(x, 5)
plt.show()

正态数据分布

numpy.random.normal(5，1，100):产生正态分布数据，5是均值，1是标准差，100是个数

散点图

import matplotlib.pyplot as plt

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

plt.scatter(x, y)
plt.show()

随机数据分布

在机器学习中，数据集可以包含成千上万甚至数百万个值。

测试算法时，您可能没有真实的数据，您可能必须使用随机生成的值。

正如我们在上一章中学到的那样，NumPy 模块可以帮助我们！

让我们创建两个数组，它们都填充有来自正态数据分布的 1000 个随机数。

第一个数组的平均值设置为 5.0，标准差为 1.0。

第二个数组的平均值设置为 10.0，标准差为 2.0：

有 1000 个点的散点图：

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

散点图解释

我们可以看到，点集中在 x 轴上的值 5 和 y 轴上的 10 周围。

我们还可以看到，在 y 轴上扩散得比在 x 轴上更大。

道奇野猫

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
w3school上的机器学习笔记

均值：numpy.mean(array[])中位数：numpy.median(array[])众数：scipy.mode(array[])标准差：numpy.std(array[])方差：numpy.var(array[])百分位数：什么是百分位数？array[1,2,3,4,5,6,7,,8,9,10]的50分位数是5.5（（5+6）/2）表示有小于5.5的数有50%numpy.percentile(array,50)如何获得大数据集？numpy.random(..
复制链接

扫一扫