2302_79698474-CSDN博客

原创分类器的性能测试。

第二行表示所有“5”（正类）的图片中：1891张被错误地分为“非5”类别（假负类：错误的猜成负嘞），3530张被正确地分在了“5”这一类别（真正类）这意味着对于每个实例都可以得到一个干净的预测（“干净”的意思是模型预测时使用的数据在其训练期间从未见过）。当它说一张图片是5时，只有72.9%的概率是准确的，并且也只有75.6%的数字5被它检测出来了。这不一定能一直符合你的期望：在某些情况下，你更关心的是精度，而另一些情况下，你可能真正关心的是召回率。正类预测的准确率是一个有意思的指标，它也称为分类器的。

2024-08-31 23:32:39 671

原创训练二元分类器

一个好的初始选择是随机梯度下降(SGD)分类器，使用Scikit_Learn 的SGDClassifier类即可。这个分类器的优势是能够有效处理非常大型的数据集。这部分是因为SGD独立处理训练实例，一次一个（这也使得SGD非常适合在线学习），稍后我们将会看到。现在先简化问题，只尝试识别一个数字，比如数字5。那么这个“数字5检测器”就是一个二元分类器的示例，它只能区分两个类别：5和非5。由于X数组里面的数据本身就无规律，因此不需要随机取样。将y中的值转变为[0,255]区间的整数。创建测试集和训练集。

2024-08-31 23:09:51 170

原创 MNIST读取图片

这是一组由美国高中生和人口调查局员工手写的70 000个数字的图片。每张图片都用其代表的数字标记。这个数据集被广为使用，因此也被称作是机器学习领域的“Hello。World”：但凡有人想到了一个新的分类算法，都会想看看在MNIST上的执行结果。因此只要是学习机器学习的人，早晚都要面对MNIST。data键，包含一个数组，每个实例为一行，每个特征为一列。target键，包含一个带有标记的数组。DESCR键，描述数据集。y表示X数据的数字标签。调用显示单个图片的函数。需要明白的是此处的。

2024-08-28 11:23:54 298

原创 LinearRegression

这段代码首先创建了一个名为datapath的路径对象，该路径指向一个名为"datasets"的文件夹，其中包含一个名为"lifesat"的子文件夹。如果你想要得到一个Series（一维数组），你应该使用单重方括号，但在这里为了保持结果的一致性（即得到一个二维数组，即使它只有一列），使用了双重方括号。这一步被称为模型选择：你选择了一个生活满意度的线性模型，只有一个属性，即人均GDP。函数，将原来的数据框进行更改，在本代码中，改变了行索引和列索引及其值，对于研究更为方便，同时省去了不必要的数据，只留下了。

2024-08-01 16:38:39 998

原创级数的敛散性

级数、部分和、收敛级数和发散级数

2024-06-25 13:37:30 894

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 分类器的性能测试。

原创 训练二元分类器

原创 MNIST读取图片

原创 LinearRegression

原创 级数的敛散性

空空如也

空空如也

原创分类器的性能测试。

原创训练二元分类器

原创级数的敛散性