自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 分类器的性能测试。

第二行表示所有“5”(正类)的图片中:1891张被错误地分为“非5”类别(假负类:错误的猜成负嘞),3530张被正确地分在了“5”这一类别(真正类)这意味着对于每个实例都可以得到一个干净的预测(“干净”的意思是模型预测时使用的数据在其训练期间从未见过)。当它说一张图片是5时,只有72.9%的概率是准确的,并且也只有75.6%的数字5被它检测出来了。这不一定能一直符合你的期望:在某些情况下,你更关心的是精度,而另一些情况下,你可能真正关心的是召回率。正类预测的准确率是一个有意思的指标,它也称为分类器的。

2024-08-31 23:32:39 671

原创 训练二元分类器

一个好的初始选择是随机梯度下降(SGD)分类器,使用Scikit_Learn 的SGDClassifier类即可。这个分类器的优势是能够有效处理非常大型的数据集。这部分是因为SGD独立处理训练实例,一次一个(这也使得SGD非常适合在线学习),稍后我们将会看到。现在先简化问题,只尝试识别一个数字,比如数字5。那么这个“数字5检测器”就是一个二元分类器的示例,它只能区分两个类别:5和非5。由于X数组里面的数据本身就无规律,因此不需要随机取样。将y中的值转变为[0,255]区间的整数。创建测试集和训练集。

2024-08-31 23:09:51 170

原创 MNIST读取图片

这是一组由美国高中生和人口调查局员工手写的70 000个数字的图片。每张图片都用其代表的数字标记。这个数据集被广为使用,因此也被称作是机器学习领域的“Hello。World”:但凡有人想到了一个新的分类算法,都会想看看在MNIST上的执行结果。因此只要是学习机器学习的人,早晚都要面对MNIST。data键,包含一个数组,每个实例为一行,每个特征为一列。target键,包含一个带有标记的数组。DESCR键,描述数据集。y表示X数据的数字标签。调用显示单个图片的函数。需要明白的是 此处的。

2024-08-28 11:23:54 298

原创 LinearRegression

这段代码首先创建了一个名为datapath的路径对象,该路径指向一个名为"datasets"的文件夹,其中包含一个名为"lifesat"的子文件夹。如果你想要得到一个Series(一维数组),你应该使用单重方括号,但在这里为了保持结果的一致性(即得到一个二维数组,即使它只有一列),使用了双重方括号。这一步被称为模型选择:你选择了一个生活满意度的线性模型,只有一个属性,即人均GDP。函数,将原来的数据框进行更改,在本代码中,改变了行索引和列索引及其值,对于研究更为方便,同时省去了不必要的数据,只留下了。

2024-08-01 16:38:39 998

原创 级数的敛散性

级数、部分和、收敛级数和发散级数

2024-06-25 13:37:30 894

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除