![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 80
姜九笙561
摆烂人生
展开
-
林轩田机器学习基石——笔记1.2 Learn to Answer Yes/No(如何进行学习)
本节课主要介绍了线性感知机模型,以及解决这类感知机分类问题的简单算法:PLA。我们详细证明了对于线性可分问题,PLA可以停下来并实现完全正确分类。对于不是线性可分的问题,可以使用PLA的修正算法Pocket Algorithm来解决。原创 2024-08-03 16:33:00 · 659 阅读 · 0 评论 -
林轩田机器学习基石——笔记1.1 The Learning Problem
这是一个很典型的机器学习的例子,我们需要根据D,通过A,在H中选择最好的h,得到g,接近目标函数f,也就是根据先验知识建立是否给用户发放信用卡的模型。我们不知道f:x->y(target function),但是通过learn algorithm进行大量data的学习,进行一些假设来得到一个g:x->y,其中g ≈ f。对于人类来说,我们通过观察来学习事物和技巧,然而,对于机器学习,我们通过从数据的经验累积和计算来获取skill。从未知规律的数据中,通过学习算法去挖掘,让最终的 g 接近 f。原创 2024-08-03 16:28:40 · 563 阅读 · 0 评论 -
[‘column‘]和[:,‘column‘]的区别
之前,关于numpy和pandas的操作一直不熟悉,对于获取数据中的行,列一直混淆。df['column']是 Pandas DataFrame 切片的常用语法,用于选择名为column的单个列。它返回一个 Pandas Series 对象。这种语法是不正确的,Pandas 不支持这种索引方式。如果试图在lociloc。原创 2024-05-25 21:31:37 · 443 阅读 · 0 评论 -
图像数据预处理——openCV
其中,y0,x0 是初始索引位置 ,y1,x1 是对角索引位置。使用cv2读取图像时,就可以选择读取彩色图像还是灰度图像。函数用于对图像进行缩放和偏移,从而实现对比度增强和亮度调整。是OpenCV中用于对图像进行线性缩放和偏移的函数。#输出图像与输入图像具有相同的大小和类型。将图像大小调整为 (256, 256)# 显示原始图像和增强后的图像。原创 2024-05-14 17:57:51 · 524 阅读 · 0 评论 -
机器学习中表格数据预处理
当数据(x)按照最小值中心化后,再按极差(最大值 - 最小值)缩放,数据移动了最小值个单位,并且会被收敛到[0,1]之间,而这个过程,就叫做数据归一化(Normalization,又称Min-Max Scaling)。如果要分训练集和测试集,则对训练集进行fit,即求 min(x) 和 max(x) ,对训练接和测试集进行transform,即二者都使用训练集的 min(x) 和 max(x) 进行归一化。这样的变化,让算法能够彻底领悟,原来三个取值是没有可计算性质的,是“有你就没有我”的不等概念。原创 2024-05-13 20:16:28 · 1001 阅读 · 1 评论 -
机器学习:葡萄酒品质预测
用下面模型复杂度和泛化误差的关系这张图来看,限制max depth,是让模型变得简单,把模型向左推,而模型整体的准确率下降了,即整体的泛化误差上升了,表明此时我们的模型处在泛化误差最低点的左边(一般来说过拟合才正常,但此时是一个欠拟合的状态)。为了方便,我将数据集中的标签重新映射为从0开始的数,然后进行模型的训练和预测。在这个阶段,我采用了多种机器学习算法,然后对不同算法模型的准确率结果进行了比较,通过交叉验证的结果来评估不同模型之间的性能和优劣,最后选用性能较好的模型进行调参处理,以求增加模型的性能。原创 2024-05-11 20:47:37 · 2730 阅读 · 3 评论