![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智能/科研
文章平均质量分 58
暮色_年华
这个作者很懒,什么都没留下…
展开
-
Deep Learning’s Carbon Emissions Problem(人工智能造成碳排放问题)
本月早些时候,OpenAI宣布构建了史上最大的AI模型GPT-3,这是一项令人惊叹的技术成就,但同时也凸显出人工智能领域一个令人担忧且有害的趋势,即现代AI模型消耗巨大的能源,且这种需求正以惊人的速度增长。尽管该估计针对的是特别耗能的模型,但值得注意的是,当时进行分析时,GPT-2是可供研究的最大模型,被视作模型尺寸上限。例如,自动驾驶车辆的AI底层神经网络首先需要在前期学习驾驶,训练完成后,在车辆投入使用期间,模型会持续进行推理以实时导航环境,日复一日,只要车辆在使用就不停止。这本身并没有科学上的进步。翻译 2024-04-08 13:23:51 · 24 阅读 · 0 评论 -
【神经网络和深度学习】人工智能概述
不同的神经元属于不同的层,每一层的神经元可以接受到前一层的神经元信号,并产生信号输出到下一层。第0层叫做输入层,最后一层叫做输出层,中间的叫做隐藏层,整个网络中无反馈,信号从输入层到输出层单向传播,可用一个有用无环图表示。其方法是使用 N位 状态寄存器来对 N个状态 进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中。●测试:根据测试数据的特征,使用前面的模型预测芒果的质量。当每一层的函数连续的时候,这个复合函数就称为神经网络。不同的神经网络的区别在上面的三个方面。人工智能:机器具有人类的智能。原创 2023-05-11 09:07:20 · 91 阅读 · 0 评论 -
【机器学习西瓜书】第二章(2)机器学习的性能度量1
然后将分类阈值一次设为每个样例的预测概率,即依次将每个样例划分为正例,设前一个标记点坐标为(x,y),当前若为真正例,则对应标记点坐标为(x,y+1/m+)。给定m+个正例和m-个反例,首先把分类阈值设为最大,即把所有样例预测为反例,此时TPR和FPR均为0,在坐标(0,0)处标记一个点。以查准率为纵轴,查全率为横轴作图,可以得到查准率-查全率曲线,简称P-R曲线。相等时取0,不等时取1。宏查准率(macro-P),宏查全率(macro-R),宏F1(macro-F1)所以期望TPR越大,FPR越小越好。原创 2023-08-28 20:19:30 · 43 阅读 · 0 评论 -
【机器学习西瓜书】第二章(1):误差、过拟合和欠拟合,评估方法
然后,每次用K-1个子集的并集作为训练集,余下的子集作为测试集,可以获得k组训练/测试集,可进行k次训练和测试,最终返回的是k个测试结果的均值。自助法:给定m个样本的数据集D,对D采样产生数据集D’:每次随机从D中挑选一个样本,将其拷贝放入D’,然后再将样本放回初始数据集D中,使得该样本在下次采样时仍有可能被猜到;直接将数据集D划分为两个互斥的集合,其中一个作为训练集S,另一个作为测试集T。通过自助采样,初始数据集中大约有36.8%的样本未出现在采样数据集D’中,所以将D’作为训练集,D-D'作为测试集。原创 2023-08-28 00:08:22 · 85 阅读 · 0 评论 -
【机器学习】西瓜书第一章(2):假设空间和归纳偏好
举例理解:回归如果有不止一个函数符合训练集,那么需要挑选一个回归的函数。有的偏好选择一个简单的曲线,有的偏好选择一个复杂的曲线。机器学习算法在学习过程中对某种类型假设的偏好。任何一个有效的机器学习算法必有其归纳偏好,否则它将被假设空间等效的假设迷惑。常用原则:奥卡姆剃刀,若有多个假设与观察一致,则选最简单的那个。可以把学习过程看作一个在所有假设组成的空间中进行搜索的过程,搜索目标是找到与训练集匹配的假设。是均匀分布的,那么误差与学习算法和学习的假设无关。最基本的是布尔概念学习,使用0/1表示是/不是。原创 2023-08-27 22:43:36 · 66 阅读 · 0 评论 -
机器学习中的概率论
遍历样本空间X,假设每个样本x出现的概率为p(x),对期望的贡献是f(x),那么基于离散数据的期望可以使用一个求和符合来表示。每个样本对期望的贡献为1,给定一个假设,遍历样本空间求期望。所以先遍历假设空间,再遍历样本空间。离散数据的期望值是对所有可能取值的加权平均。其中权重是每个取值出现的概率。原创 2023-08-27 16:17:09 · 58 阅读 · 0 评论 -
【机器学习】西瓜书第一章(1):机器学习基本术语
如果每个示例由d个属性表述,则每个示例xi=(xi1;xid)是d维样本空间X中的一个向量,xi∈X,其中xij是xi在第j个属性上的取值,d为样本xi的位数。,yi)表示第i个样例,其中yi∈Y是示例xi的标记,y是所有标记的集合(涉及两个类别就是二分类,通常一个类为正类,一个类为反类。从数据中学习模型的过程,通过执行某个学习算法来完成。机器学习的目标是使得学得的模型很好地适用于新样本;将训练集中的样本分成若干个组,每组为一个簇。训练中使用的数据,每一个样本叫训练样本。泛化能力:模型适应新样本的能力。原创 2023-08-27 14:16:57 · 102 阅读 · 0 评论 -
机器学习模型:决策树笔记
决策树有过拟合的风险,理论上可以完全分得开数据(如果树足够庞大,每个叶子节点就一个数据)决策树判断顺序比较重要。可以使用信息增益、信息增益率、后剪枝:当建立完决策树后进行剪枝操作(用的不多)。预剪枝:边建立决策树边进行剪枝的操作(更实用)。原创 2024-04-04 23:08:56 · 580 阅读 · 0 评论