![](https://img-blog.csdnimg.cn/4778dc5d336a467cb34cfb66c673121e.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
人工智能
文章平均质量分 86
机器学习、强化学习、集成学习等。
Lingxw_w
目前CS研究生在读,研究方向网络科学。个人主页:https://lingxianwen.github.io
展开
-
快速入门Pytorch基本语法
Pytorch是一个基于Numpy的科学计算包, 向它的使用者提供了两大功能.作为Numpy的替代者, 向用户提供使用GPU强大功能的能力.做为一款深度学习的平台, 向用户提供最大的灵活性和速度.原创 2024-08-05 16:42:35 · 482 阅读 · 0 评论 -
【强化学习】——Q-learning算法为例入门Pytorch强化学习
强化学习(Reinforcement Learning,RL)是一种机器学习方法,其目标是通过智能体(Agent)与环境的交互学习最优行为策略,以使得智能体能够在给定环境中获得最大的累积奖励。原创 2023-06-22 09:41:04 · 3632 阅读 · 83 评论 -
【机器学习面试总结】————(三)
在机器学习中,训练误差和测试误差是评估模型性能的两个重要指标。它们分别反映了模型在训练集和测试集上的表现。训练误差(Training Error)是指模型在训练集上的误差,即模型预测的结果与训练集真实标签的差异。训练误差的大小通常反映了模型在拟合训练集上的能力。如果模型在训练集上表现很好,但在测试集上表现很差,就可能出现过拟合的情况,即模型在训练集上过度拟合,无法泛化到新数据。测试误差(Test Error)是指模型在测试集上的误差,即模型预测的结果与测试集真实标签的差异。原创 2023-04-02 18:50:37 · 1735 阅读 · 0 评论 -
【机器学习面试总结】————(二)
泛化能力:机器学习的目标是使学得的模型能够很好的适用于新的样本,而不是仅仅在训练样本上工作的很好。学得的模型对新样本(即新鲜数据)的适应能力称为泛化能力。误差:学习到的模型在样本上的预测结果与样本的真实结果之间的差。训练误差:模型在训练集上的误差。泛化误差(测试误差):在新样本上的误差。显然,我们更希望得到泛化误差小的模型。欠拟合:学得的模型训练误差很大的现象。过拟合:学得的模型的训练误差很小,但泛化误差大(泛化能力较弱)的现象。解决过拟合。原创 2023-04-02 16:17:41 · 1118 阅读 · 0 评论 -
【机器学习面试总结】————(一)
特征工程,顾名思义,是对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。 从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。原创 2023-03-24 20:31:36 · 1639 阅读 · 45 评论 -
【机器学习】——模型调参、超参数优化、网络架构搜索
AutoML在模型选择这一块做的比较好超参数的优化(HPO)【比较通用】:通过搜索的方法,找到一个集合去调整模型的超参数NAS(Neural architecture search)【专注于神经网络】:可以构造一个比较好的神经网络模型,使得能够拟合我们的任务每个年代都有最大的技术痛点,当前AutoML可能是技术瓶颈。原创 2023-01-14 10:45:36 · 2640 阅读 · 40 评论 -
【机器学习】——方差和偏差、Bagging、Boosting、Stacking
在统计学习中,我们可以把泛化误差分解为 偏差、误差和噪声三项;集成学习能够将多个模型组合起来来降低偏差和。原创 2023-01-12 23:50:18 · 2178 阅读 · 29 评论 -
【机器学习】——模型评估、过拟合和欠拟合、模型验证
对于机器学习来讲,我们更关心是在新数据中模型对其的预测情况是否正确(对新数据是否有泛化能力);本节讲的是,对于一个算法如果只是在这个数据中训练的比较好的话,不代表在新的数据上效果比较好,所以将会介绍怎么样去 衡量模型的好坏值得注意的是,本节是 给定了数据与超参数并且已经训练好了模型,然后再来判断模型的好坏原创 2023-01-10 10:07:56 · 3337 阅读 · 53 评论 -
【机器学习】——多层感知机、卷积神经网络、循环神经网络
MLP(多层感知机):就是将多个全连接层堆起来,然后通过激活层来得到非线性的模型CNN(卷积神经网络):可以看作是比较特殊的全连接层,其中的卷积层使用了空间上的本地性和平移不变性然后做了一个简化版的全连接层,参数少,更适合处理图片信息;将卷积层和汇聚层(池化层)堆叠起来可以得到一种高效抓取空间信息的模型RNN(循环神经网络):可以看作是全连接层在时序上用了过去的信息,放在了现在,在全连接层加了一条额外的边,得到一个循环神经网络,能够作用于有时序信息的数据。原创 2023-01-07 11:10:28 · 2524 阅读 · 23 评论 -
机器学习--决策树、线性模型、随机梯度下降
SGD算法是从样本中随机抽出一组,训练后按梯度更新一次,然后再抽取一组,再更新一次,在样本量及其大的情况下,可能不用训练完所有的样本就可以获得一个损失值在可接受范围之内的模型了。用决策树分类:从根节点开始,对实例的某一特征进行测试,根据测试结果将实例分配到其子节点,此时每个子节点对应着该特征的一个取值,如此递归的对实例进行测试并分配,直到到达叶节点,最后将实例分到叶节点的类中。的求解方法,虽然线性模型有很多的方法来求解,但是小批量随机梯度下降可以解决出决策树以外的模型。关心的是数据对应类别的置信度。原创 2023-01-05 10:22:34 · 2118 阅读 · 66 评论 -
【机器学习】——数据清理、数据变换、特征工程
看看数据长什么样子,找其他的规则,从数据中提起有弱噪音的标号,也是可以用来训练模型的】没有的话就去收集数据【发掘在哪里找数据;生成自己需要的数据;3、数据预处理:看看数据长什么样子;通常来说数据是有很多噪音的,要对数据清洗;将数据变成我们需要的格式;数据质量:数据的多样性:产品所关心的方方面面都要考虑;因为机器学习的算法比较喜欢定义的比较好的、它能比较好的去处理的、固定长度的输入输出。大数据的管理是一件很难的事情:存储;需要做数据的清理,将错误的信息纠正过来;对数据的特征进行提取。数据的质与量要做权衡;原创 2023-01-02 00:03:26 · 1801 阅读 · 75 评论 -
【机器学习】——房屋销售的探索性数据分析
本笔记本演示了EDA的基本技术,包括理解列数据类型、值和分布理解列之间的相互作用参考代码eda slides。原创 2022-12-31 16:55:48 · 738 阅读 · 28 评论 -
简述有监督学习、半监督学习、无监督学习、弱监督学习
有监督学习、半监督学习、无监督学习、弱监督学习原创 2022-06-21 15:37:41 · 2873 阅读 · 0 评论 -
简述k-means算法基本原理,并针对如何自适应确定k值
k-means算法基本原理:(1) 随机选取k个中心点;(2) 在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类;(3) 更新中心点为每类的均值;(4) j原创 2022-06-21 15:35:48 · 1653 阅读 · 0 评论 -
超简单的人脸识别(python3.9+openCV)
导入CV包。添加 haarcascade_frontalface_default.xml。遇到的问题:pycharm 语法出现了cannot find reference '__init__.py'解决办法cv2里面的 cv2.cp38-win_amd64.pyd 放到 site-packages里解决了。报错原因是因为文件路径的格式表达不对,需要用"//"进行分开。识别。 完成识别。...原创 2022-06-21 15:31:42 · 1976 阅读 · 7 评论 -
机器学习:正则化
当将我们的算法应用到某些特定的机器学习应用时,会遇到过拟合(over-fitting)的问题,可能会导致它们效果很差。这样就可以正则化的知识来解答,正则化就是改善或者减少过度拟合问题的方法。几乎拟合每个训练样本,在训练样本中虽然准确率很高,但模型泛化能力差,往往在测试集上预测准确率较低。那么怎么解决这种问题?通过正则化(regularization)提高模型的泛化能力,减少过拟合现象。......原创 2022-06-17 14:43:05 · 503 阅读 · 0 评论 -
机器学习:(PCA)主成分分析法及应用(spss)
目录1.1、主成分分析法简介1.2、主成分分析法的意义1.3、主成分分析法的思想1.4、主成分分析法的步骤2.1、导入数据2.2、生成图表3.1、PCA算法梯度求解3.1.1. 梯度上升&梯度下降3.1.2求梯度3.2求解第一主成分代码实现3.2.1 数据准备3.2.2. 函数实现3.2.3. 结果可视化3.3求前n个主成分......原创 2022-06-16 14:23:28 · 13714 阅读 · 0 评论 -
机器学习:K-means算法基本原理及其变种
一、K-means原理美1967年,James MacQueen在他的论文《用于多变量观测分类和分析的一些方法》中首次提出 “K-means”这一术语。1957年,贝尔实验室也将标准算法用于脉冲编码调制技术。1965年,E.W. Forgy发表了本质上相同的算法——Lloyd-Forgy算法,所以这一算法有时也被称为Lloyd-Forgy算法。更高效的版本则被Hartigan and Wong提出。K-means聚类算法被提出来后,在不同的学科领域被广泛研究和应用,并发展出大量不同的改进算法。.......原创 2022-06-16 14:09:03 · 4712 阅读 · 0 评论 -
机器学习:丰田卡罗拉价格回归分析案例
使用丰田卡罗拉数据集构建了4个回归模型。这些是线性回归、多项式回归、岭回归、套索回归,然后衡量并可视化模型的性能。借鉴黄海广老师的课件资料。1. 概述数据列:Age: 车龄KM: 累计里程FuelType: 燃油类型 (Petrol, Diesel, CNG)HP: 功率MetColor: 是否金属漆 (Yes=1, No=0)Automatic: 是否自动挡( (Yes=1, No=0)CC: 排量Doors: 车门数量Weight: 整车重量Price: 售价(欧元)2、导入库原创 2022-02-17 20:34:24 · 2612 阅读 · 0 评论