机器学习和人工智能
文章平均质量分 95
Alan Hou
Alan Hou
展开
-
机器学习之PyTorch和Scikit-Learn第6章 学习模型评估和超参数调优的最佳实践Part 3
其它章节内容请见。原创 2023-07-13 08:17:27 · 274 阅读 · 0 评论 -
机器学习之PyTorch和Scikit-Learn第6章 学习模型评估和超参数调优的最佳实践Part 2
在一项对误差估计偏差的深入研究中,Sudhir Varma和Richard Simon得出结论,使用嵌套交叉验证时,预估的真实误差相较测试数据集几乎是无偏的(《使用交叉验证做模型选择时误差估计的偏差》,S. Varma和R. Simon,BMC Bioinformatics,7(1): 91,2006,本节中,我们来看两个非常简单但强大的诊断工具,可帮助我们提升学习算法的性能:学习曲线和验证曲线,在接下的小节中,我们会讨论如何使用学习曲线诊断学习算法是否有过拟合(高方差)或欠拟合(高偏置)的问题。原创 2023-07-13 08:16:56 · 196 阅读 · 0 评论 -
机器学习之PyTorch和Scikit-Learn第6章 学习模型评估和超参数调优的最佳实践Part 1
其它章节内容请见在前面的章节中,我们学习了用于分类的基本机器学习算法以及如何在喂给这些算法前处理好数据。下面该学习通过调优算法和评估模型表现来构建良好机器学习模型的最佳实践了。原创 2023-07-13 08:16:22 · 136 阅读 · 0 评论 -
机器学习之PyTorch和Scikit-Learn第5章 通过降维压缩数据Part 2
其它章节内容请见。原创 2023-07-12 08:13:09 · 502 阅读 · 1 评论 -
机器学习之PyTorch和Scikit-Learn第5章 通过降维压缩数据Part 1
我们学习了使用特征选择技术对数据集降维的不同方法。特征选择以外的另一种降维方法是特征提取。本章中我们会学习两种基本技术,可帮助我们通过将其变换为比原来更低维度的特征子空间总结出数据集中的信息内容。数据压缩是机器学习中非常重要的课题,它有助于我们存储和分析现代技术时代生产和收集的与日俱增的数据。原创 2023-07-12 08:12:20 · 144 阅读 · 1 评论 -
机器学习之PyTorch和Scikit-Learn第4章 构建优秀的训练数据集 - 数据预处理Part 1
其它章节内容请见数据质量及所包含的有用信息量是决定机器学习算法能学到多好的关键因素。因此,在将数据集喂给机器学习算法前对其进行检查和预处理绝对很重要。本章中,我们会讨论一些基本数据预处理技术,有助于我们构建很好的机器学习模型。原创 2023-07-11 18:06:30 · 263 阅读 · 1 评论 -
机器学习之PyTorch和Scikit-Learn第4章 构建优秀的训练数据集 - 数据预处理Part 2
其它章节内容请见数据质量及所包含的有用信息量是决定机器学习算法能学到多好的关键因素。因此,在将数据集喂给机器学习算法前对其进行检查和预处理绝对很重要。本章中,我们会讨论一些基本数据预处理技术,有助于我们构建很好的机器学习模型。原创 2023-07-11 18:08:07 · 223 阅读 · 1 评论 -
机器学习之PyTorch和Scikit-Learn第一章 赋予计算机学习数据的能力
前面我们讨论了机器学习的三大分类:监督学习、无监督学习和强化学习,下面来学习本书中会用到一些基本术语。下面的一小节中包含用于表示数据集各方面的常用术语,以及可实现更精准高效沟通的数学符号。机器学习是一个非常大的领域并且还跨多学科,迟早一定会遇到表示相同概念的不同术语。第二个小节中收集了在机器学习文献中最常用的术语,在阅读机器学习刊物时会当成手册查阅。原创 2023-03-31 13:50:39 · 860 阅读 · 1 评论 -
机器学习之PyTorch和Scikit-Learn第2章 为分类训练简单机器学习算法
更正式些,我们可以将人工神经元放到有两个类(0和1)的二元分类上下文。然后我们可以定义一个决策函数,接收一定输入值的线性组合x,以及权重向量w,其中z称为净输入zw1x1 +w2x2 + … +wmxm:如果我们示例中的净输入x(i)大于所定义的阈值θ,我们预测为类1,否则为类0。在感知机算法中,决策函数,是单位阶跃函数的一种变体:为简化稍后的代码实现,我们可能过几个步骤来修改这一设置。首先,将阈值θ移到等式的左边:其次,我们将偏置单元(bias unit。原创 2023-04-01 10:20:09 · 526 阅读 · 0 评论 -
机器学习之PyTorch和Scikit-Learn第3章 使用Scikit-Learn的机器学习分类器之旅Part 1
其它章节内容请见本章中,我们会学习一些学术界和工业界常用的知名强大机器学习算法。在学习各种用于分类的监督学习算法的不同时,我们还会欣赏到它们各自的优势和劣势。另外,我们会开始使用scikit-learn库,它为高效、有生产力地使用这些算法提供了用户友好且一致的接口。原创 2023-04-26 09:27:14 · 745 阅读 · 0 评论 -
机器学习之PyTorch和Scikit-Learn第3章 使用Scikit-Learn的机器学习分类器之旅Part 2
另一种强大又广泛使用的学习算法是支持向量机(SVM),可看成是对感知机的扩展。使用感知机算法,我们最小化误分类错误。但在SVM中,我们的优化目标是最大化间隔(margin)。间隔定义为分隔的超平面(决策边界)之间的距离,距离超平面最近的训练样本称为支持向量。原创 2023-04-26 09:32:03 · 794 阅读 · 0 评论