- 博客(9)
- 收藏
- 关注
原创 机器学习—主成分分析(PCA)
PCA(Principal Component Analysis)是一种常用的数据降维和特征提取方法。它通过线性变换将原始数据转换为一组互相正交的新变量,这些新变量称为主成分,其中第一个主成分尽可能地保留原始数据的信息,而后续的主成分依次保留剩余的信息。这样可以将高维数据降维到较低维度,并且在降维的同时保留尽可能多的原始信息。PCA的主要思想是通过找到数据中的主要方向或者说主成分,来减少数据的维度。通过计算特征值和特征向量,可以找到数据中的主成分,从而实现数据的降维。
2024-06-17 14:46:59 1226
原创 机器学习—支持向量机(SVM)
支持向量机(support vector machine,SVM)是一种用于分类和回归分析的监督学习算法。它通过寻找最优分类超平面对样本进行分类,并且在线性不可分的情况下,通过使用非线性映射将低维度输入空间的样本映射到高维度空间,从而寻找最优分类超平面。主要适用于中小型数据样本、非线性、高维的分类问题,具有较为完善数学理论基础和优越的预测效果。SVM是一种二分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。
2024-06-11 15:06:22 1954
原创 机器学习—逻辑(logistic)回归
逻辑回归使用Sigmoid函数将输入的线性组合映射到 [0, 1] 区间,输出概率值表征样本属于某类的可能性。逻辑回归模型的参数可通过最大似然估计或梯度下降等方法进行优化。常用于解决二分类问题,也可扩展至多分类问题。
2024-05-28 16:57:21 700
原创 机器学习—朴素贝叶斯
朴素贝叶斯分类是一种基于贝叶斯定理和特征条件独立假设的分类算法。其基本原理是根据训练数据集中各个特征的条件概率来预测新数据点的类别。在给定特征值的情况下,朴素贝叶斯分类器会计算数据点属于每个类别的概率,然后选择具有最大概的类别作为预测结果。算法简单,实现容易,计算速度快。对小规模数据表现良好适用于多分类问题。在某些情况下,朴素贝叶斯的表现可以和更复杂的分类算法相媲美。4 对缺失数据不敏感,能够处理不完整数据。朴素贝叶斯分类器假所有特征之间互独立,这在现实数据中符合实际情况可能会影响分类效果。
2024-05-14 13:37:45 1714 1
原创 机器学习-决策树
决策树(Decision Tree)是一种决策分析方法,它基于已知的各种情况发生概率来构建,旨在求取净现值的期望值大于等于零的概率,进而评价项目风险并判断其可行性。这种方法以图形的方式直观运用概率分析,由于决策分支的图形表现类似于树的枝干,因此得名决策树。在机器学习中,决策树是一个预测模型,它代表对象属性与对象值之间的一种映射关系。决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点则代表一种类别。在分类问题中,决策树是一种常用的分类方法,它属于监督学习范畴。
2024-04-30 15:43:14 2054 3
原创 机器学习-K近邻(KNN)算法
然后,通过计算待预测样本与训练集中各个样本的特征距离,选择与待预测样本最相似的K个训练样本(即K个最近邻),并根据这K个并据这K个最近邻样本的分类标签来对待预测样本进行分类或回归预测。K近邻算法最直观的解释为:给定一个训练集,对于测试集的一个实例来说,在训练集中找出与该实例距离最近的K个训练集中的实例,这K个训练集中的实例的多数属于哪个类,则测试集中的实例就属于哪个类。(2)如果选择的K值较大,就相当于运用较大邻域的训练集实例进行预测,相应的分类误差会增大,模型简单,导致模型欠拟合。2.K-近邻算法流程。
2024-04-02 17:15:37 370 1
原创 vscode安装及环境配置
Visual Studio Code是Microsoft在2015年4月30日Build开发者大会上正式宣布一个运行于 Mac OS X、Windows和 Linux 之上的,针对于编写现代Web和云应用的跨平台源代码编辑器。它具有对JavaScript,TypeScript和Node.js的内置支持,并具有丰富的其他语言(例如C++,C#,Java,Python,PHP,Go)和运行时(例如.NET和Unity)扩展的生态系统。
2024-03-19 01:10:20 524 1
原创 Anaconda的安装及环境配置
Anaconda就是可以便捷获取包且对包能够进行管理,包括了python和很多常见的软件库和一个包管理器conda。常见的科学计算类的库都包含在里面了,使得安装比常规python安装要容易,同时对环境可以统一管理的发行版本。Anaconda,是一个开源的Anaconda是专注于数据分析的Python发行版本,包含了conda、Python等190多个科学包及其依赖项。
2024-03-19 01:02:36 507 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人