自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 主成分分析(PCA):降维和数据可视化的利器

主成分分析(PCA)是一种强大的数据分析工具,可以用于降维、数据可视化、噪音过滤和特征选择等应用。通过理解PCA的原理和流程,可以更好地利用这一方法来处理和分析数据集。希望本文对读者能够提供有关PCA的详尽解释,并激发进一步的学习和应用。

2024-01-01 19:09:34 723

原创 机器学习:支持向量机入门

支持向量机(Support Vector Machine, SVM)是一种常用的监督学习算法,常用于分类和回归问题。它基于统计学习理论中的结构风险最小化原则,通过在特征空间中找到一个最优的超平面来实现分类任务。在本文中,我将介绍如何使用Python中的scikit-learn库实现一个简单的支持向量机模型,并使用随机生成的数据进行训练和可视化。

2023-12-18 16:13:12 379 1

原创 logistic回归入门

这个函数可以根据指定的参数生成具有不同特征和标签的数据集,用于模型的训练和评估。:输出了训练得到的参数向量,这些参数用于计算逻辑函数,从而进行预测。同时,选择了测试集中的第一个样本进行预测,输出了模型对该样本的预测概率和预测类别。:输出了训练得到的参数向量,这些参数用于计算逻辑函数,从而进行预测。为了寻找最佳的参数向量θ,逻辑回归使用了最大似然估计的方法。:选择了测试集中的第一个样本,输出了模型对该样本的预测概率和预测类别。其中,hθ(x)表示预测值,x是输入样本的特征向量,θ是待求的参数向量。

2023-12-04 21:26:27 401 1

原创 理解朴素贝叶斯分类算法及其应用

朴素贝叶斯算法是一种概率统计分类算法,它基于贝叶斯定理,通过计算后验概率来进行分类。贝叶斯分类算法是一种基于概率模型的分类方法,通过计算后验概率来确定样本所属的类别。导言: 朴素贝叶斯分类算法是一种常用的机器学习算法,它基于贝叶斯定理和特征条件独立性假设,被广泛应用于文本分类、垃圾邮件过滤、情感分析等领域。预测分类:对于一个新的样本,使用贝叶斯定理计算后验概率,并选择具有最高后验概率的类别作为预测结果。收集数据集:首先,需要收集一个带有标签的数据集,其中包含了待分类的样本和对应的类别。

2023-11-20 21:29:10 84 1

原创 了解机器学习决策树:从原理到应用

决策树的原理: 决策树是一种树形结构,其中每个内部节点表示一个特征或属性,每个叶子节点表示一个类别或值。决策树的构建过程是一个递归分割的过程,通过选择最佳的特征对数据进行划分,使得每个子节点中的数据具有更高的纯度或信息增益。下面让我们来看看决策树的基本原理。导语:机器学习决策树是一种常见且强大的监督学习算法,它能够通过构建树形结构来进行分类和回归任务。机器学习决策树是一种强大的算法,具有广泛的应用领域。了解决策树的原理和优缺点,以及决策树的改进和扩展方法,对于在实际问题中使用决策树算法具有重要意义。

2023-11-06 16:45:11 146

原创 关于P-R曲线和Roc曲线的那些事

P-R曲线和ROC曲线是评价二元分类模型性能的重要指标,其中P-R曲线描述准确率和召回率之间的关系,而ROC曲线描述真正例率和假正例率之间的关系。通过模型预测得到每个样本属于正例的概率分数,然后根据不同的阈值将样本分类为正例和负例,最后连接这些点,得到P-R曲线和ROC曲线,从而比较不同模型的性能;在ROC曲线中,红色的点表示的是模型设置的最佳阈值对应的真正例率和假正例率。然后,我们可以根据不同的阈值计算出不同的真正例率和假正例率,并在坐标系中描绘出这些点,最后连接成曲线。

2023-10-23 17:21:01 188

原创 KNN算法入门

在实际应用中,为了提高算法的性能,可以进行一些优化,如采用KD树或球树等数据结构来加快最近邻搜索的速度,或对特征进行归一化或标准化处理以消除不同特征之间的尺度差异。K最近邻算法是一种简单易懂的监督学习算法,它的基本思想是根据一个新样本在特征空间中的距离选择K个最近邻样本,然后通过这K个邻居样本的标签或数值进行投票或加权平均来确定该样本的类别或数值。它的基本思想是:根据一个新样本在特征空间中的距离选择K个最近邻样本,然后通过这K个邻居样本的标签或数值进行投票或加权平均来确定该样本的类别或数值。

2023-10-09 17:12:10 69 1

原创 Python:从入门到安装

现在你已经完成了Python的安装和IDE的配置,可以开始编写Python程序了。在开始编写Python代码之前,首先需要在你的计算机上进行Python的安装。要安装Python,首先需要访问Python官方网站(https://www.python.org/)下载最新版本的Python安装包。在安装过程中,可以按照默认设置进行安装,也可以根据自己的需求进行自定义安装。Python是一个功能强大且易于学习的编程语言,通过本篇博客的指南,你已经了解了如何安装Python并开始编写Python程序。

2023-09-25 21:47:27 30 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除