七年油兵swpuer-CSDN博客

原创《论文写作》课程心得体会与总结

作为一名研究生，论文写作的技能是必不可少的，它不仅是完成学业的必经之路，也是提升个人能力的重要途径。通过学习《论文写作》课程，我逐渐建立了一个清晰的写作框架，更重要的是，学习过程中能够逐渐深入思考问题，思考的逻辑也越来越严谨。课程中学习了如何明确论文的主题、问题和目标，以及如何选择合适数量和可靠性的文献来支持我们的研究，并且通过反复修改和润色来提升论文的质量。这些知识和技巧能够帮助我更好地组织和表达自己的想法。摘要的目的是全面地概括论文的主要内容和研究结果，以便读者能够在短时间内了解论文的核心要点。

2023-11-02 19:49:25 692 1

原创机器学习实战之支持向量机

支持向量机（Support Vector Machine，简称SVM）是一种常见的监督学习方法，用于分类和回归分析。SVM的主要思想是找到一个最优的超平面，将不同类别的样本分隔开来。在二分类情况下，SVM试图找到一个能够将两个不同类别的样本分隔开的最优超平面。最优超平面被定义为距离两个类别最近的样本点到该超平面的距离最大化。这些最近的样本点被称为支持向量。SVM可以处理线性可分和线性不可分的数据集。

2023-07-06 15:19:40 175 1

原创机器学习实战之朴素贝叶斯

朴素贝叶斯（Naive Bayes）是一种基于贝叶斯定理的概率分类算法。它被称为"朴素"是因为该算法做出了一个简化的假设：假设所有特征之间是独立的。尽管这个假设并不符合实际情况，但在很多实际问题中，朴素贝叶斯仍然能产生可靠的结果。

2023-06-29 15:31:34 137 1

原创机器学习实战之Logistic回归

Logistic回归是一种经典的分类算法，主要用于解决二分类问题。该算法通过构建Logistic函数将输入特征映射到预测结果的概率上，从而实现分类。具体来说，Logistic函数会将输入特征线性组合后的结果通过一个sigmoid函数转换为0-1之间的概率值，其中0.5作为分类的阈值，大于0.5则为正类，小于0.5则为负类。

2023-06-26 23:17:45 118

原创机器学习实战之决策树

决策树是一种基于树形结构来进行决策的算法，它可以被用来解决分类和回归问题。决策树通过一系列的判断来对于输入的数据进行分类或者预测。它的构建过程通常会基于数据集中的各种属性和属性值来设置各种不同的分支和叶子节点。通过比对输入数据集和决策树的各种分支和叶子节点之间的差异性，决策树能够得出最终的分类或预测结果。决策树算法相对来说比较容易理解和实现，非常适合处理一些较小的数据集。但如果数据集过于庞大，建模过程就会变得非常耗时和昂贵。但决策树也比较容易出现过拟合的问题。

2023-06-15 20:15:08 66 1

原创机器学习实战之k-means聚类算法

然后，通过计算每个簇中所有样本的中心点，并将距离最近的未分配到簇（簇心）的样本重新分配簇，直到所有的样本都被分到一个簇中。model.inertia_属性计算的是每个数据样本到其所属簇中心点的距离的平方和。这个值越小，说明样本到中心点之间的距离越小，样本在簇中的相似度越高，聚类效果也就越好，反之则聚类效果较差。model.inertia_ 是K-means聚类算法中的一个属性，它代表了各数据样本到其所属簇中心点的距离之和，也被称为误差平方和（Sum of Squared Errors, SSE）。

2023-05-23 17:29:05 483 1

原创机器学习实战之线性回归

波士顿房价预测数据集是一个常用的用于回归分析的数据集，它包含了在20世纪70年代中期波士顿不同地区的房屋各种特征和对应的房价中位数。此次实验使用了5折交叉验证的方法，即将数据集分成5份，其中4份作为训练集，另外1份作为测试集，每次选择其中一份作为测试集并用剩下的4份作为训练集进行模型训练和评估。x_train, x_test, y_train, y_test = train_test_split(features[['标准化RM', '标准化PTRATIO', '标准化LSTAT']], y,

2023-05-23 16:13:09 228 1

原创机器学习实战之K近邻算法

鸢尾花数据集中一共包含3种不同的花种，即Setosa（山鸢尾）、Versicolour（杂色鸢尾）和Virginica（维吉尼亚鸢尾），每种花的记录数为50条，共计150条。这4个特征的单位都是厘米，同一花种的这4个特征值在数量级上相近。这个过程中，邻居的数量和距离度量都是可以设置的。K近邻算法是一种简单的算法，但是对于大量数据的分类，它的运算速度会比较慢。具体实现方法是计算测试数据和训练数据之间的欧氏距离，将距离最小的k个点的标签取出，统计各个标签出现的次数，最终将出现次数最多的标签作为预测结果。

2023-05-23 13:50:41 72 1

m0_64553191的博客