![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 96
Chaoy6565
一只小白!
展开
-
机器学习——使用朴素贝叶斯分类器实现垃圾邮件检测(python代码+数据集)
这段代码实现了一个朴素贝叶斯分类器来对电子邮件进行分类,其中包括读取数据、文本预处理、训练分类器和预测新邮件的过程。具体来说,代码中使用 get_data 函数从指定目录 DATA_DIR 中读取数据,并将 Spam 和 Ham 的电子邮件内容分别存储在 data 和 target 列表中。在数据预处理过程中,使用 preprocess 函数对文本进行处理,包括转为小写、去除标点符号和停用词等操作。接下来实现了 NaiveBayesClassifier 类的 fit 和 predict 方法,其中 fi原创 2023-04-13 21:00:38 · 9096 阅读 · 42 评论 -
机器学习——最小二乘法拟合曲线、正则化
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合,其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。最小二乘法是解决曲线拟合问题最常用的方法。其基本思路是:令其中,φkxφ_k (x)φkx是事先选定的一组线性无关的函数,αkα_kαk是待定系数 ,拟合准则是使yiy_iyi与fx。原创 2023-04-05 15:37:30 · 3089 阅读 · 0 评论 -
机器学习——scikit-learn库学习、应用
Scikit-learn是一个支持有监督和无监督学习的开源机器学习库。它还为模型拟合、数据预处理、模型选择和评估以及许多其他实用程序提供了各种工具。Scikit-learn的功能主要被分为六大部分:分类,回归,聚类,数据降维,模型选择和数据预处理。1、分类:支持向量机(SVM),逻辑回归,随机森林,最近邻,决策树等。2、回归:支持向量回归(SVR),弹性网络(Elastic Net),最小角回归(LARS ),贝叶斯回归等3、聚类:K-均值聚类,谱聚类,均值偏移,分层聚类等。原创 2023-01-18 19:01:12 · 1086 阅读 · 0 评论