![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 50
平行世界里的我
这个作者很懒,什么都没留下…
展开
-
机器学习项目实战——21SVM算法之人脸识别
现在关于人脸识别的项目一般采用深度学习方法,很少使用SVM的了整体代码:import matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn.datasets import fetch_lfw_peoplefrom sklearn.model_selection import GridSearchCVfrom sklearn.metrics import clas原创 2022-05-04 16:39:26 · 1195 阅读 · 0 评论 -
机器学习项目实战——20SVM算法之非线性分类
非线性用核函数# C和gamma# 'linear', 'poly', 'rbf', 'sigmoid'整体代码:import matplotlib.pyplot as pltimport numpy as npfrom sklearn.metrics import classification_reportfrom sklearn import svm# 载入数据data = np.genfromtxt("LR-testSet2.txt", delimiter=",")..原创 2022-05-04 16:18:01 · 344 阅读 · 0 评论 -
机器学习项目实战——19SVM算法之线性分类
整体代码:import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svm# 创建40个点x_data = np.r_[np.random.randn(20, 2) - [2, 2], np.random.randn(20, 2) + [2, 2]]y_data = [0]*20 +[1]*20plt.scatter(x_data[:,0],x_data[:,1],c=y_data)plt.show(..原创 2022-05-04 16:03:02 · 152 阅读 · 0 评论 -
机器学习项目实战——18PCA算法之手写数字降维预测
机器学习——09 PCA_平行世界里的我的博客-CSDN博客2.3节原创 2022-05-04 15:59:04 · 510 阅读 · 0 评论 -
机器学习项目实战——17PCA算法之手写数字降维可视化
https://blog.csdn.net/weixin_45823221/article/details/1219837312.2节原创 2022-05-04 15:57:44 · 715 阅读 · 0 评论 -
机器学习项目实战——16Kmeans算法之广告效果聚类分析
整体代码:import numpy as npimport pandas as pdfrom sklearn.preprocessing import MinMaxScalerfrom sklearn.cluster import KMeansimport matplotlib.pyplot as pltimport seaborn as sns# 显示中文plt.rcParams['font.family'] = ['sans-serif']plt.rcParams['...原创 2022-05-02 16:44:26 · 677 阅读 · 1 评论 -
机器学习项目实战——15Kmeans算法之NBA球队实力聚类分析
机器学习项目实战——15Kmeans算法之NBA球队实力聚类分析原创 2022-04-27 21:06:34 · 1038 阅读 · 0 评论 -
机器学习项目实战——14贝叶斯算法之拼写检查器
机器学习项目实战——14贝叶斯算法之拼写检查器原创 2022-04-27 21:05:37 · 544 阅读 · 0 评论 -
机器学习项目实战——13贝叶斯算法之新闻分类
机器学习项目实战——13贝叶斯算法之新闻分类原创 2022-04-27 21:04:58 · 909 阅读 · 0 评论 -
机器学习项目实战——12集成学习算法之乳腺癌预测
机器学习项目实战——12集成学习算法之乳腺癌预测原创 2022-04-27 21:04:20 · 1235 阅读 · 0 评论 -
机器学习项目实战——11集成学习算法之泰坦尼克号船员获救预测
机器学习项目实战——11集成学习算法之泰坦尼克号船员获救预测原创 2022-04-27 21:03:40 · 1347 阅读 · 0 评论 -
机器学习项目实战——10决策树算法之动物分类
机器学习项目实战——10决策树算法之动物分类原创 2022-04-27 21:02:43 · 2090 阅读 · 3 评论 -
机器学习项目实战——09决策树算法之叶子分类
机器学习项目实战——09决策树算法之叶子分类原创 2022-04-27 21:02:05 · 1171 阅读 · 0 评论 -
机器学习项目实战——08浅层网络之葡萄酒分类
机器学习项目实战——08浅层网络之葡萄酒分类原创 2022-04-27 21:01:05 · 486 阅读 · 0 评论 -
机器学习项目实战——07浅层网络之手写数字识别
机器学习项目实战——07浅层网络之手写数字识别原创 2022-04-27 21:00:26 · 279 阅读 · 0 评论 -
机器学习项目实战——06KNN算法之水果分类
数据集说明:一共58个数据样本因为水果的名字是字符串,对其进行编码。labelencoder = LabelEncoder()data.iloc[:,0] = labelencoder.fit_transform(data.iloc[:,0])对水果进行分类,最后预测正确值。一共有四类。对于KNN算法,K的取值是需要自己设置的,sklearn中默认是5,水果分类实验中从1到30进行了选择,选取最好的那个k值再用于预测。整体代码:from sklearn.neighb原创 2022-04-27 20:53:49 · 2810 阅读 · 1 评论 -
机器学习项目实战——05KNN算法之鸢尾花识别
鸢尾花识别原创 2022-04-25 15:45:41 · 335 阅读 · 0 评论 -
机器学习——13浅层神经网络
单层感知机原创 2022-04-21 21:42:03 · 407 阅读 · 0 评论 -
机器学习项目实战——04逻辑回归算法之糖尿病预测项目
数据集的详细说明如下:从最后一列的输出值可以看出为0或1,属于二分类,因此可以使用逻辑回归实现。用pandas读取csv文件,前面几个都用的是np.genfromtxt文件读取。个人觉得没什么大的区别,pandas用的更多吧,常用于数据分析。数据分析基本过程:①提出问题,②理解数据需求 ,③数据清洗, ④构建模型 。⑤数据可视化;数据清洗的基本过程:①选择子集,②列名重命名,③缺失数据处理,④数据类型转换,⑤数据排序,⑥异常值处理。1. 读取数据# 读取前5行diabetes原创 2022-04-21 17:12:45 · 5285 阅读 · 4 评论 -
机器学习项目实战——03逻辑回归算法之用户流失预测
数据集采用的是真实数据集。对于数据集的说明如下:可以看出:第一列、第二列、第三列与最后的预测值无关。因此可在处理时删除这三列。x_train = np.delete(x_train,[0,1,2],axis=1)x_test = np.delete(x_test,[0,1,2],axis=1)另外,对于国家和用户性别两列是字符串形式,要转换成数字形式才能计算from sklearn.preprocessing import LabelEncoderlabelencoder1 =原创 2022-04-21 15:18:33 · 1761 阅读 · 1 评论 -
机器学习项目实战——02回归算法之葡萄酒质量与时间的关系
数据集,linear.csv - Jupyter Text Editorimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_split# 载入数据data = np.genfromtxt('linear.csv', delimiter=',')# 画原创 2022-04-19 21:36:17 · 853 阅读 · 0 评论 -
机器学习项目实战——01回归算法之波士顿房价预测
使用的数据集在sklearn库里存在。对于数据集的描述:数据每两个之间都有关系,存在多重线性关系,若用回归算法,则需采用岭回归、LASSO回归以及弹性网等。代码使用LASSO回归实现from sklearn.datasets import load_bostonimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.linear_model import LassoCV.原创 2022-04-19 21:22:21 · 1745 阅读 · 0 评论 -
机器学习——12分类模型的基础
1. 评价标准1.1正确率、召回率、F1指标正确率与召回率(Precision & Recall )是广泛应用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。一般来说,正确率就是检索出来的条目有多少是正确的,召回率就是所有正确的条目有多少被检索出来了。F1值=2*(正确率*召回率)/ (正确率+召回率)。是综合上面二个指标的评估指标,用于综合反映整体的指标。这几个指标的取值都在0-1之间,数值越接近于1,效果越好。eg1:某池塘有1400条鲤鱼,300只虾,300只鳖原创 2022-04-19 17:08:10 · 970 阅读 · 0 评论 -
机器学习——11基础
目录1. 特征缩放2. 交叉验证法3. 过拟合4. 正则化1. 特征缩放为什么要用到特征缩放?答:因为样本中特征的取值相差很大,有的是几十万,而有的值却是几。若采用梯度下降法求解的话,优化时间很长或者路径选取不对。解决方法——①数据归一化 ②均值归一化①数据归一化就是把数据的取值范围处理为0-1或者-1-1之间。②均值标准化,一般把取值范围处理为-0.5-0.5之间2. 交叉验证法数据集太小的话,分为训练集测试集,效果不好。通常把...原创 2022-04-18 16:15:24 · 423 阅读 · 0 评论 -
机器学习——10 KMeans聚类
机器学习——10 KMeans聚类原创 2021-12-16 20:50:20 · 1208 阅读 · 0 评论 -
机器学习——09 PCA
机器学习——09树回归原创 2021-12-16 20:49:41 · 1248 阅读 · 0 评论 -
机器学习——08回归
机器学习原创 2021-12-16 20:49:08 · 803 阅读 · 0 评论 -
机器学习——07集成方法(随机森林和AdaBoost)
集成方法(随机森林和AdaBoost)原创 2021-12-16 20:48:37 · 1217 阅读 · 0 评论 -
机器学习——06 SVM支持向量机
SVM支持向量机原创 2021-12-16 20:47:40 · 627 阅读 · 0 评论 -
机器学习——05 Logistic回归
逻辑回归原创 2021-12-16 20:46:47 · 1090 阅读 · 0 评论 -
机器学习——04朴素贝叶斯(补充)
在朴素贝叶斯中,提到了两种估计概率的算法:一个是极大似然估计,一个是贝叶斯估计。另外,在b站的视频中,提到了模型的两种估计方法:一个是最大似然估计,一个是奥卡姆剃刀。对于这四个概念,我不是很清楚的知道什么是什么,也不太知道估计的是什么的概率?基于一些偏颇的概念,仅记录下来,供以后参考。说明:本文可能有错误!!!贝叶斯决策 首先来看贝叶斯分类,我们都知道经典的贝叶斯公式:其中:p(w):为先验概率,表示每种类别分布的概率;P(X|W):类条件概率,表示在某种类别前提下...原创 2021-12-16 11:09:58 · 1624 阅读 · 0 评论 -
机器学习——04朴素贝叶斯
机器学习的一个重要应用就是文档的自动分类。在文档分类中,整个文档(如一封电子邮件)是实例,而电子邮件中的某些元素则构成特征。我们可以观察文档中出现的词,并把每个词作为一个特征,而每个词的出现或者不出现作为该特征的值,这样得到的特征数目就会跟词汇表中的词的数目一样多。朴素贝叶斯是上面介绍的贝叶斯分类器的一个扩展,是用于文档分类的常用算法。下面我们会进行一些朴素贝叶斯分类的实践项目。...原创 2021-12-13 21:38:45 · 3283 阅读 · 0 评论 -
机器学习——03决策树
之前整理的决策树的知识原创 2021-11-27 20:21:27 · 859 阅读 · 0 评论 -
机器学习——02KNN
最简单的分类算法之一:KNN(原理解析+代码实现)机器学习之KNN最邻近分类算法KNN算法实现要自己动手实现KNN算法其实不难,主要有以下三个步骤: 算距离:给定待分类样本,计算它与已分类样本中的每个样本的距离; 找邻居:圈定与待分类样本距离最近的K个已分类样本,作为待分类样本的近邻; 做分类:根据这K个近邻中的大部分样本所属的类别来决定待分类样本该属于哪个分类;...原创 2021-11-25 21:40:50 · 227 阅读 · 0 评论 -
机器学习——01算法与模型
机器学习中的“算法”是什么?机器学习中的“算法”是在数据上运行以创建机器学习“模型”的过程。机器学习算法执行“模式识别”。算法从数据中“学习”,或者对数据集进行“拟合”。机器学习算法有很多。比如,我们有分类的算法,如 K- 近邻算法;回归的算法,如线性回归;聚类的算法,如 K- 均值算法。下面是机器学习算法的例子:线性回归、逻辑回归、决策树、人工神经网络、K- 最近邻、K- 均值你可以把机器学习算法想象成计算机科学中的任何其他算法。例如,你可能熟悉的一些其他类型的算法包括用于数据原创 2021-11-25 20:43:18 · 445 阅读 · 0 评论