![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
漂泊的小森
我最喜欢的一句话,与大家共勉: “道阻且长,行则将至” !
展开
-
利用MNIST数据集训练神经网络模型,并可以精准识别手写数字
'''1---神经网络有单层感知器和多层感知器,多层感知器又叫MLP算法,多层神经网络算法又叫深度学习算法''''''2---在生成隐藏层之后要对结果进行非线性矫正(relu)和(tanh)双曲正切处理,都对样本特征进行简化,使神经网络可以学习复杂的非线性数据集''''''3---MLP算法中的参数:activation就是对数据进行非线性处理,有四种方法:identity(对样本不做处理),logistic(与tanh类似),tanh,relu。 alpha是用来控制正则化程度的,hi...原创 2022-05-10 14:21:35 · 1527 阅读 · 0 评论 -
利用KNN算法对鸢尾花数据集进行种类预测和模型优化
def k6():#用knn对鸢尾花数据集进行模型评估预测 #导入鸢尾花数据集 from sklearn.datasets import load_iris #导入数据集拆分器 from sklearn.model_selection import train_test_split #导入网格搜索和交叉验证器 from sklearn.model_selection import GridSearchCV #导入特征工程-数据标准化处理 fr.原创 2022-05-06 11:51:34 · 1045 阅读 · 0 评论 -
利用随机森林算法对红酒数据集进行分类预测+对下载的人口数据集进行分类预测
随机森林算法可以很好的解决决策树算法的过拟合问题def j2(): '''随机森林可以很好的解决决策树的过拟合问题''' from sklearn.ensemble import RandomForestClassifier from sklearn.datasets import load_wine from sklearn.model_selection import train_test_split wine=load_wine() #选择数据集的原创 2022-05-04 17:24:30 · 2155 阅读 · 0 评论 -
利用决策树算法对sklearn中红酒数据集进行可视化分类
'''决策树是一种在分类和回归中都广泛应用的算法,它的原理是通过对一系列问题进行if/else进行推导,最终实现决策''''''决策树最大的优势就是可以轻易的将模型可视化,而且决策树算法对每个样本的特征进行单独处理,因此不需要对数据进行转换'''def j1(): import numpy as np import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap #导入树原创 2022-05-02 20:15:20 · 2708 阅读 · 3 评论 -
用高斯贝叶斯对肿瘤数据集进行训练并建立学习曲线
'''贝努利朴素贝叶斯适合二项式分布的数据集,多项式朴素贝叶斯适合计数类型的数据集(非负,离散数值的数据集),高斯朴素贝叶斯适合任何连续型连续性数值的数据集'''def b2(): '''贝努利朴素贝叶斯适合二项式分布的数据集,多项式朴素贝叶斯适合计数类型的数据集(非负,离散数值的数据集),高斯朴素贝叶斯适合任何连续型连续性数值的数据集''' #用朴素贝叶斯数据集对肿瘤数据集进行建模,判断肿瘤数据集是良性或恶性 from sklearn.datasets import load原创 2022-05-02 15:28:00 · 408 阅读 · 0 评论 -
利用贝叶斯模型对sklearn中的手工数据集进行分析
def b1(): '''朴素贝叶斯算法是有监督学习算法,朴素贝叶斯算法分类为:贝努利朴素贝叶斯,高斯朴素贝叶斯,多项式朴素贝叶斯''' #利用贝努利朴素贝叶斯(二项分布)对手工数据进行分析 #导入数据集生成工具,make_blobs用来生成手工数据集的 from sklearn.datasets import make_blobs from sklearn.model_selection import train_test_split #生成样本量为500.原创 2022-04-30 16:48:56 · 541 阅读 · 0 评论 -
对sklearn中的糖尿病数据集进行线性回归,岭回归,套索回归模型分析和对比其模型性能
def z3(): # 导入糖尿病数据集 from sklearn.datasets import load_diabetes #打印数据集里面的Keys print(load_diabetes().keys())#dict_keys(['data', 'target', 'frame', 'DESCR', 'feature_names', 'data_filename', 'target_filename', 'data_module']) x,y=load_di.原创 2022-04-30 14:46:25 · 5943 阅读 · 0 评论 -
用K最近邻算法对sklearn.datasets中的红酒数据集进行分类
#利用K最近邻算法建模from sklearn.neighbors import KNeighborsClassifierfrom sklearn.datasets import load_winewine_datas=load_wine()#返回的是一个bunch对象,跟字典类似,不过特别之处在于键值可以被实例对象当作属性使用print('红酒数据集中有哪些键:',wine_datas.keys())print('数据集的情况:',wine_datas.data.shape)print('..原创 2022-04-29 20:38:16 · 1357 阅读 · 0 评论 -
机器学习中---sklearn对于鸢尾花如何进行数据集划分
机器学习中,我们熟知的开发流程是:获取数据------数据处理------特征工程------机器学习算法训练模型------模型评估-----应用实际#所以对于一个我们已有的数据集,不能全部用作建立模型,还要有一部分数据集用来进行我们建立的模型的训练评估,这就涉及到数据集的划分,要用到这个代码进行数据集的划分:x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,random_state=22)这串代码的具体原创 2022-04-24 15:18:38 · 4289 阅读 · 1 评论