机器学习实验
文章平均质量分 81
shallen.
加油,软工人!
展开
-
机器学习实验6 肿瘤预测与分析(神经网络)
一、实验目的1.理解并掌握神经网络模型。 2.能够基于神经网络模型实现手写数字识别。 3.能够举一反三,基于神经网络模型实现肿瘤预测与分析。二、实验内容1.加载 sklearn 自带的数据集,探索数据。 2.划分训练集与测试集。 3.建立 BP 模型,训练模型。 4.进行模型预测,对真实数据和预测数据进行可视化(用 Axes3D 绘制 3d 散点图)。 5.进行模型评估,并进行预测结果指标统计(统计每一类别的预测准确率、召回率、 F1 分数)。 6.计算混淆矩阵,并用热力图显示。原创 2023-03-06 19:19:20 · 1167 阅读 · 3 评论 -
机器学习实验五 AdaBoost
实验目的1.理解并掌握集成学习中 AdaBoost 算法。2.能够基于 AdaBoost 算法实现鸢尾花分类。3.能够举一反三,基于 AdaBoost 算法实现肿瘤预测。二、实验内容1.加载 sklearn 自带的数据集,使用 DataFrame 形式探索数据。2.划分训练集和测试集,检查训练集和测试集的平均癌症发生率。 3.配置模型,训练模型,模型预测,模型评估。4.绘制准确度的折线图,x 轴为决策树的数量,y 轴为准确度。原创 2023-03-06 19:06:08 · 1160 阅读 · 0 评论 -
机器学习实验四:不同含量果汁饮料的聚类
某企业通过采集企业自身流水线生产的一种果汁饮料含量的数据集,来实现K-Means 算法。通过聚类以判断该果汁饮料在一定标准含量偏差下的生产质量状况,对该饮料进行类别判定。【数据集】该数据集共有样本 59 个,变量 2 个,包括 juice(该饮料的果汁含量偏差)、sweet(该饮料的糖分含量偏差),单位均为 mg/ml。所有特征变量都为与标准含量相比的偏差,该数据集没有目标类别标签变量。【实验要求】1.加载数据集,读取数据,探索数据。(数据集路径:data/da原创 2023-01-27 10:39:56 · 939 阅读 · 0 评论 -
机器学习实验三:顾客购买服装的分析与预测
采用决策树算法,对“双十一”期间顾客是否买服装的数据集进行分析与预测。顾客购买服装数据集:包含 review(商品评价变量)、discount(打折程度)、needed(是否必需)、shipping(是否包邮)、buy(是否购买)。【实验要求】1.读取顾客购买服装的数据集(数据集路径:data/data76088/3_buy.csv),探索数据。2.分别用 ID3 算法和 CART 算法进行决策树模型的配置、模型的训练、模型的预测、模型的评估。3.扩展内容(选做):对不同算法生成的决策树结构图进原创 2023-01-27 10:25:44 · 1211 阅读 · 0 评论 -
机器学习实验三:肿瘤预测(决策树)
机器学习实验三:肿瘤预测(决策树)基于威斯康辛乳腺癌数据集,采用决策树的方法进行肿瘤预测。【实验要求】1.加载 sklearn 自带的威斯康星乳腺癌数据集,探索数据。2.进行数据集分割。3.配置决策树模型。4.训练决策树模型。5.模型预测。6.模型评估。7.参数调优。可以根据评估结果,对模型设置或调整为更优的参数,使评估结果更准确。原创 2023-01-27 10:17:05 · 2931 阅读 · 0 评论 -
机器学习实验二:朴素贝叶斯和SVM——肿瘤分类与预测(SVM)
采用 SVM 方法,对美国威斯康星州的乳腺癌诊断数据集进行分类,实现针对乳腺癌检测的分类器,以判断一个患者的肿瘤是良性还是恶性。【实验要求】参考实现步骤:(具体实现可以不同)1.加载 data 文件夹里的数据集:威斯康星乳腺肿瘤数据集(数据集路径:data/data74924/data.csv)。2.查看样本特征和特征值,查看样本特征值的描述信息。3.进行数据清洗(如删除无用列,将诊断结果的字符标识 B、M 替换为数值 0、1 等)。4.进行特征选取(方便后续的模型训练)。用热力图呈现 fe原创 2023-01-18 10:00:56 · 2153 阅读 · 0 评论 -
机器学习实验二:朴素贝叶斯和SVM——肿瘤分类与预测(朴素贝叶斯)
实操项目 1——肿瘤分类与预测(朴素贝叶斯)实验要求采用朴素贝叶斯方法,对美国威斯康星州的乳腺癌诊断数据集进行分类,实现针对乳腺癌检测的分类器,以判断一个患者的肿瘤是良性还是恶性。1.导入 sklearn 自带的数据集:威斯康星乳腺肿瘤数据集(load_breast_cancer)。2.打印数据集键值(keys),查看数据集包含的信息。3.打印查看数据集中标注好的肿瘤分类(target_names)、肿瘤特征名称(feature_names)。4.将数据集拆分为训练集和测试集,打印原创 2023-01-07 12:48:25 · 2728 阅读 · 0 评论 -
燕山大学机器学习实验一:线性回归2——影厅观影人数预测
实操项目 1——糖尿病情预测实验要求1.读取给定文件中数据。(数据集路径:data/data72160/1_film.csv)2.绘制影厅观影人数(filmnum)与影厅面积(filmsize)的散点图。3.绘制影厅人数数据集的散点图矩阵。4.选取特征变量与相应变量,并进行数据划分。5.进行线性回归模型训练。6.根据求出的参数对测试集进行预测。7.绘制测试集相应变量实际值与预测值的比较。8.对预测结果进行评价。原创 2023-01-03 21:22:36 · 1437 阅读 · 0 评论 -
燕山大学机器学习实验一:线性回归1——糖尿病情预测
实操项目 1——糖尿病情预测实验要求一、加载糖尿病数据集 diabetes,观察数据1.载入糖尿病情数据库 diabetes,查看数据。2.切分数据,组合成 DateFrame 数据,并输出数据集前几行,观察数据。二、基于线性回归对数据集进行分析3.查看数据集信息,从数据集中抽取训练集和测试集。4.建立线性回归模型,训练数据,评估模型。三、考察每个特征值与结果之间的关联性,观察得出最相关的特征5.考察每个特征值与结果之间的关系,分别以散点图展示。思考:根据散点图结果对比,哪个特征值与结果原创 2023-01-01 16:25:43 · 4454 阅读 · 6 评论