自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 河南大学-机器学习-监督学习综合实验

1. 基于泰坦尼克号数据集,构建一个可以根据乘客个人信息,如性别、年龄、船舱等级等来推测乘客是否生存的分类模型。(3)test.csv文件中没有标签列,可以只使用训练数据集文件train.csv进行。(4)将数据集test.csv的预测结果上传到kaggle平台进行检验的请在WORD文。(2)使用Scikit-learn提供的GridSearchCV函数进行参数寻优;(1)在学习过的分类算法中至少选择3种分别进行模型的选择、训练和预测;训练集和测试集的划分、训练、测试与评价;档中说明并截图,会有额外加分。

2024-05-22 14:47:19 356 3

原创 河南大学-机器学习-pca-8

3、对两个模型分别进行10次10折交叉验证,绘制评分对比曲线。2.编程实现PCA算法,并进行手写字体识别。2、比较两个模型(64维和10维)的准确率;1、实现手写数字数据集的降维;1. 自己动手实现PCA算法。

2024-05-01 18:22:39 414 3

原创 河南大学-机器学习-SVM-实验报告6

1.使用sklearn的SVM算法对样本数据进行分类,要求:(1)使用sklearn生成随机分布的400个样本点;(2)对样本点进行显示;(3)使用线性SVM进行二分类;(4)评价模型并画出分类边界2.使用sklearn中SVM算法对葡萄酒数据集进行分类,要求:(1)对数据集进行分割,20%用于测试;(2)对核函数进行选择(linear、poly、rbf、sigmod),比较不同核函数的分类精度。

2024-04-14 23:57:22 516 3

原创 河南大学-机器学习-朴素贝叶斯分类

2.编程实现朴素贝叶斯算法算法,并实现分类任务。(2)对测试集的预测类别标签和真实标签进行对比。(1)划分训练集和测试集(测试集占20%)(1)划分训练集和测试集(测试集占20%)1.使用sklearn的朴素贝叶斯算法对。2.动手编写朴素贝叶斯分类算法对。(2)对手写字体进行二值化处理。(3)输出分类的准确率。(3)输出分类的准确率。

2024-04-05 10:52:06 366 2

原创 河南大学-机器学习-实验4-决策树算法实践

3. 利用自己编写的ID3算法,画出(2)中训练集的决策树。并预测样本x=[Rain,Hot,High,Weak]的结果,即是否去打球。2.使用sklearn的决策树算法对下列数据集进行分类,并预测样本x=[Rain,Hot,High,Weak]的结果,即是否去打球。(4)调整参数比较不同算法(ID3, CART)的分类效果。2.编程实现ID3算法,并实现葡萄酒分类。(2)对测试集的预测类别标签和真实标签进行对比。(1)划分训练集和测试集(测试集占20%)(3)输出分类的准确率。

2024-03-26 10:31:03 399

原创 河南大学-机器学习-实验三KNN 算法实践

求解:testData={"老友记": [29, 10, 2, "?2.编程实现KNN算法,并应用与具体案例。

2024-03-25 22:52:00 279

原创 河南大学-机器学习-实验2线性回归

使用sklearn中逻辑回归函数对这5000样本分类,预测其分类准确率?给出代码与运行结果图。自己动手编写逻辑回归函数对手写字体数据集data_digits进行多分类。使用自编逻辑回归函数对这5000样本分类,预测其分类准确率?给出代码与运行结果图。

2024-03-25 22:48:06 259

原创 win11使用idea连接linux虚拟机中Hadoop伪分布式配置教程

1.已在虚拟机上装了Hadoop全分布式集群2.IDEA ultimate 2023.3.5的下载:因为要使用big data tools插件(idea的社区版不可以使用)

2024-03-21 17:54:17 2149 6

机器学习-实验报告1.docx

河南大学-机器学习-实验报告1.docx 1. 使用sklearn中线性回归函数,对给定数据data.txt线性拟合, 给定训练样本格式如下: 2104,3,399900 1600,3,329900 2400,3,369000 1416,2,232000 … … 其中前两列是数据特征,最后一列是标签。 提示:(1)特征正规化处理;(2)使用data =np.loadtxt("data.txt", delimiter=",", dtype=np.float64)加载数据。 求解:给定样本特征[1650,3],预测结果是多少?给出代码与运行结果图。 2. 使用最小二乘法对给定数据data.txt线性拟合: 给定训练样本格式如下: 2104,3,399900 1600,3,329900 2400,3,369000 1416,2,232000 … … 其中前两列是数据特征,最后一列是标签。 求解:给定样本特征[1650,3],预测结果是多少?给出代码与运行结果图。 提示:同上。 3. 参考给定程序,使用线性回归对给定数据data.t

2024-03-25

-KNN-实验报告.docx

河南大学机器学习-KNN-实验报告.docx 1. 掌握KNN算法原理; 2. 编程实现KNN算法,并应用与具体案例 1. 使用KNN进行电影类型预测: 给定训练样本集合如下: 求解:testData={"老友记": [29, 10, 2, "?片"]}。

2024-03-25

逻辑回归-实验报告2.docx

河南大学机器学习逻辑回归-实验报告2.docx 1. 使用sklearn中逻辑回归函数,对给定手写字体数据集data_digits进行多分类,data_digits中数据格式为5000 x 400矩阵,其中每一行为一幅20x20手写字体图片。 求解:使用sklearn中逻辑回归函数对这5000样本分类,预测其分类准确率?给出代码与运行结果图。 2. 自己动手编写逻辑回归函数对手写字体数据集data_digits进行多分类。 交叉熵损失函数公式如下: 其对应梯度公式如下: 求解:使用自编逻辑回归函数对这5000样本分类,预测其分类准确率?给出代码与运行结果图。

2024-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除