机器学习项目练习
繁华三千东流水
这个作者很懒,什么都没留下…
展开
-
python高级需要会的试题解析
试题一:用selenium完成以下操作(35分)(1)打开谷歌浏览器,并访问有道翻译http://fanyi.youdao.com/(3分)(2)在Elements窗口中定位出输入框并找到它的xpath(8分)(3)在Elements窗口中定位出“翻译”按钮并找到它的xpath(8分)(4)在输入框中输入“I love Python.”(8分)(5)模拟点击“翻译”按钮(8分)# 导...原创 2019-06-29 11:14:27 · 830 阅读 · 0 评论 -
机器学习之经典算法月度综合训练(二)
题目如下一已知某玩具厂有一组玩具零件检验数据,其中x1表示长度,x2是宽度,y标签:1表示合格零件,0表示不合格零件x1=[66.6,24.3,24.5,34.3,63.9,65.7,36.0,59.3,71.9,69.7,77.4,63.4,60.8,55.6,40.3,48.1,43.7]x2=[9.1,26.7,5.7,9.9,16.1,19.8,37.0,4.20,10.3,46.0...原创 2019-07-26 15:02:05 · 538 阅读 · 0 评论 -
机器学习之支持向量机(二)模型选择训练
题目要求1.按要求完成下面的各项需求。已知有一个苹果的数据集,保存在apple.txt文件中,t1是含糖量,t2是含水量,y标签表示苹果的好坏:1表示好,0表示不好利用支持向量机模型,完成以下要求:完成数据集的加载、初始化,洗牌,将数据集合理分割成训练集和测试集实现调用库函数进行分类分别求出训练集和测试集的准确率画出整个样本数据并画出分界线(二)评分要求1.完成数据集的加载和初始...原创 2019-07-23 11:30:40 · 2425 阅读 · 0 评论 -
机器学习pandas库(五)日考训练
题目要求【案例描述及要求】利用pandas读取HOUSE数据集,具体要求如下:1.加载数据集(20分2.使用所学知识,切片提取条件为Global_intensity大于15的数据样本。(40分)3.在上题基础上,统计Voltage的频数,并计算均值。(40分)数据准备代码如下import pandas as pd# 加载数据data = pd.read_excel(r'HOU...原创 2019-08-05 08:48:22 · 455 阅读 · 0 评论 -
机器学习之经典算法月度综合训练(三)
题目要求(一)题目要求已知某发动机工厂生产数据集,样本数量超过1万,共有10个系列不同品种的发动机。每个样本的特征数据储存engineX.txt中,样本的标签文件存储在enginey.txt中。请实现下列要求。1.数据集加载,进行0-1缩放特征, 将数据集分成训练集(75%)和测试集(25%)(4分)2.调用神经网络MLPClassifier库函数实现分类(共10分):-设置模型参数:隐...原创 2019-07-27 10:50:37 · 615 阅读 · 0 评论 -
机器学习之经典算法月度综合训练(四)
题目要求已知某一兰花品种数据集(存储在ochid.txt),每条数据包含4个特征属性和1个标签属性。标签属性分为3个类别,分别用0,1,2表示;4个特征属性分别用x1,x2,x3,x4表示。分别使用逻辑回归和支持向量机库模型实现分类。具体如下:1.完成数据集的读取、洗牌后,将数据集分割成训练集(60%)和测试集(40%)(4分)2.调用逻辑回归库函数,使用全部4个特征属性实现分类(14分)...原创 2019-07-27 10:55:20 · 595 阅读 · 0 评论 -
机器学习之神经网络(五)手写数字识别案例调库实现
题目要求某品牌运动鞋数据集有上万个样本,共有10个品种运动鞋,标记为0-9。每个样本的特征数据储存data.txt中,样本的标签文件存储在labels.txt中。请完成该数据集的分类识别。可以用自己写的神经网络函数代码,也可以调用相关神经网络库函数。库函数导入,数据集的加载,适当缩放特征;将数据集随机分成训练集和测试集;调用神经网路相关库函数,或者自己编写的神经网络函数;建立适当的神经网络模型...原创 2019-07-28 19:16:21 · 718 阅读 · 0 评论 -
机器学习之pandas库(六)使用pandas库对数据进行处理
数据样本Date;Time;Global_active_power;Global_reactive_power;Voltage;Global_intensity;Sub_metering_1;Sub_metering_2;Sub_metering_316/12/2006;17:24:00;?;0.418;234.840;18.400;0.000;1.000;17.016/12/2006;17...原创 2019-08-06 16:59:13 · 759 阅读 · 0 评论 -
机器学习之KNN(四)根据身高体重测肥胖程度例题训练
KNN算法是k-Nearest Neighbor Classification的简称,也就是k近邻分类算法。基本思路是在特征空间中查找k个最相似或者距离最近的样本,然后根据k个最相似的样本对未知样本进行分类。原创 2019-08-18 20:28:23 · 4337 阅读 · 1 评论 -
机器学习之KNN(五)以鸢尾花为例题训练
请使用sklearn内置数据集进行KNN算法分类。原创 2019-08-19 10:19:59 · 1906 阅读 · 0 评论 -
机器学习之共享单车使用量项目设计
通过对实际案例的分析与处理,练习对数据的预处理能力原创 2019-08-07 16:11:02 · 769 阅读 · 0 评论 -
关于机器学习的完整项目实战(一)
经典案例加完整的操作步骤原创 2019-08-11 08:32:11 · 3858 阅读 · 4 评论 -
机器学习之经典数据实战项目(一)
机器学习小数据集项目训练原创 2019-08-24 10:14:07 · 1261 阅读 · 3 评论 -
机器学习之决策树算法(四)考试训练
题目要求(一)题目要求1.按要求完成下面的各项需求。利用决策树实现分类问题:加载西瓜数据调用决策树分类模型,并训练模型计算出深度=2和5时的准确率数据如下0.697,0.46,10.774,0.376,10.634,0.264,10.608,0.318,10.556,0.215,10.403,0.237,10.481,0.149,10.437,0.211,10.66...原创 2019-07-26 08:26:16 · 979 阅读 · 0 评论 -
机器学习之经典算法月度综合训练(一)
题目要求一1、题目要求图像识别过程中通常需要对目标进行识别和定位,因此一条数据中往往包括了多个特征属性和标签。假设在对某目标进行识别时,特征属性用X1、X2、X3和X4表示,标签属性用0、1和2表示,请使用逻辑回归和支持向量机模型来对特征属性进行分类。具体实现过程如下:(1)完成数据集的读取、打乱后,将数据集按7:3的比例分割为训练集合测试集(6分)(2)调用神经网络库函数,使用全部4个特...原创 2019-07-25 23:17:18 · 654 阅读 · 0 评论 -
机器学习1之逻辑回归正则化二周考攻略
题目1.完成数据预处理:数据集的提取和初始化/标准化(8分)-数据集的读取(4分)-数据集的初始化/标注化(4分)2.实现Sigmoid函数,并画出该函数图像(8分)3.实现逻辑回归的代价函数,实现L2正则化逻辑回归(10分)-函数参数定义正确(2分)-代价函数公式书写正确(4分)-正则化公式书写正确(4分)4.实现梯度下降函数, 要求迭代15000次,输出每迭代100次的代价函...原创 2019-07-14 14:09:07 · 568 阅读 · 1 评论 -
机器学习之逻辑回归(三)周考实战解析
题目1.按要求完成下面的各项需求。一个蘑菇培育的逻辑回归样本训练集(mushroomTrain.txt文件)和测试集(mushroomTest.txt文件),数据集格式如下:X1 X2 X3 Y0.272158 0.107327 0.122255 00.286007 0.104314 0.124557 00.299921 0.098497 0.126343 0请通过Python用逻辑...原创 2019-07-15 11:01:06 · 730 阅读 · 0 评论 -
机器学习之简单线性回归算法(一)Python代码实现
实现单变量简单线性回归# 导入科学计算工具import numpy as np# 导入画图工具from matplotlib import pyplot as plt# 训练函数def fitSLR(X,Y): X_avg = np.mean(X) Y_avg = np.mean(Y) n = len(X) # 定义分子和分母 fen_zi ...原创 2019-07-06 11:30:07 · 2601 阅读 · 1 评论 -
机器学习之神经网络(二)考试训练
题目描述已知有一个水蜜桃的数据集,保存在smt.txt文件中,t1是含糖量,t2是含水量,y标签表示水蜜桃的好坏:1表示好,0表示不好利用神经网络模型,完成以下要求:完成数据集的加载、初始化,洗牌,将数据集合理分割成训练集和测试集实现激活函数及其导数实现代价函数实现梯度下降并记录代价函数完成模型的训练,并计算在训练集上的准确率画出代价函数曲线在测试集上完成了预测,并计算在测试集上...原创 2019-07-18 10:43:30 · 618 阅读 · 0 评论 -
机器学习之逻辑回归(四)日考训练
题目要求1.按要求完成下面的各项需求。利用python编写如下程序,现有一个西红柿分类回归样本训练集(sample.txt文件)和测试集(test.txt文件),其中x1、x2、x3为苹果的检验参数(x1为含水量,X2为大小,X3重量),Y为分类结果(1为好果,0为坏果)。2.请通过Python实现逻辑回归模型,并用此模型预测测试集数据,具体要求如下:完成数据集的读取实现Sigmoid...原创 2019-07-16 09:34:44 · 662 阅读 · 1 评论 -
机器学习算法之多变量线性回归练习(二)
题目要求1.按要求完成下面的各项需求。利用python编写如下程序,现有一个循环发电场样本数据集,其中包括训练集(ccpp_train.txt文件)和测试集(ccpp_test.txt文件)。数据集格式如下:AT(温度) V(压力) AP(湿度) RH(压强) PE(输出电力)8.34 40.77 1010.84 90.01 480.4823.64 58.49 1011.4 74.2 ...原创 2019-07-12 09:13:15 · 1300 阅读 · 0 评论 -
机器学习之神经网络(三)考试训练
题目如下1.按要求完成下面的各项需求。已知有一个水蜜桃的数据集,保存在smt.txt文件中,t1是含糖量,t2是含水量,y标签表示水蜜桃的好坏:1表示好,0表示不好利用神经网络模型,完成以下要求:完成数据集的加载、初始化,洗牌,将数据集合理分割成训练集和测试集实现激活函数及其导数实现代价函数实现梯度下降并记录代价函数完成模型的训练,并计算在训练集上的准确率画出代价函数曲线在测试...原创 2019-07-19 09:32:49 · 827 阅读 · 3 评论 -
机器学习之聚类算法(二)KMeans考试训练
题目描述实现k-means算法,完成以下要求:实现k=2时,调用库函数并训练模型输出聚类中心的坐标、各点所属聚类中心的位置以及代价画出样本数据及聚类中心的位置实现肘部法则,并画出肘部法则曲线数据如下:[[2,5],[4,6],[3,1],[6,4],[7,2],[8,4],[2,3],[3,1],[5,7],[6,9],[12,16],[10,11],[15,19],[16,12...原创 2019-07-24 08:36:08 · 2357 阅读 · 0 评论 -
机器学习之神经网络(一)考试训练
题目要求1.按要求完成下面的各项需求。利用神经网络模型,实现异或非逻辑:X =[[1,0,0],[1,0,1],[1,1,0],[1,1,1]]y = [[1],[0],[0],[1]]具体要求:完成数据初始化实现激活函数及其导数实现代价函数实现梯度下降并记录代价函数完成模型的训练,并计算在训练集上的准确率画出代价函数曲线代码如下:import numpy as npf...原创 2019-07-17 09:36:57 · 880 阅读 · 0 评论 -
机器学习1笔试月度解析(一)
题目要求(一)题目要求以下是一个西瓜的数据,其中x1是密度,x2是含糖率,y标签:1好瓜,0坏瓜x1=[0.697,0.774,0.634,0.608,0.556,0.403,0.481,0.437,0.666,0.243,0.245,0.343,0.639,0.657,0.360,0.593,0.719]x2=[0.460,0.376,0.264,0.318,0.215,0.237,0....原创 2019-07-30 19:02:57 · 482 阅读 · 0 评论 -
机器学习1笔试月度解析(二)
题目要求(一)题目要求已知某保温杯品牌的数据集,共有超过10000个样本,分为10个系列产品种类。每个样本的特征数据储存warmdata.txt中,样本的标签文件存储在warm.txt中。请实现下列要求。1.数据集加载,进行0-1缩放特征, 将数据集分成训练集(75%)和测试集(25%)(4分)2.调用神经网络MLPClassifier库函数实现分类(共10分):-设置模型参数:隐藏层共...原创 2019-07-30 19:14:04 · 504 阅读 · 0 评论 -
机器学习1笔试月度解析(三)
题目要求1.按要求完成下面的各项需求。利用python编写如下程序,为对单变量线性回归有较深刻的认识,现自行设计数据集。数据集的要求如下,训练集:xdata为200个在(0,5)范围内服从正态分布的随机数,ydata满足:ydata=4*xdata+8+random1,其中random1也是(0,5)范围内服从正态分布的随机数。测试集:选择训练集中前50个数据作为测试集。请通过Python实...原创 2019-07-30 19:32:37 · 553 阅读 · 0 评论 -
使用matplotlib、seaborn、pandas绘制数据条形图
项目描述打开房天下数据表,其中包括了房天下网站从2009年1月到2010年12月的各大城市房屋销售数据。要求:使用所学知识,使用EXCEL数据透视表功能,从数据源中筛选出2009年第2季度北上广三个城市的销售数量总和,将结果输出到新表。(50分)按照2009年和2010年的第1、2、3、4季度共8个时间节点,画出各节点对应销售数量总和的条形图。(50分)数据举例实现代码impo...原创 2019-08-26 08:54:31 · 5352 阅读 · 0 评论