机器学习--总结1---例子1

鸢尾花例子

  • Iris数据集包含scikit-learn的datasets模块中
 from sklearn.datasets import load_iris  #导入
 iris_dataset=load_iris()  #load_iris()返回的对象是一个Bunch对象,类似于字典,包含键和值
  • 查看数据集的基本信息

输出数据中的键
DESCR键对应的值是数据集的简要说明在这里插入图片描述
在这里插入图片描述
数组的形状(shape)是样本数乘以特征数在这里插入图片描述

  • 训练集和测试集
    scikit-learn中的train-test-split 函数可以打乱数据集并进行拆分。
    数据通常用大写的X,标签用小写的y表示。
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(
    iris_dataset['data'],iris_dataset['target'],random_state=100)

函数说明

  • 构建模型
    k近邻算法:需要用k近邻分类器,构建模型,需要保存训练集即可。即对一个新的数据点做出预测,算法会在训练集中寻找与这个新数据点距离最近的数据点,然后将找到的数据点的标签赋值给这个新数据点。
    k近邻算法
from sklearn.neighbors import KNeighborsClassifier  #
knn=KNeighborsClassifier(n_neighbors=2)   #识别k个最近的点
knn.fit(X_train,y_train)
prediction=knn.predict(X_new)  #做出预测
print("Prediction:{}".format(prediction))
print("Predicted target name:{}".format(
    iris_dataset['target_names'][prediction]))
#评估模型
y_pred=knn.predict(X_test)
print("test set prediction:\n{}".format(y_pred))
print("Test set score:{:.2f}".format(np.mean(y_pred==y_test)))
#计算精度,即预测正确的话所占的比例
print("Test set score:{:.2f}".format(knn.score(X_test,y_test)))
#

score方法

  • isinstance
    isinstance是Python内置的一个函数,用于判断一个对象是否属于指定的类型。根据引用和引用的示例,可以看出isinstance函数的用法是isinstance(object, class),其中object是待判断的对象,class是指定的类型。如果对象是指定类型的实例,则返回True,否则返回False。

根据引用中的代码和输出结果,我们可以得出以下结论:
对于w这个对象,isinstance(w, Person)返回True,表示w是Person类型的实例。
由于Man是Person的子类,所以isinstance(w, Man)返回False,表示w不是Man类型的实例。
Woman是Person的子类,所以isinstance(w, Woman)返回True,表示w是Woman类型的实例。
最后,由于所有的类都是object的子类,所以isinstance(w, object)返回True,表示w是object类型的实例。
综上所述,根据继承链的类型转换,我们可以得出w的类型分别为Person、Woman、object

在这里插入图片描述

列表[start:stop:step]的应用

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
机器学习线性回归是一种常见的机器学习算法,用于预测数值型变量的值。下面是一个简单的回归例子,以展示如何使用这个算法。 首先,我们需要准备数据集。假设我们有一个房屋价格的数据集,其中包含了房屋的大小和房价。我们可以使用这个数据集来训练一个线性回归模型,以便预测房价。 在介绍算法之前,我们需要导入必要的库,如numpy和pandas。这些库将帮助我们处理和分析数据。 接下来,我们加载数据集并进行必要的数据清洗。这可能包括去除缺失值、处理异常值等。 然后,我们将数据集分为训练集和测试集。训练集将用于训练模型,而测试集将用于评估模型的性能。 在进行机器学习之前,我们需要对数据进行特征缩放。这可以确保所有特征都具有相同的重要性。 接下来,我们将使用线性回归算法来拟合我们的训练数据。这将生成一个线性模型,该模型可以用于预测房价。 我们可以使用模型的系数和截距来了解每个特征对预测的影响。系数的正负表示了特征影响的方向,而系数的绝对值表示了特征的重要性。 最后,我们可以使用测试集来评估模型的性能。我们可以使用一些常见的性能指标,如均方误差和决定系数来评估我们的模型。 总结一下,这个机器学习线性回归的例子笔记本演示了如何使用线性回归算法来预测房价。它涵盖了数据准备、模型训练、模型评估等步骤,以及一些常用的数据处理和模型评估技术。通过这个例子,我们可以更好地理解和应用机器学习线性回归算法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值