大一 大数据Python实验报告汇总

这篇博客汇总了大一学生的多个Python实验,包括鸢尾花数据集的KNN分类、泰坦尼克生存预测的缺失值处理、乳腺癌预测的逻辑回归以及散点图和折线图的绘制。实验旨在让学生掌握数据处理、机器学习的基本方法和Python编程,体验大数据技术的应用。
摘要由CSDN通过智能技术生成

学生实验报告

学生姓名

学号

组员:

实验项目

鸢尾花数据集分类

■必修  □选修  

■设计性实验 □验证性实验  □操作性实验  □综合性实验

实验地点

实验仪器台号

指导教师

实验日期及节次

一、实验目的及要求

1、目的

利用鸢尾花数据集分类案例,使学生在实验过程中了解大数据技术中的机器学习任务,熟悉python程序的编写以及机器学习任务的一般流程,掌握数据处理的基本程序和基本方法。

2、内容及要求

掌握数据处理基本概念,熟悉python的基本程序和基本方法

(1) 熟悉python的编程环境,会安装python以及各种python库

(2)分析及查看数据集,掌握数据集的划分的方法,将数据集分为训练数据和测试数据

(3) 了解KNN算法,掌握机器学习库中的KNN对象以其常用方法的使用

(4) 了解机器学习任务的一般流程

(5) 撰写实验报告

二、实验工具

仪器名称

规格/型号

数量

备注

计算机

1

有网络环境

Python软件

1

三、实验方法与步骤

(一) 安装python编程环境,安装numpy、sklearn数据包

  • 针对鸢尾花数据集,根据鸢尾花的特征实现未知花的分类预测

#导入包和数据

import numpy as np

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier

#读取鸢尾花数据集

iris_data = load_iris()

print(type(iris_data))

print(iris_data['data'])   

print("花的样本数量:{}".format(iris_data['data'].shape))   

print("花的前5个样本数据:{}".format(iris_data['data'][:5]))

print(iris_data['target'])  

print(iris_data['target_names'])  

#构造训练数据和测试数据

X_train,X_test,y_train,y_test=train_test_split(iris_data['data'],\

                  iris_data['target'],test_size=0.3,random_state=0)

print(X_train)

print(X_train.shape)

print(X_test)

print(X_test.shape)

print(y_train)

print(y_train.shape)

#KNN模型和评估模型

knn = KNeighborsClassifier(n_neighbors=3)

knn.fit(X_train,y_train)

y_pred = knn.predict(X_test)

print("模型精度:{:.2f}".format(np.mean(y_pred==y_test)))

print("模型精度:{:.2f}".format(knn.score(X_test,y_test)))

#未知鸢尾花种类预测

X_new=np.array([[5.8,3.6,1.3,0.5]])

prediction=knn.predict(X_new)</

  • 3
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
电池大数据Python是指通过使用Python编程语言来处理和分析电池的大量数据。电池大数据是指从电池中收集到的大量数据,包括电池充电和放电的参数、电池的温度、电流等等。 Python是一种易学易用的编程语言,具有丰富的数据处理和分析工具库,因此非常适合用于处理电池大数据Python中有许多库可以帮助我们处理电池大数据,如pandas用于数据处理、numpy用于数值计算、matplotlib用于绘图等等。 使用Python进行电池大数据处理的过程可以分为以下几步: 1. 数据采集:首先要从电池中收集到大量的数据,并保存在适合Python处理的数据结构中,如CSV文件或者数据库中。 2. 数据清洗:对于收集到的电池大数据中可能存在的错误或缺失的数据进行清洗和处理,以确保数据的准确性和完整性。 3. 数据分析:使用Python的数据分析工具库,对电池大数据进行统计分析、数据挖掘和可视化,以发现数据中的规律和趋势,进一步了解电池的性能和状态。 4. 模型建立:根据已有的电池大数据,使用Python的机器学习和深度学习库,建立预测模型或者分类模型,以预测电池的寿命、性能或者故障。 5. 结果展示:将分析和建模的结果以图表、报告等形式展示出来,便于人们理解和使用。 综上所述,通过使用Python进行电池大数据处理可以帮助我们更好地了解电池的性能和状态,以及预测电池的寿命和故障,从而提高电池的利用效率和可靠性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值