【判断题】Matplotlib内置了数组功能,使python数据处理有了R语言DataFrame的效果 (10.0分)
【判断题】Keras并非简单的神经网络库,而是一个基于Theano的强大的深度学习库,利用它不仅仅可以搭建普通的神经网络,还可以搭建各种深度学习模型,如自编码器、循环神经网络、递归神经网络、卷积神经网络等等 (10.0分)
【判断题】SciPy包含的功能有最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算,显然,这些功能都是挖掘与建模必备的。 (10.0分)
【简答题】请大家上传细丝直径实验报告电子版,正反拍照上传即可
【判断题】Numpy提供了真正的数组功能,以及对数据进行快速处理的函数。 Numpy还是很多更高级的扩展库的依赖库,我们后面介绍的Scipy、Matplotlib、Pandas等库都依赖于 (10.0分)
【判断题】Python 是一门简单易学且功能强大的编程语言。它拥有高效的高级数据结构,并且能够用简单而又高效的方式进行面向对象编程 (10.0分)
【判断题】运行Python代码有两种方式,一种方式是启动Python,然后在命令窗口下直接输入相应的命令;另外就是将完整的代码写成.py脚本,如hello.py,然后通过python hello.py执行。 (10.0分)
【判断题】用统计指标对定量数据进行统计描述,常从集中趋势和离中趋势两个方面进行分析
【简答题】请简述KMeans聚类过程
【其它】请写出python 代码段,用reduce实现1+2+3+...+50的求和运算, (如果是3.x的版本要引入库 from functools import reduce) (25.0分)
【判断题】逻辑回归是有监督学习算法
【判断题】等宽离散化方法是将相同数量的记录放进每个区间
【多选题】离中趋势常用度量方法
【其它】小组作业1.docx
【判断题】python表达式a ** 3表示表示幂运算,意思为a的三次方 (10.0分)
【多选题】集中趋势常用的度量方法
【判断题】数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,处理缺失值、异常值等。
【其它】请创建一个四季的字典,key为: Spring 、 summer 、 autumn 、 winter,value为 0,1,2,3 (25.0分)
【判断题】标准差度量数据偏离方差的程度
【简答题】请大家拍照上传,注意,每页都要有,正反拍照即可。
【填空题】# -*- coding: utf-8 -*- import pandas as pd #通常用pd作为pandas的别名。 s = pd.Series([ 1 , 2 , 3 ], index =[ 'a' , 'b' , 'c' ]) #创建一个序列s d = pd.DataFrame([[ 1 , 2 , 3 ], [ 4 , 5 , 6 ]], columns = [ 'a' , 'b' , 'c' ]) #创建一个表 d2 = pd.DataFrame(s) #也可以用已有的序列来创建表格 #功能:预览前5行数据 print (—1—) #功能:数据基本统计量 print (—2—) (20.0分)
【简答题】1:写出本次课所讲电路元件名称,符号字符和作用。 2:画出电动机连续控制电路图,描述工作过程。
【判断题】简单函数变换的方法有三种规范化方法:最小-最大规范化、零-均值规范化、小数定标规范化
【判断题】有监督学习算法是有类别的训练
【单选题】下列模块中的函数,实现的逻辑回归模型测试集预测的代码段是:
【简答题】请大家上传该实验报告电子版,正反拍照即可。
【判断题】数据变换主要是对数据进行规范化的操作,将数据转换成“适当的”格式,以适用于挖掘任务及算法的需要。
【判断题】反映变异程度的指标则是对个体离开平均水平的度量,使用较广泛的是标准差(方差)、四分位间距。
【判断题】一般在训练的时候,把数据集分为测试集合和训练集合,训练集合用来训练拟合模型;测试数据用来评估效果
【判断题】最大最小规范化将原始数据映射到【-1,1】区间
【填空题】# -*- coding: utf-8 -* import numpy as np a = np.array([2, 0, 1, 5]) print(a) #----(1)---- print(a[:3]) #----(2)---- print(a.min()) #----(3)---- a.sort() b= np.array([[1, 2, 3], [4, 5, 6]]) print(b*b) #----(4)---- (20.0分)
【判断题】 Python是跨平台的语言,因此脚本可以跨平台运行,然而不同的平台运行效率不一样,一般来说Linux下的速度会比Windows快,而且是对于数据分析和挖掘任务 (10.0分)
【单选题】下列模块中的函数,实现的逻辑回归模型拟合训练的代码段是:
【判断题】python语言中s=‘I am a teacher’,执行了s+‘ and I come from china’后,s的字符串内容为 I am a teacher and I come from china (10.0分)
【单选题】下列模块中的函数,实现的逻辑回归模型原始数据集分割的代码段是:
【其它】1. 案例分析内容: 附件 catering_sale提供了某餐饮行业的商业数据,请利用pandas的read_excel读入数据,并用data保存该数据。并实现一下功能: (1) 过滤异常数据:提示正常范围销量 >400 且销量<5000; (2) 保存基本统计量 (3) 计算极差 (4) 变异系数 (5) 四分位距 (6) 打印统计结果 利用 python及其相关分析工具编程实现上述功能,并将代码粘贴到锦城在线作业答题区 catering_sale.xls 四川大学锦城学院数据挖掘课程翻转课堂教学任务单(1).docx 说明:请认真阅读教学任务单,在提交作业的时候已附件的形式提交
【判断题】极差对数据的极端值不敏感。
【判断题】数据预处理的主要任务包括数据清洗,数据集成,数据变换和数据规约。处理过程如图所示:
【判断题】Scikit-Learn是Python下强大的机器学习工具包,它提供了完善的机器学习工具箱,包括数据预处理、分类、回归、聚类、预测、模型分析等。 (10.0分)
【判断题】小数定标规范化将数据映射到【0,1】区间
【简答题】请大家上传F-H实验报告电子版,正反拍照即可。
【填空题】阅读下列代码,并用0-均值(标准规范化)方法进行归一化 import numpy as np arr=np.array([[ 2.1, -1.6, 1.2],[ 2.3, 0.5, 1.2],[ 0.7, 1.3, -1.2]]) mean=arr.mean(axis=0) std=arr.std(axis=0) arr_scale=np.random.random((3,3)) for col in range(3): for row in range(3): arr_scale[row][col]=___1_____ print(arr_scale) print(arr_scale.mean(axis=0)) print(arr_scale.std(axis=0))
【判断题】0均值规范化将数据映射到【0,1】区间
【多选题】聚类方法的迭代终止条件
【简答题】请大家阅读链接的文章,陈述你对文章内容与观点的看法,指出你最认可或反对的部分,结合你的真实经历进行说明 https://www.douban.com/doubanapp/dispatch?uri=/note/577724310/ 资本主义个人反抗指南(二):没有断舍离的二十一世纪消费主义 书接上回,断舍离相关的文章大家已经看的太多了,中产阶层希望通过找回自己被商品绑架的生活而试图过一种极 | 豆瓣日记 https://www.douban.com/doubanapp/dispatch?uri=/note/577724310/
【其它】书本P36-37(习题2,5,17,23,24)(练习本做完,上传批改后的那页有成绩即可)
【简答题】请大家上传该实验报告电子版,正反拍照即可。
【判断题】Pandas的功能非常强大,支持类似SQL的数据增、删、查、改,并且带有丰富的数据处理函数;支持时间序列分析功能;支持灵活处理缺失数据 (10.0分)
【简答题】请同学们上传光电效应的实验报告,正反拍照即可,没找到作业的同学请与我联系。
【其它】1 、确定团队市场调查项目,并对其项目背景进行描述。 2 、为自己的市场调查项目确定调查目标。 要求: 1 、一周内完成并在课堂展示。 2 、各个小组项目不能完全相同。