数据科学技术与应用
文章平均质量分 70
数据成为社会新型生产要素,数据思维是每个大学生应具备的基本素养。课程围绕数据科学工作流程,介绍从数据中获取知识的方法和技术:数据采集预处理、统计分析、可视化、机器学习建模等。通过大量实践案例和开放项目,使学生建立 “数据即生产力”的意识,能够采用数据科学的方法,解决领域实际问题。
优惠券已抵扣
余额抵扣
还需支付
¥39.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
HerbertHu
Herbert Hu,专注于数据分析,尤其是地理数据分析的工作,擅长运用Python、ArcGIS等多种工具对数据进行整理、分析和呈现,通过挖掘和解读数据,为您提供优秀的解决方案,追求创新和更好的效果。工作邮箱:Herbert_HUXK@outlook.com
展开
-
数据科学技术与应用【中国大学MOOC】:第一次综合作业_答案【更新于第四次开课】
数据科学技术与应用第一次综合作业_答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用【第四次开课】1.( 100分 )文件bankpep.csv存放着银行储户的基本信息,数据格式如下所示。使用统计分析、可视化方法完成以下分析目标:1)从bankpep.csv文件中读取用户信息。2)查看储户的总数,以及居住在不同区域的储户数。3)计算不同性别储户收入的均值和方差。4)按性别、区域统计接受新业务的储户数。5)将存款账户、接受新业务的数据转化为数值型。6)分析收入、存款账户原创 2021-10-15 13:53:15 · 4149 阅读 · 1 评论 -
数据科学技术与应用【中国大学MOOC】:期末考试_答案
数据科学技术与应用期末考试 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 ( 100分 ) 根据不同的身体指标可以预测患心脏病的风险等级(Risk)。heart-disease.xlsx记录了测试者的年龄(Age)、性别(Sex)、胸痛类型(Cp)、血压(Trestbps)、胆固醇(Chol)等13种身体指标(具体说明见“数据集说明”文件),以及患心脏病的风险等级。风险等级分为五种:无风险(no)、低风险(low)、中风险(medium)、高风险(high)、极高风险(ver原创 2020-07-22 03:00:16 · 6778 阅读 · 29 评论 -
致读者的一封信——付费专栏《数据科学技术与应用_中国大学MOOC_持续更新》用户调查【2021/1/22】
致读者的一封信付费专栏《数据科学技术与应用_中国大学MOOC_持续更新》用户调查2021/1/22读者您好!我是CSDN博主Herbert胡不归。为了更好地针对付费专栏《数据科学技术与应用_中国大学MOOC_持续更新》进行改进,现向您进行问卷调查。本次调查为匿名调查,调查结果仅用于改进博客内容,请您放心填答。题目选项无对错之分,请您按自己的实际情况填写。问卷共12题,填写时间约5分钟左右。请您务必答完,您的意见很重要!感谢您的支持!问卷链接:https://www.wjx.cn/vj/wFGU原创 2021-01-22 10:25:16 · 548 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:时序与语音数据处理_第八次单元测验_答案
数据科学技术与应用时序与语音数据处理 第七次单元测验 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1单选(1分)时序数据分析主要采用________分析建模以便对未来进行预测。得分/总分A.回归B.多分类C.二分类D.聚类正确答案:A你没选择任何选项2单选(1分)语音识别采用一种特殊的________数据处理技术。得分/总分A.时间序列B.数字图像C.结构D.自然语言文本正确答案:A你没选择任何选项3单选(1分)在下列数据特征提原创 2020-07-21 17:41:08 · 1912 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:图像数据处理_第七次单元测验_答案
数据科学技术与应用图像数据处理 第六次单元测验 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 单选(1分) 计算机数字图像,按照颜色和灰度的多少将图像分为________。A.静态图像、运动图像B.JPG图像、TIFF图像、BMP图像C.4K图像、高清度图像、低清晰度图像D.二值图像、灰度图像、RGB彩色图像2 单选(1分) Python在内存中使用________来存储图像的数据。A.多维数组B.表结构(DataFrame)C.列表D.字典3 单选(1分原创 2020-07-21 18:48:47 · 2398 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:文本数据处理_第六次单元测验_答案
数据科学技术与应用文本数据处理 第六次单元测验 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 单选(1分) 识别文本中包含的情感通常使用________方法处理。A.文本检索B.文本分类C.机器翻译D.文本摘要2 单选(1分) 中文分词的作用是________。A.去掉文本中与主题无关的句子B.从文本中抽取与主题有关的词语C.将文本转换为数字向量D.将中文句子划分为以词为单位的词序列3 单选(1分) 词袋模型的主要缺点是________。A.只使用主题词原创 2020-07-21 17:10:12 · 3390 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:机器学习建模分析(三)_第五次单元测验_答案
数据科学技术与应用机器学习建模分析(三) 第五次单元测验 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 单选(1分) 关于人工智能、机器学习、深度学习三者的关系,正确的是_________。A.B.C.D.2 单选(1分) 目前人工智能技术,特别是机器学习,主要模拟了人的_________思维过程。A.学习B.思考C.推理D.规划3 单选(1分) ________属于机器学习中的回归问题。A.根据房屋特性预测房价B.预测短信是否为垃圾短信C.原创 2020-07-21 17:02:29 · 3127 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:机器学习建模分析(三)_第八次作业_答案
数据科学技术与应用机器学习建模分析(三) 第八次作业 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 ( 50分 ) 葡萄酒数据集(wine.data)搜集了法国不同产区葡萄酒的化学指标。试建立决策树、SVM和神经网络3种分类器模型,比较各种分类器在此数据集上的效果。在这里插入代码片2 ( 50分 ) 基于Keras建立深度神经网络模型,在bankpep数据集上训练神经网络分类模型,将训练模型的耗时以及模型性能,与XGBoost、SVM、朴素贝叶斯等方法进行比较。在这里原创 2020-07-22 00:11:25 · 4999 阅读 · 7 评论 -
数据科学技术与应用【中国大学MOOC】:机器学习建模分析(二)_第七次作业_答案
数据科学技术与应用机器学习建模分析(二) 第七次作业 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 ( 100分 ) 基于bankpep.csv数据集,划分训练集与测试集,建立分类模型。1)使用决策树建立分类模型,记录模型在测试集上的性能;2)自学朴素贝叶斯、支持向量机建立分类模型的方法,记录模型在测试集上的性能;3)使用使用梯度提升机以及XGBoost训练分类模型,并与步骤1、2的结果进行比较。4)本次作业需提交源代码和结果分析报告,分析报告说明使用的数据集,数据集原创 2020-07-21 16:32:22 · 4181 阅读 · 5 评论 -
数据科学技术与应用【中国大学MOOC】:机器学习建模分析(一)_第六次作业_答案
数据科学技术与应用机器学习建模分析(一) 第六次作业 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 ( 100分 ) Energy Efficiency数据集( ENB2012_data.xlsx,ENB2012.names)记录不同房屋的制热能源消耗和制冷能源消耗。包括768条记录,8个特征属性,两个预测值。具体说明见ENB2012.names。1)在全数据集上训练线性回归模型预测制热能耗,计算模型性能:RMSE以及R2;2)将数据集划分训练集和测试集,在训练集上训练线原创 2020-07-20 15:59:26 · 3577 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:数据可视化_第四次单元测验_答案
数据科学技术与应用数据可视化 第四次单元测验 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 单选(1分) 下面关于使用pyplot和pandas提供的绘图函数的说法中,错误的是_________。A.相比较pandas绘图,pyplot提供更多图元绘制函数,能提供更精细的绘图方式B.pandas提供的绘图函数使用更快捷C.在同一figure对象中,pyplot和pandas的绘图函数不可以混合使用D.Series、DataFrame对象都提供plot()函数2 单选原创 2020-07-12 01:55:57 · 3768 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:数据可视化_第五次作业_答案
数据科学技术与应用数据可视化 第五次作业 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 ( 30分 ) 2012—2017年我国人均可支配收入为[1.47, 1.62, 1.78, 1.94, 2.38, 2.60](单位:万元)。按照要求绘制以下图形。1)模仿例4-1和例4-3,绘制人均可支配收入折线图。用小矩形标记数据点,黑色虚线,用注解标注最高点,图标题为“Income chart”,设置坐标轴标题,最后将图形保存为JPG文件。2)模仿例4-2,使用多个子图分别绘制原创 2020-07-12 01:51:43 · 5789 阅读 · 3 评论 -
数据科学技术与应用【中国大学MOOC】:数据汇总与统计(二)_第三次单元测验_答案
数据科学技术与应用数据汇总与统计(二) 第三次单元测验 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 单选(1分) 有3张同学信息表,存储为DataFrame对象stu1,stu2,stu3,具有相同的列索引,合并的方法是________。A.pd.concat( [stu1,sut2,sut3] )B.[stu1,stu2,stu3].concat(axis =0)C.stu1.concat([sut2,sut3])D.pd.concat(stu1,sut2,sut原创 2020-07-08 02:28:19 · 4789 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:数据汇总与统计(二)_第四次作业_答案
数据科学技术与应用数据汇总与统计(二) 第四次作业 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 ( 25分 ) 数据清洗和填充1)从studentsInfo.xlsx 文件的“Group1”表单中读取数据;2)将“案例教学”列数据值全改为NaN;3)滤除每行数据中缺失3项以上(包括3项)的行;4)滤除值全部为NaN的列;5)使用列的平均值填充“体重”和“成绩”列的NaN数据;6)使用上一行数据填充“年龄”列的NaN数据;7)使用“中位数”填充“生活费用”NaN原创 2020-07-08 02:22:12 · 5848 阅读 · 4 评论 -
数据科学技术与应用【中国大学MOOC】:数据汇总与统计(一)_第二次单元测验_答案
数据科学技术与应用数据汇总与统计(一) 第二次单元测验 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 单选(1分) DataFrame对象的列索引通常表示________。A.列的数据类型B.每列数据的总数C.每列数据对应的现实概念D.列的位置信息2 单选(1分) DataFrame对象df中基于位置序号选取第2行第3列数据的方式是_______。(序号从0开始)A.df.iloc[1,2]B.df.find(1,2)C.df.rloc[1,2]D.df.l原创 2020-07-07 00:41:45 · 4403 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:数据汇总与统计(一)_第三次作业_答案
数据科学技术与应用数据汇总与统计(一) 第三次作业 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用1 ( 50分 ) 创建并访问DataFrame对象。1)创建3×3DataFrame数据对象:数据内容为1-9;行索引为字符a,b,c;列索引为字符串‘one’,‘two’,‘three’;2)查询列索引为‘two’和‘three’两列数据;3)查询第0行、第2行、第0列、第2列数据;4)筛选第1列中值大于2的所有行数据,另存为data1对象;5)为data1添加一列数据原创 2020-07-07 00:32:11 · 7309 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:多维数据结构与运算_第一次单元测验_答案
数据科学技术与应用多维数据结构与运算 第一次单元测验 答案题目来源:中国大学MOOC-东华大学-宋晖等-数据科学技术与应用快速答题卡:(注:请确认题目和选项顺序再使用)12345678910DCCABBABDADBD1 单选(2分) 下面________不是大数据的特征。A.规模性B.高速性C.多样性D.低价值性2 单选(2分) 下面关于数据科学与大数据之间的关系描述,错误的是________。A.大数据属于数据科学的范畴B.原创 2020-07-06 15:47:09 · 4210 阅读 · 0 评论 -
数据科学技术与应用【中国大学MOOC】:多维数据结构与运算_第二次作业_答案
数据科学技术与应用多维数据结构与运算 第二次作业 答案题目来源:中国大学MOOC-东华大学宋晖等数据科学技术与应用1 ( 50分 ) “大润发”、“沃尔玛”、“联华”和“农工商”四个超市都卖苹果、香蕉、桔子、猕猴桃和芒果5种水果。使用NumPy的ndarray实现以下功能。1)创建2个一维数组分别存储超市名称和水果名称;2)创建1个4×5的二维数组存储不同超市的水果价格,其中价格由4到10范围内的随机数生成;3)选择“大润发”的苹果和“联华”的香蕉,并将价格增加1元;4)“农工商”水果大减价,原创 2020-07-06 15:24:24 · 6423 阅读 · 8 评论 -
数据科学技术与应用【中国大学MOOC】:数据科学基础_第一次作业_答案
数据科学技术与应用数据科学基础第一次作业 答案题目来源:中国大学MOOC-东华大学宋晖等数据科学技术与应用原创 2020-07-06 15:16:01 · 9589 阅读 · 0 评论