![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
课程作业
文章平均质量分 82
线上作业答案
阿万古
我还在努力,继续努力
展开
-
《Spark大数据分析与内存计算》——第八章
什么库是Databricks公司发布的基于Spark平台的并行图计算库A. GraphFramesB. Spark StreamingC. DataFrameD. GraphX原创 2023-12-15 11:26:49 · 286 阅读 · 0 评论 -
《Spark大数据分析与内存计算》——第五章
在搜索框中输入题目。原创 2023-12-15 11:23:00 · 348 阅读 · 0 评论 -
《Spark大数据分析与内存计算》——第六章
SparkStreaming除了从套接字端口,监控HDFS外,还可以从kafka、flum等数据源接收并处理数据原创 2023-12-15 11:24:25 · 510 阅读 · 0 评论 -
《Spark大数据分析与内存计算》——第四章
Spark的共享变量,分为累加器accumulator与广播变量 Broadcast原创 2023-12-15 11:21:43 · 450 阅读 · 0 评论 -
《Spark大数据分析与内存计算》——第三章
Spark控制日志输出内容的方式有修改log4j.properties(或者)代码中使用setLogLevel(logLevel)控制日志输出原创 2023-12-15 11:19:19 · 356 阅读 · 0 评论 -
《Spark大数据分析与内存计算》——第二章
在Ubuntu系统中,软件的安装是通过什么命令加软件名这种方式进行的A. apt-get upgradeB.apt-get updateC. apt-get uninstallD.apt-get install原创 2023-12-15 11:16:28 · 235 阅读 · 0 评论 -
《Spark大数据分析与内存计算》——第一章
(单选题)下面哪个不是Spark 的四大组件A.Spark StreamingB.park RC.GraphxD.Mlib原创 2023-12-13 15:20:02 · 445 阅读 · 0 评论 -
《分布式数据库原理与应用》——作业六
Memcached的Slab Allocation机制,它的工作原理是按照预先规定的大小,将分配的内存分割成特定长度的快以完全解决内存碎片问题。请你回答一下它是怎么实现的。原创 2023-12-13 11:59:50 · 164 阅读 · 0 评论 -
《分布式数据库原理与应用》——作业五·
MongoDB分片的作用?正确答案:增加可用RAM;增加可用磁盘空间;减轻单台服务器的负载;处理单个mongod无法承受的吞吐量。原创 2023-12-13 11:53:10 · 251 阅读 · 0 评论 -
《分布式数据库原理与应用》——作业四
MongoDB属于什么类型的数据库?A. 列族数据库B. 键值对数据库C. 文档数据库D. 图数据库正确答案:C:文档数据库;原创 2023-12-13 11:47:29 · 112 阅读 · 0 评论 -
《分布式数据库原理与应用》——作业三
(简答题)简述Region的合并流程原创 2023-12-13 11:41:21 · 62 阅读 · 0 评论 -
《分布式数据库原理与应用》——作业二
HBase组件中zookeeper的主要功能。原创 2023-12-13 11:35:40 · 94 阅读 · 0 评论 -
《分布式数据库原理与应用》——作业一
BASE是三个特性的缩写, 基本可用性(Basically Available) + 软状态(Soft state) + 最终一致性(Eventuallyconsistent)包含:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。4. (单选题)日常生活中,我们都习惯了制造数据,很少去对历史数据进行修改了,导致了NoSQL数据库的日益流行,以下哪个是典型NoSQL应用( )(2)无法适应多变的数据结构或(海量数据的高效率读写);原创 2023-12-13 11:30:40 · 154 阅读 · 0 评论 -
《数据可视化技术》——作业五
因此,直方图上的每根柱子都是不可移动的,X轴上的区间是连续的、固定的。(2)Data:["南宁", "上海"], ["南宁", "北京"], ["南宁", "南京"], ["南宁", "重庆"], ["南宁", "兰州"], ["南宁", "杭州"]["南宁", "上海"], ["南宁", "北京"], ["南宁", "南京"], ["南宁", "重庆"], ["南宁", "兰州"], ["南宁", "杭州"]](3)折线图描述的是连续型数据;原创 2023-12-13 11:19:59 · 130 阅读 · 0 评论 -
《数据可视化技术》——作业四
(简答题, 30分)使用可视化技术找出以下4组数据的规律。写出具体代码方案思路即可(不需要写代码!!!),无需找到其中规律。原创 2023-12-13 11:12:58 · 115 阅读 · 0 评论 -
《数据可视化技术》——作业三
正确答案:数据可视化工具大致分为入门级工具(Excel)、信息图表工具(D3、Visual.ly、Raphaël、Flot、Echarts、Tableau)、地图工具(Modest Maps、Leaflet、PolyMaps、Openlayers、Kartograph、Quanum GIS)和高级分析工具(Processing、NodeBox、R、Python、Weka和Gephi)等。3. (简答题)不同的色彩对人心理会产生不同的影响。(1) (简答题) print(np.ones((3,4)))原创 2023-12-13 11:06:48 · 131 阅读 · 0 评论 -
《数据可视化技术》——作业二
简答题)解释代码:df.insert(2,'insert_t',list('abcdef'))在第3列插入一列,列名为‘inser_t’,列值为a,b,c,d,e,f正确答案:原创 2023-12-13 11:02:07 · 39 阅读 · 0 评论 -
《数据可视化技术》——作业一
多来源数据的类型和结构各异;12. (判断题)在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。A. 在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。答案解析:异常的数据不一定都是错误的数据,有些异常数据可能是设备出错或者人为错误输入,有些可能就是正确的数据。B. 数据可视化将抽象的、复杂的、不易理解的数据转化为人眼可识别的图形、图像、符号、颜色、纹理等。正确答案: ABCD:数据间的比较;原创 2023-12-13 10:55:02 · 207 阅读 · 0 评论 -
《数据挖掘与机器学习》—— 第五章 无监督学习作业
1.(单选题)下列属于无监督学习的是:A.kmeansB.svmC.最大熵D.crf答案:A: kmeans;原创 2023-12-13 10:36:06 · 304 阅读 · 0 评论 -
《数据挖掘与机器学习》—— 第六章 关联规则和协同过滤 作业
6. (单选题)协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( ),并将这些用户喜欢的项推荐给有相似兴趣的用户。7. (单选题)通过数据收集和展示数据背后的( ),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3 牛奶、尿布、啤酒、可乐 4 面包、牛奶、尿布、啤酒 5 面包、牛奶、尿布、可乐。原创 2023-12-13 10:41:35 · 213 阅读 · 0 评论 -
《数据挖掘与机器学习》—— 第四章 分类算法作业
8. (单选题)下列代码实现的功能是:>>> from sklearn.naive_bayes import GaussianNB>>> gnb = GaussianNB()>>>y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)19. (判断题)对于 PCA 处理后的特征,其朴素贝叶斯特征相互独立的假设一定成立,因为所有主成分都是正交的,所以不相关。15. (单选题)下面有关分类算法的准确率,召回率,F1 值的描述,错误的是?原创 2023-12-13 10:19:48 · 541 阅读 · 0 评论 -
《数据挖掘与机器学习》—— 第三章 回归算法作业
1. 假设已经使用python第三方库sklearn创建线性模型实例linear_model,则linear_model.coef中,属性coef的作用是?17. 如果自变量X 和因变量 Y 之间存在高度的非线性和复杂关系,那么树模型很可能优于经典回归方法。13. 分类是预测数据对象的离散类别,回归是用于数据对象的连续取值。14. 回归分析的算法通常有:线性回归、非线性回归、逻辑回归。8. 逻辑回归算法是在线性回归算法的结果上加入什么函数?9. Lasso回归与传统的线性回归方程区别是。原创 2023-11-28 20:42:29 · 334 阅读 · 0 评论 -
《数据挖掘与机器学习》——第二章 数据科学分析入门
4.已知变量名df为Pandas中的DataFrame实例,那么代码df.loc[0:2,:]=1实现的功能是?8. 已知在Pandas中的Series 数据结构的加法运算是按照索引计算,如果索引不同则会发生什么情况?答案: A:loc用label来去定位,iloc用position来去定位。A. loc用label来去定位,iloc用position来去定位。B. loc用position来去定位,iloc用label来去定位。11. DataFrame中loc函数与iloc函数的区别是什么。原创 2023-11-28 20:28:16 · 313 阅读 · 0 评论 -
《数据挖掘与机器学习》—— 第一章 数据挖掘概述作业
题量: 33快捷查找:Ctrl+F在搜索框中输入题目。原创 2023-11-28 20:04:53 · 442 阅读 · 0 评论 -
《大数据预处理技术》课后习题
大数据预处理习题兼答案原创 2023-11-28 19:50:18 · 1390 阅读 · 0 评论