自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 《商务智能》—— 作业一

数据须对业务用户来说是直观和明显的,而不仅仅只考虑到开发人员。13. (简答题)【简答题】数据库是数据仓库的基础,数据库是为了捕获数据而设计的,而数据仓库是为了分析数据而设计的,是在数据库已经大量存在的情况下,为了进一步发现数据资源,为了支持决策而产生,它并不是所谓的“大型数据库”,数据仓库并不能取代数据库而独立存在。(4)数据结构:数据库中的建模一般遵循三范式,是高度结构化、复杂、适合操作计算的数据,而数据仓库的建模有特定的方式,一般采用维度建模,数据结构比较简单,可以提高查询效率,适合统计分析。

2023-12-15 12:03:05 348

原创 《Spark大数据分析与内存计算》——第八章

什么库是Databricks公司发布的基于Spark平台的并行图计算库A. GraphFramesB. Spark StreamingC. DataFrameD. GraphX

2023-12-15 11:26:49 121

原创 《Spark大数据分析与内存计算》——第七章

什么提供用于构建,评估和调整 ML Pipelines 的工具。A. UtilitiesB. FeaturizationC. PipelinesD. ML Algorithms

2023-12-15 11:25:47 149

原创 《Spark大数据分析与内存计算》——第六章

SparkStreaming除了从套接字端口,监控HDFS外,还可以从kafka、flum等数据源接收并处理数据

2023-12-15 11:24:25 149

原创 《Spark大数据分析与内存计算》——第五章

在搜索框中输入题目。

2023-12-15 11:23:00 136

原创 《Spark大数据分析与内存计算》——第四章

Spark的共享变量,分为累加器accumulator与广播变量 Broadcast

2023-12-15 11:21:43 230

原创 《Spark大数据分析与内存计算》——第三章

Spark控制日志输出内容的方式有修改log4j.properties(或者)代码中使用setLogLevel(logLevel)控制日志输出

2023-12-15 11:19:19 240

原创 《Spark大数据分析与内存计算》——第二章

在Ubuntu系统中,软件的安装是通过什么命令加软件名这种方式进行的A. apt-get upgradeB.apt-get updateC. apt-get uninstallD.apt-get install

2023-12-15 11:16:28 146

原创 《Spark大数据分析与内存计算》——第一章

(单选题)下面哪个不是Spark 的四大组件A.Spark StreamingB.park RC.GraphxD.Mlib

2023-12-13 15:20:02 291

原创 《分布式数据库原理与应用》——作业六

Memcached的Slab Allocation机制,它的工作原理是按照预先规定的大小,将分配的内存分割成特定长度的快以完全解决内存碎片问题。请你回答一下它是怎么实现的。

2023-12-13 11:59:50 101

原创 《分布式数据库原理与应用》——作业五·

MongoDB分片的作用?正确答案:增加可用RAM;增加可用磁盘空间;减轻单台服务器的负载;处理单个mongod无法承受的吞吐量。

2023-12-13 11:53:10 171

原创 《分布式数据库原理与应用》——作业四

MongoDB属于什么类型的数据库?A. 列族数据库B. 键值对数据库C. 文档数据库D. 图数据库正确答案:C:文档数据库;

2023-12-13 11:47:29 61

原创 《分布式数据库原理与应用》——作业三

(简答题)简述Region的合并流程

2023-12-13 11:41:21 44

原创 《分布式数据库原理与应用》——作业二

HBase组件中zookeeper的主要功能。

2023-12-13 11:35:40 72

原创 《分布式数据库原理与应用》——作业一

BASE是三个特性的缩写, 基本可用性(Basically Available) + 软状态(Soft state) + 最终一致性(Eventuallyconsistent)包含:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。4. (单选题)日常生活中,我们都习惯了制造数据,很少去对历史数据进行修改了,导致了NoSQL数据库的日益流行,以下哪个是典型NoSQL应用( )(2)无法适应多变的数据结构或(海量数据的高效率读写);

2023-12-13 11:30:40 87

原创 《数据可视化技术》——作业五

因此,直方图上的每根柱子都是不可移动的,X轴上的区间是连续的、固定的。(2)Data:["南宁", "上海"], ["南宁", "北京"], ["南宁", "南京"], ["南宁", "重庆"], ["南宁", "兰州"], ["南宁", "杭州"]["南宁", "上海"], ["南宁", "北京"], ["南宁", "南京"], ["南宁", "重庆"], ["南宁", "兰州"], ["南宁", "杭州"]](3)折线图描述的是连续型数据;

2023-12-13 11:19:59 43

原创 《数据可视化技术》——作业四

(简答题, 30分)使用可视化技术找出以下4组数据的规律。写出具体代码方案思路即可(不需要写代码!!!),无需找到其中规律。

2023-12-13 11:12:58 56

原创 《数据可视化技术》——作业三

正确答案:数据可视化工具大致分为入门级工具(Excel)、信息图表工具(D3、Visual.ly、Raphaël、Flot、Echarts、Tableau)、地图工具(Modest Maps、Leaflet、PolyMaps、Openlayers、Kartograph、Quanum GIS)和高级分析工具(Processing、NodeBox、R、Python、Weka和Gephi)等。3. (简答题)不同的色彩对人心理会产生不同的影响。(1) (简答题) print(np.ones((3,4)))

2023-12-13 11:06:48 45

原创 《数据可视化技术》——作业二

简答题)解释代码:df.insert(2,'insert_t',list('abcdef'))在第3列插入一列,列名为‘inser_t’,列值为a,b,c,d,e,f正确答案:

2023-12-13 11:02:07 23

原创 《数据可视化技术》——作业一

多来源数据的类型和结构各异;12. (判断题)在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。A. 在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。答案解析:异常的数据不一定都是错误的数据,有些异常数据可能是设备出错或者人为错误输入,有些可能就是正确的数据。B. 数据可视化将抽象的、复杂的、不易理解的数据转化为人眼可识别的图形、图像、符号、颜色、纹理等。正确答案: ABCD:数据间的比较;

2023-12-13 10:55:02 79

原创 《数据挖掘与机器学习》—— 第六章 关联规则和协同过滤 作业

6. (单选题)协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( ),并将这些用户喜欢的项推荐给有相似兴趣的用户。7. (单选题)通过数据收集和展示数据背后的( ),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3 牛奶、尿布、啤酒、可乐 4 面包、牛奶、尿布、啤酒 5 面包、牛奶、尿布、可乐。

2023-12-13 10:41:35 120

原创 《数据挖掘与机器学习》—— 第五章 无监督学习作业

1.(单选题)下列属于无监督学习的是:A.kmeansB.svmC.最大熵D.crf答案:A: kmeans;

2023-12-13 10:36:06 146

原创 《数据挖掘与机器学习》—— 第四章 分类算法作业

8. (单选题)下列代码实现的功能是:>>> from sklearn.naive_bayes import GaussianNB>>> gnb = GaussianNB()>>>y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)19. (判断题)对于 PCA 处理后的特征,其朴素贝叶斯特征相互独立的假设一定成立,因为所有主成分都是正交的,所以不相关。15. (单选题)下面有关分类算法的准确率,召回率,F1 值的描述,错误的是?

2023-12-13 10:19:48 354

原创 《数据挖掘与机器学习》—— 第三章 回归算法作业

1. 假设已经使用python第三方库sklearn创建线性模型实例linear_model,则linear_model.coef中,属性coef的作用是?17. 如果自变量X 和因变量 Y 之间存在高度的非线性和复杂关系,那么树模型很可能优于经典回归方法。13. 分类是预测数据对象的离散类别,回归是用于数据对象的连续取值。14. 回归分析的算法通常有:线性回归、非线性回归、逻辑回归。8. 逻辑回归算法是在线性回归算法的结果上加入什么函数?9. Lasso回归与传统的线性回归方程区别是。

2023-11-28 20:42:29 251

原创 《数据挖掘与机器学习》——第二章 数据科学分析入门

4.已知变量名df为Pandas中的DataFrame实例,那么代码df.loc[0:2,:]=1实现的功能是?8. 已知在Pandas中的Series 数据结构的加法运算是按照索引计算,如果索引不同则会发生什么情况?答案: A:loc用label来去定位,iloc用position来去定位。A. loc用label来去定位,iloc用position来去定位。B. loc用position来去定位,iloc用label来去定位。11. DataFrame中loc函数与iloc函数的区别是什么。

2023-11-28 20:28:16 155

原创 《数据挖掘与机器学习》—— 第一章 数据挖掘概述作业

题量: 33快捷查找:Ctrl+F在搜索框中输入题目。

2023-11-28 20:04:53 319

原创 《大数据预处理技术》课后习题

大数据预处理习题兼答案

2023-11-28 19:50:18 1138

原创 用python合并多个PDF文件

在本篇文章中,我们学习了如何使用Python编程语言来合并多个PDF文件。使用PyPDF4库,我们可以轻松地读取、操作和合并PDF文件。希望这篇文章对您有所帮助,如果您有任何问题,请随时在评论区留言。

2023-11-28 18:03:16 477 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除