阿万古-CSDN博客

原创《商务智能》—— 作业一

数据须对业务用户来说是直观和明显的,而不仅仅只考虑到开发人员。13. (简答题)【简答题】数据库是数据仓库的基础,数据库是为了捕获数据而设计的,而数据仓库是为了分析数据而设计的,是在数据库已经大量存在的情况下,为了进一步发现数据资源,为了支持决策而产生,它并不是所谓的“大型数据库”,数据仓库并不能取代数据库而独立存在。(4)数据结构:数据库中的建模一般遵循三范式,是高度结构化、复杂、适合操作计算的数据,而数据仓库的建模有特定的方式,一般采用维度建模,数据结构比较简单,可以提高查询效率,适合统计分析。

2023-12-15 12:03:05 521

原创《Spark大数据分析与内存计算》——第八章

什么库是Databricks公司发布的基于Spark平台的并行图计算库A. GraphFramesB. Spark StreamingC. DataFrameD. GraphX

2023-12-15 11:26:49 325

原创《Spark大数据分析与内存计算》——第七章

什么提供用于构建，评估和调整 ML Pipelines 的工具。A. UtilitiesB. FeaturizationC. PipelinesD. ML Algorithms

2023-12-15 11:25:47 437

原创《Spark大数据分析与内存计算》——第六章

SparkStreaming除了从套接字端口，监控HDFS外，还可以从kafka、flum等数据源接收并处理数据

2023-12-15 11:24:25 565

原创《Spark大数据分析与内存计算》——第五章

在搜索框中输入题目。

2023-12-15 11:23:00 391

原创《Spark大数据分析与内存计算》——第四章

Spark的共享变量，分为累加器accumulator与广播变量 Broadcast

2023-12-15 11:21:43 485

原创《Spark大数据分析与内存计算》——第三章

Spark控制日志输出内容的方式有修改log4j.properties（或者）代码中使用setLogLevel(logLevel)控制日志输出

2023-12-15 11:19:19 429

原创《Spark大数据分析与内存计算》——第二章

在Ubuntu系统中，软件的安装是通过什么命令加软件名这种方式进行的A. apt-get upgradeB.apt-get updateC. apt-get uninstallD.apt-get install

2023-12-15 11:16:28 260

原创《Spark大数据分析与内存计算》——第一章

(单选题)下面哪个不是Spark 的四大组件A.Spark StreamingB.park RC.GraphxD.Mlib

2023-12-13 15:20:02 493

原创《分布式数据库原理与应用》——作业六

Memcached的Slab Allocation机制,它的工作原理是按照预先规定的大小,将分配的内存分割成特定长度的快以完全解决内存碎片问题。请你回答一下它是怎么实现的。

2023-12-13 11:59:50 173

原创《分布式数据库原理与应用》——作业五·

MongoDB分片的作用?正确答案：增加可用RAM;增加可用磁盘空间;减轻单台服务器的负载;处理单个mongod无法承受的吞吐量。

2023-12-13 11:53:10 270

原创《分布式数据库原理与应用》——作业四

MongoDB属于什么类型的数据库?A. 列族数据库B. 键值对数据库C. 文档数据库D. 图数据库正确答案:C:文档数据库;

2023-12-13 11:47:29 128

原创《分布式数据库原理与应用》——作业三

(简答题)简述Region的合并流程

2023-12-13 11:41:21 67

原创《分布式数据库原理与应用》——作业二

HBase组件中zookeeper的主要功能。

2023-12-13 11:35:40 106

原创《分布式数据库原理与应用》——作业一

BASE是三个特性的缩写, 基本可用性(Basically Available) + 软状态(Soft state) + 最终一致性(Eventuallyconsistent)包含:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。4. (单选题)日常生活中,我们都习惯了制造数据,很少去对历史数据进行修改了,导致了NoSQL数据库的日益流行,以下哪个是典型NoSQL应用( )(2)无法适应多变的数据结构或(海量数据的高效率读写);

2023-12-13 11:30:40 177

原创《数据可视化技术》——作业五

因此,直方图上的每根柱子都是不可移动的,X轴上的区间是连续的、固定的。（2）Data:["南宁", "上海"], ["南宁", "北京"], ["南宁", "南京"], ["南宁", "重庆"], ["南宁", "兰州"], ["南宁", "杭州"]["南宁", "上海"], ["南宁", "北京"], ["南宁", "南京"], ["南宁", "重庆"], ["南宁", "兰州"], ["南宁", "杭州"]](3)折线图描述的是连续型数据;

2023-12-13 11:19:59 141

原创《数据可视化技术》——作业四

(简答题, 30分)使用可视化技术找出以下4组数据的规律。写出具体代码方案思路即可（不需要写代码！！！），无需找到其中规律。

2023-12-13 11:12:58 127

原创《数据可视化技术》——作业三

正确答案：数据可视化工具大致分为入门级工具(Excel)、信息图表工具(D3、Visual.ly、Raphaël、Flot、Echarts、Tableau)、地图工具(Modest Maps、Leaflet、PolyMaps、Openlayers、Kartograph、Quanum GIS)和高级分析工具(Processing、NodeBox、R、Python、Weka和Gephi)等。3. (简答题)不同的色彩对人心理会产生不同的影响。(1) (简答题) print(np.ones((3,4)))

2023-12-13 11:06:48 155

原创《数据可视化技术》——作业二

简答题)解释代码:df.insert(2,'insert_t',list('abcdef'))在第3列插入一列，列名为‘inser_t’，列值为a,b,c,d,e,f正确答案：

2023-12-13 11:02:07 56

原创《数据可视化技术》——作业一

多来源数据的类型和结构各异;12. (判断题)在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。A. 在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。答案解析：异常的数据不一定都是错误的数据,有些异常数据可能是设备出错或者人为错误输入,有些可能就是正确的数据。B. 数据可视化将抽象的、复杂的、不易理解的数据转化为人眼可识别的图形、图像、符号、颜色、纹理等。正确答案: ABCD:数据间的比较;

2023-12-13 10:55:02 257

m0_54127955的博客