大数据第一章作业

!!!垃圾教育体系

课程考核

  1. 实验桌面是什么意思?与你正在用的电脑的桌面有什么不同?哪个是虚拟桌面?
    ○ 实验桌面是由阿里云提供的可远程的虚拟桌面,它是存放在云端服务器中,也就是提供的机子;我正在使用的电脑桌面是在本机当中,能看得见的物理上的实体且只有我能使用,而实验桌面是可以提供给很多用户使用的虚拟桌面;
  2. 阿里云实验账号是干什么的?它是真实的实验账号吗?与你自己的阿里云账号权限有什么不同?
    ○ 阿里云实验正好用于在实验环境中直接提供实例资源,提供给用户学习使用,面向的是全体用户,它是真是的账号的,他与我的账号权限不同的是,有效期较短,只能访问与实验相关的资源
  3. 浏览器登录的控制台的作用有哪些?
    ○ 查询实验资源实例各种信息,例如实例云盘,CPU,内存,磁盘,也可以使用控制台重置密码,重启实例,定时关闭实例,查看日志等功能。
  4. 超级用户Root和Administrator,哪个是Windows的?哪个是的Linux?
    ○ root属于linux
    ○ Administrator属于windows
  5. LX终端是干什么的?远程登录Linux服务器的命令是什么?还有其他什么方式登录?
    ○ lx终端可以用ssh远程连接服务器
    ○ ssh root@公网IP
    ○ 还有很多第三方登录应用程序,如xshell,putty,finalshell,itemrs等。
  6. PuTTY是什么?你还知道其他类似的软件吗?
    ○ 用于远程连接服务器的
    ○ xshell,putty,finalshell,itemrs
  7. Linux命令pwd、ls、mkdir、cd、mv、cp、passwd、touch、vim都是干什么的?
    ○ 分别是: 查看当前路径,查看当前文件夹下文件,创建文件夹,进入指定目录,移动文件\文件夹,复制文件\文件夹,重置当前用户密码,创建文件和启动vim编辑器打开文件
  8. ECS是什么?实例是什么?
    ○ Elastic Container Service,一项托管式容器管理服务。它允许用户轻松地在AWS中运行、管理和扩展容器。
    ○ 在ecs中实例就是提供一种计算机资源,用户可以选择不同类型的实例,来满足不同的需求,通俗来说实例就是厂商提供的云服务器资源。
    个人愚见,'云’就是不存在的,它只不过是别人的计算机资源罢了。
  9. ECS修改root用户密码有哪些方式?
    ○ 使用浏览器控制台修改
    ○ 登录云服务器后修改passwd
  10. 创建ECS的地域是什么意思?阿里云有哪些地域?
    ○ 地域就是指物理上的一个或者多个数据中心
    ○ 中国:华北1、华北2、华北3、华南1、华东1、华东2、华东5、西南1、中国(香港)
    ○ 亚太地区:亚太东南 1(新加坡)、亚太东南 2(悉尼)、亚太东南 3(吉隆坡)、亚太东南 5(雅加达)、亚太南部 1(孟买)、亚太东北 1(东京)、亚太东北 2(首尔)、亚太东北 3(河内)
    ○ 欧洲:英国(伦敦)、德国(法兰克福)、荷兰(阿姆斯特丹)、土耳其(伊斯坦布尔)、俄罗斯(莫斯科)
    ○ 美洲:美国西部 1(硅谷)、美国东部 1(弗吉尼亚)、加拿大(多伦多)、巴西(圣保罗)
    ○ 中东:阿联酋(迪拜)
    ○ 非洲:南非(约翰内斯堡)
  11. 包年包月和按量付费的计费方式,分别适合哪种情况?
    ○ 包年包月业务适用于需要搭建上线的应用APP,这些应用是提供给中量或者巨量使用,会产生许多流量,而且需要长期业务使用,更加优惠,主要追求稳定和性能。
    ○ 按量计费适用于短时学习,或者在业务上需要解决突发事件,或者对业务不太明确而选择新功能或者新产品,灵活性高。
  12. 两大主流CPU架构是什么?X86架构CPU主要是哪两个公司生产的?
    ○ 当前主流的是X86架构和ARM架构
    ■ 精简指令集和复杂指令集
    ○ X86主要是由intel和AMD两家生成
  13. vCPUs是什么?你选的规格是哪种?
    ○ 是虚拟的CPU资源,它允许多个虚拟机在同一台物理服务器进行分配,每个虚拟机被分配一定数量的虚拟处理机来处理任务,;
    ○ 2核心4G
  14. 实验中的镜像是什么?Alibaba Cloud Linux是Linux还是Windows的?为什么Linux有许多商业版本, Windows却不多?
    ○ 实验中的镜像采用centos,它是基于linux开发的发行版本。
    ○ 是linux
    ○ 因为linux系统的开源性,使得产商可以基于linux内核自由商用,只需要遵守linux的开源协议即可,而windows是闭源的,也就是不开放源代码的。
  15. VPC是什么?在给ECS进行网络配置时,你选择了默认的VPC吗?可不可以重新创建一个VPC来配置?
    ○ VPC代表Virtual Private Cloud,是AWS提供的一种虚拟网络环境,允许用户在AWS云中创建自定义的虚拟网络,包括子网、路由表和网关等。使用VPC可以使用户在AWS中建立一个私有的、隔离的网络环境,可以更好地控制和保护AWS资源和数据。
    ○ 在给ECS进行网络配置时,如果没有指定VPC,则默认会选择一个默认的VPC。用户可以选择使用默认的VPC进行配置,也可以创建一个新的VPC来配置。创建新的VPC可以让用户更好地控制网络环境,例如定义IP地址范围、子网、路由表等。
    ○ 在创建新的VPC时,用户需要定义CIDR块,以确定VPC中允许的IP地址范围。然后可以创建子网和路由表等组件。用户可以使用AWS控制台或AWS命令行界面(CLI)来创建和管理VPC。
  16. 安全组是什么?这里默认的安全组放通了哪些端口?为什么?
    ○ 安全组(Security Group)是云计算中一种重要的网络安全控制手段,它是一个虚拟的防火墙,用于在云服务器实例之间或与公网之间控制网络流量的进出规则。
    ○ 在阿里云中,每个实例都必须至少属于一个安全组,而每个安全组可以设置一组规则,用于允许或拒绝来自指定IP地址或端口的网络流量。默认情况下,新建的安全组没有任何入站和出站规则,所有流量都会被拒绝。
    ○ SSH端口(22):用于通过SSH协议远程登录Linux实例。
    ○ HTTP端口(80):用于Web服务。
    ○ HTTPS端口(443):用于加密Web服务。
    ○ RDP端口(3389):用于通过RDP协议远程登录Windows实例。
    ○ MySQL端口(3306):用于数据库服务。
    ○ 方便用户使用基础通用的服务功能。
  17. 公网IP和带宽是什么?没有它们可以吗?为什么?
    ○ 指的是能在公网上识别的ip地址,它是所有设备进行通讯的唯一标志,如果一个设备需要和别的设备进行通讯,那么它就的又一个公网IP
    ○ 带宽(Bandwidth)是指网络传输数据的速率。它通常被表示为每秒传输的位数或字节数。在网络中,带宽决定了数据能够以多快的速度从一个地方传输到另一个地方。更高的带宽意味着能够传输更多的数据,更快的速度。
  18. 你的Linux云服务器名称是什么?
    ○ 服务器系统的发行版本是centos7
    ○ 实例名称:i-uf669fosrwct02sf0b67
    三、在头歌、华为云或阿里云官网上,找出自己的课外学习资源,制定小组的课程学习计划、专业学习计划。
    四、习题1.10
  19. 试述信息技术发展史上的3次信息化浪潮及其具体内容。
    ○ 第一次个人计算机: 信息处理
    ○ 第二次互联网发展: 信息处理
    ○ 第三次物联网、云计算、大数据: 信息爆炸
  20. 试述数据产生方式经历的几个阶段。
    ○ 运营式系统阶段:数据库的出现使得数据管理的复杂度大大降低,实际中数据库大都为运营系统所采用,作为运营系统的数据管理子系统,如超市的销售记录系统、银行的交易记录系统、医院病人的医疗记录等,人类社会数据量第一次大的飞跃正是建立在运营式系统广泛使用数据库开始,这个阶段最主要的特点是数据往往伴随着一定的运营活动而产生并记录在数据库中,比如超市每销售出一件产品就会在数据库中产生相应的一条销售记录。这种数据的产生方式是被动的。
    ○ 互联网的诞生促使人类社会数据量出现第二次大的飞跃。但是真正的数据爆发产生于Web2.0时代,而Web 2.0 的重要标志就是用户原创内容(User Generated Content,UGC)。这类数据近几年一直呈现爆炸性增长,主要有两个方面的原因。首先,以博客、微博为代表的新型社交网络的出现和快速发展,使得用户产生数据的意愿更加强烈;其次,以智能手机、平板电脑为代表的新型移动设备的出现,这些易携带、全天候接入网络的移动设备使得人们在网上发表自己意见的途径更为便捷。这个阶段数据的产生方式是主动的。
    ○ **感知式系统阶段:**人类社会数据量第三次大的飞跃最终导致了大数据的产生,今天我们正处于这个阶段。这次飞跃的根本原因在于感知式系统的广泛使用。随着技术的发展,人们已经有能力制造极其微小的带有处理功能的传感器,并开始将这些设备广泛布置于社会的运转进行监控。这些设备会源源不断的产生新数据,这种数据的产生方式是自动的。简单来说,数据产生经历了被动、主动和自动三个阶段。这些被动、主动和自动的数据共同构成了大数据的数据来源,但其中自动式的数据才是大数据产生的根本原因
  21. 试述大数据的4个基本特征。
    ○ 数据量大(Volume)、数据种类多(Vari⁃ety)、数据价值密度低(Value) 以及数据产生和处理速度快(Velocity)
  22. 试述大数据时代的“数据爆炸”特性。.
    ○ 大数据时代的“数据爆炸”的特性是,人类社会产生的数据一致都以每年50%的速度增长,也就是说,每两年增加一倍
  23. 科学研究经历了哪4个阶段?
    ○ 人类自古以来在科学研究上先后历经了实验、理论、计算、和数据四种范式。
  24. 试述大数据对思维方式的重要影响。
    ○ 数据时代对思维方式的重要影响是三种思维的转变:全样而非抽样,效率而非精确,相关而非因果。
  25. 大数据决策与传统的基于数据仓库的决策有什么区别?
    ○ 数据仓库具备批量和周期性的数据加载以及数据变化的实时探测、传播和加载能力,能结合历史数据和实时数据实现查询分析和自动规则触发,从而提供对战略决策和战术决策。
    大数据决策可以面向类型繁多的、非结构化的海量数据进行决策分析。
  26. 举例说明大数据的具体应用。
    ○ 云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。
    ○ 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。
  27. 举例说明大数据的关键技术。
    ○ 批处理计算,流计算,图计算,查询分析计算
  28. 大数据产业包含哪些层面?
    ○ IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层、数据应用层。
  29. 给出以下术语的定义:云计算、物联网。
    ○ 云计算:云计算就是实现了通过网络提供可伸缩的、廉价的分布式计算机能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。
    ○ 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人类和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。
  30. 详细阐述大数据、云计算和物联网三者之间的区别与联系。
    ● 大数据侧重于海量数据的存储、处理与分析,海量数据中发现价值,服务于生产和生活;云计算本质上皆在整合和优化各种IT资源并通过网络已服务的方法,廉价地提供给用户;物联网的发展目标是实现呜呜向量,应用创新是物联网的核心 从整体来看,大数据、云计算和物联网这三者是相辅相成的。大数据根植于云计算,大数据分析的很多技术都来自于云计算,云计算的分布式存储和管理系统提供了海量数据的存储和管理能力,没有这些云计算技术作为支撑,大数据分析就无从谈起。物联网的传感器源源不断的产生大量数据,构成了大数据的重要数据来源,物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值