慕课笔记-数据科学导论-第二章大数据技术基础-大数据算法/数据类型/开发流程

本文深入探讨大数据技术基础,从操作系统、编程语言到数据库和算法。重点介绍了Linux操作系统的历史和应用场景,编程语言的发展,特别是Python语言的优势,以及数据库中的SQL、NoSQL和NewSQL的区别。此外,还讨论了数据科学算法在大数据时代的角色,包括机器学习的优缺点和Hadoop、Spark等大数据系统的特性。
摘要由CSDN通过智能技术生成

大数据技术基础

计算机操作系统

操作系统统筹协调计算机硬件系统的工作,具体使CPU可以进行逻辑与数值运算,主存储器能够加载应用数据与程序代码,硬盘可以顺利存入与读出信息,输入设备、输出设备可以根据需要实时写入、写出必要信息等。因此,操作系统实际是整个计算机硬件系统的“CEO”,担负着整个计算机硬件系统的管理、协调和运作的全部任务。

Linux操作系统

  • 三个发展阶段

    • 1.单一个人维护阶段
    • 2.广大黑客志愿者加入阶段
    • 3.Linux核心的细分工、快速发展阶段
  • 核心版本编号示例

    • 在这里插入图片描述
  • Linux Kernel与Linux Distribution

    • Linux的核心版本是Linux Kernel的版本

    • Linux Distribution是专门为使用者量身打造的Linux Kernel + Software + Tools的可安全安装程序的综合发布版本,可帮助日常使用者在Linux系统下完成工作和其他相关任务。

    • Linux Distribution主要版本

      • 主要分为两大系统

        • 1.使用RPM(Red-Hat Package Manager)方式安装软件的系统,主要有RHEL、SuSE、Fedora等
        • 2.使用Debian的DPKG方式安装软件的系统,包括Ubuntu、Debian、B2D等
      • 在这里插入图片描述

    • 两者关系

      • 在这里插入图片描述
  • Linux的主要应用场景

    • (1)企业环境的应用,主要包括网络服务器(目前最热门的应用)、关键任务的应用(金融数据库、大型企业网管环境)、学术机构的高效能运算任务等。
    • (2)个人环境的使用,主要包括桌面计算机系统(实现和Windows系统一样的桌面操作系统)、手持系统(PDA、手机端系统如Android)、嵌入式系统(包括路由器、防火墙、IP分享器、交换机等)。
    • (3)云端的运用,主要包括云程序(云端虚拟机资源)、云端设备等。

编程语言

发展史

  • 语言可以使人们以更加规范、方便和快捷的方式进行交流。

  • 伴随着晶体管计算机的诞生(上世纪40年代),人们也编写了第一种真正意义上的编程语言,这就是机器语言。

  • 机器语言太难理解和书写,且极易出错,汇编语言(Assembly Language)就应运而生。

    • 使用助记符(Mnemonics)来代替机器指令的操作码(0和1的指令集)
    • 用标号(Label)和地址符号(Symbol)分别来代替机器指令或者操作数值的存储地址
    • 其大体的工作原理在这里插入图片描述
    • 机器语言和汇编语言统称为低级语言(1946—1953年)。
  • 因汇编语言未能实现与自然语言的对接,编程语言进入高级语言时代(1954至今)

    • 1954,John Backus在纽约发布人类第一个高级编程语言FORTRAN(FORmula TRANslator),主要用于做数值/科学计算

    • 1957,第一个FORTRAN编译器在IBM 704计算机上实现,并首次成功运行了FORTRAN程序。

    • 1960年出现了第一个结构化语言Algol(Algorithmic Language),它是算法语言的鼻祖,目的在于纯粹面向描述计算过程,其语

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值