Chapter1
- 数据库(Database,DB):一般指数据的集合。
- 数据库管理系统(Database Management System,DBMS):数据库及其管理软件构成数据库管理系统。
- 数据库系统(Database System,DBS):数据库管理系统及其运行的软硬件环境、手册、操作人员…
- 关系模型一般包括关系数据结构、数据关系操作、数据完整性约束
- 关系型数据库和非关系型数据库都是数据库管理系统的具体形式。
- 非关系型数据库:Nosql–>Not only sql -->No More sql
- 数据库应用系统(Database Application System,DBAS):数据库管理系统支撑下建立的计算机应用系统
- 关系型数据库管理系统功能:
- 数据定义:提供数据定义语言(DDL,Data Definition Language),用于建立、修改数据库的库、表结构或模式,将结构或模式信息存储在数据字典当中。
- 数据操作:提供数据操作语言(DML,Data Manipulation),用于增加(Create)删除(Delete)更新(Update)查询(Retrieve)
- 数据的持久存储、组织和维护、管理
- 保护和控制:支持多用户对数据的并发控制,支持数据库的完整性、安全性,支持从故障和错误中恢复数据
- 通信与交互接口:可以实现高效存取数据,实现数据库与其他软件、数据库之间通信
- 简单的、非过程化的高级语言(SQL)
- 关系型数据库一般提供对事务的支持。事务是指一组数据操作必须作为一个整体来执行,一组操作要么全部完成,要么全部取消。
- 关系型数据库事务正确执行需要满足ACID四个特性。Atomicity(原子性):保证一组操作要么都成功要么都不做。Consistency(一致性):事务开始之前和结束之后,事务完整性没有遭到破坏。Isolation(隔离性):多个事物并发访问时,事物之间是隔离的。During(持久性):事务执行成功后,更改的数据将永远保存在数据库中,不会回滚。
- 横向扩展:采用多个计算机组成集群对数据进行存储和管理。
- 纵向扩展:升级硬件配置,提升处理能力。
- 集群的特征:
- 能够对集群内的计算机及其计算存储资源进行统一的管理、调度、监控。
- 能够在集群中对对数据进行分散的存储和统一的管理。
- 能够向集群指派任务,能够将任务并行化,使集群内的计算机可以分工协作、负载均衡。
- 利用集群执行所需的数据查询和操作时,性能远超单独的高性能计算机。
- 当集群众中的少量计算机或局部网络出现故障时,集群性能虽略有降低仍然可以保持功能的有效性,且数据不会丢失,即有很强的分区容错性。
- 可以用简单的方式部署集群、扩展集群,以及替换故障节点,即具有很强的伸缩性。
- nosql特点:
- 没有统一模型,弱化关系,目的在于去掉约束。
- 不适用于复杂查询。
- 流行的Nosql软件很多诞生在互联网领域中,主要为满足互联网业务需求而生。
- Nosql软件一般是开源免费的。
- Nosql一般特征:集群部署的、非关系型的、无模式的、通常是开源的数据库。
- Newsql和nosql区别:Newsql是在传统关系型数据库基础上,吸收nosql优点而形成。Newsql被描绘成既支持关系数据模型和强事务机制,也支持分布式并行结构的数据库(具有良好的伸缩性和容错性)形式,可以通过sql语句进行查询。
- newsql综合两者优点,是关系型数据库的延伸。
- Nosql应用场景:
-海量日志数据、业务数据或监控数据的管理和查询
-特殊的或复杂的数据模型的简化处理
-作为数据仓库、数据挖掘系统或OLAP系统的后台数据支撑。 - 大数据特征:Volume大容量(数据总量大)、Variety多样化(数据格式不同、领域不同、可以对半结构化和非结构化数据进行处理)、Velocity高速率、Value有价值(价值密度低)-------Veracity(真实性)
- 数据本身不产生价值,对数据的使用和分析能产生价值。
- 大数据强调使用全部数据而非局部、抽样的数据。
- 数据采集可分为在线数据和离散数据。在线采集指直接监视数据变化,以实时或准实时方式将产生的新数据获取。离线采集指定期将数据从数据源上传到大数据系统。
- 列举Nosql数据库并简单描述其特点:
Nosql数据库及特点