概述
ß面向零基础、或有此稍有了解的学员*知识点讲解,结合代码演示*mySQL和R语言
ß数据库、数据仓库、可视化表达R语言
ß数据分析(线性回归、逻辑回归)
ß数据挖掘(决策树、聚类、关联规则、神经网络)
一、数据库与数据仓库
数据
ß数据是描述事物的符号记录。除了常用的数字外、文字(包括编码)、图形、图像、声音等信息,也都是数据。
ß在计算机中,为了存储和处理这些事物,就要抽出对这些事长年累月感兴趣的特征组成一个记录来。
数据库
ß数据库(Database,简记为DB),是长期存储在计算机内、有组织的、统一管理的相关数据的集合。
ß数据库的完整定义:
Þ数据库是存储在一起的相关数据的集合,这些数据是结构化的,无不必要的冗余,并为多种应用服务;
Þ数据的存储独立于使用它的程序;
Þ对数据库中数据的增、删、改、查均能按一种公用的和可控制的方式进行。
数据库管理系统
ß数据库管理系统 数据库管理系统(DBMS),是位于用户与操作系统(OS)之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。
ßDBMS总是基于某种数据模型,可以分为层次型、网状型、关系型和面向对象型等。
为什么需要数据库?
ß为什么要把数据保存在硬盘上?
Þ持久保存
Þ内存不够大……
ß为什么不直接用数据文件?
Þ二维表更直观,更符合人们的操作习惯
ÞACID特点