热力图
数据表里多个特征两两的相似度
- 输入数据参数:
矩阵,array, dataFrame(df)
df.index, df.column = heatmap.column, heatmap.rows
vmax,vmin 对应颜色取值的范围 - 热力图矩阵块注释参数annot
数据库
传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
数据库通常追求交易的速度,交易完整性,数据的一致性,数据库比较流行的有:MySQL, Oracle, SqlServer等。
数据库(Database)的特点是:
- 相对复杂的表格结构,存储结构相对紧致,少冗余数据。
- 读和写都有优化。
- 相对简单的read/write query,单次作用于相对的少量数据。
数据仓库
数据仓库系统的主要应用主要是OLAP(On-Line Analytical Processing),支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果,据仓库强调数据分析的效率,复杂查询的速度,数据之间的相关性分析。数据仓库 比较流行的有:AWS Redshift, Greenplum, Hive等
- 相对简单的(Denormalized)表格结构,存储结构相对松散,多冗余数据。
- 一般只是读优化。
- 相对复杂的read query,单次作用于相对大量的数据(历史数据)。
面向主题的,集成的,是变得,非易失的
包装程序和一个继承程序,将数据库分离。
两者对比
- 从存储空间角度讲,相比于数据库紧密的存储结构,数据仓库则存在大量冗余重复的数据。
2.数据仓库相当于牺牲了空间换取了查询效率。
3 读写操作,数据仓库的写操作都是整段(表)刷新或者整段数据插入。