数据分析与可视化(一)
- 1.1 数据分析
-
- 1.1.1 数据、信息与数据分析
- 1.1.2数据分析与数据挖掘的区别
- 1.1.3数据分析的流程
- 1.2 数据可视化
- 1.3 数据分析与可视化常用工具
-
- 1.4 Python数据分析与可视化常用类库
1.1 数据分析
1.1.1 数据、信息与数据分析
数据 :
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。
信息 :信息是数据的内涵,信息是加载于数据之上,对数据作具有含义的解释。(用来消除不确定性)
数据和信息是不可分离的,信息依赖数据来表达,数据则生动具体表达出信息。
- 数据是符号,是 物理性 的,信息是对数据进行加工处理之后得到并 对决策产生影响的数据 ,是 逻辑性 和 观念性 的;
- 数据是信息的表现形式,信息是数据有意义的表示 。数据是信息的表达、载体,信息是数据的内涵,是 形与质的关系 。
- 数据本身没有意义,数据只有对实体行为产生影响时才成为信息。
数据分析
:数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,为提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析有狭义和广义之分。
狭义的数据分析
是指根据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法对搜集来的数据进行处理与分析提取有价值的信息,发挥数据的作用,并得到一个统计量结果的过程。
广义的数据分析
是指针对搜集来的数据运用基础探索、统计分析、