数据类型:
我们主要把数据分为以下三个类别:
- Cross-sectional data (Micro-data): 同一个体单元(individual unit) 中的不同观察个 体 (observations) 在同一时间点的数据信息。(Observations on one or more variables taken at the same point in time.)
- Time series data (Macro-data): 在固定时间跨度(time interval)内,同一个个体变 量(variable)在不同时间跨度的数据信息。(Observations on one or more variables taken at different points in time.)
- Panel (Longitudinal data): Cross-sectional data + Time series data.
一般来说对于 Cross-sectional data 和 Time series data。我们总结为一下两个主要区别:
- Cross-sectional data 中的 observations 没有自然排(Natural ordering)。而 Time series data 中的 observations 是有排序的。
- 我们一般假设 Cross-sectional data 设是独立的。而 Time series data 一般都是有相 关性的(temporal dependence)。
根据数据的属性特点,我们主要把数据分为以下两个类别:
- Quantitative (Numerical) data: 细分为 continuous 和 discrete。
- Qualitative (Categorical) data: 细分为 nomial