Python与Stata在数据处理上的区别
在Stata中,数据集的行基本上是无标签的,除了可以用 _n 访问的隐式整数索引。虽然使用标记Index或 MultiIndex可以启用复杂的分析,并且最终是 pandas 理解的重要部分,但是对于这种比较,我们基本上会忽略它, Index并且只是将其DataFrame视为列的集合。pandas 的 DataFrame 可以用许多不同的方式构建,但对于少量的值,通常可以方便地将其指定为Python字典,其中键是列名,值是数据。使用 numpy 的 where 方法可以在 pandas 中完成相同的操作。
复制链接