阅读全文:Stata数据处理:清除命令介绍和对比-clear-drop-discard (lianxh.cn)
作者:唐林 (苏州大学)
邮箱:tlwork77@163.com
1. 命令介绍
1.1 clear 命令介绍
clear
命令用于清除 Stata 内存中的数据。该命令功能强大,应用广泛,基本可清除 Stata 内所有数据。
clear
clear [meta|results|matrix|programs|ado|rngstream|frames|collect]
clear [all|*]
其中,clear
表示清除 Stata 内存中的数据集合和数据标签。clear all
和 clear *
表示对 Stata 内存中的任何使用痕迹全部清除,两者效果一致。此外,常用的 clear results
表示清除 Stata 中的回归结果,clear ado
表示清除自动加载的 ado 编辑器。
为更清晰的了解 clear
命令的运行。接下来将首先介绍 Stata 的工作机制,以此为基础来详细地解释 clear
、drop
和 discard
命令。
1.2 Stata 工作机制
一般而言,在 Stata 中输入 use
命令,可以实现复制硬盘中所储存的数据至 Stata 的内存中。在这块内存中, Stata 会自动细分不同的板块以此单独储存 Data 、Matrix 、Frames 和返回值等等内容。
在这种情况下,clear
命令的使用可以分为以下两种情况:
第一种情况:clear 房间类型
。如前所述,启动 Stata 时,电脑会分配给 Stata 一块内存空间 (一座大房子)。Stata 会把大房子分成若干个小房间,分类存储 Data、Matrix、返回值、程序等对象。好处是易于分类管理与调取,可以清除指定内容,进而释放内存。若想清空某个小房间,可以使用 clear 房间类型
命令,常用的如下:
clear
:清空内存中的数据 (分配给 Stata 的内存中的 Data 那一块空间);clear matrix
:清空内存中的矩阵对象;clear results
:清空内存中的返回值,如r(mean)
、r(N)
、e(r2)
等;clear ado
:清除内存中的 ado 文档;clear all
:清空分配给 Stata 的 所有内存空间。
第二种情况:use "D:/myData/auto.dta", clear
。clear
选项虽然放在命令的末尾,但却是先清空内存中的数据文件。上述命令等价于以下命令:
clear
use "D:/myData/auto.dta"
然后,Stata 从硬盘 (D:/myData/) 拷贝 auto.dta,将其副本读入内存。
- 好处:速度快。后续分析都以此副本数据为基础,不需要反复从硬盘中读数据;
- 坏处:无法处理大数据 (取决于你的内存大小)。