在本篇文章中,我将总结Stata基础知识官方教程,帮助大家快速掌握这些技能。
Stata版本:Stata16
Stata基础
命令基础
* 1. 查看当前工作目录
* 这个命令显示当前的工作目录路径,帮助你了解Stata在哪个文件夹中操作。
pwd
* 2. 更改工作目录
* 如果你想切换到其他目录,可以使用cd命令,后面跟上你想切换到的目录路径。
cd c:\temp
* 3. 列出当前目录中的文件
* 使用ls命令列出当前工作目录下的所有文件。如果你使用的是Windows,命令是dir。如果你使用的是Mac或Linux,则可以使用ls。
ls
* 4. 打开Stata自带的数据集
* Stata自带了一些数据集,你可以通过sysuse命令加载。例如,打开auto.dta数据集(1978年的汽车数据)。
sysuse auto.dta
* 5. 查看数据集的基本信息
* 使用describe命令查看数据集的基本信息,包括变量的名称、类型、格式等。
describe
* 6. 保存数据集
* 你可以通过save命令将当前的数据集保存到本地硬盘。这里保存为myauto.dta。
save myauto.dta
* 7. 如果文件已存在,使用replace选项覆盖文件
* 如果已经存在同名文件并希望覆盖,可以在save命令后加上replace选项。
save myauto.dta, replace
* 8. 清除当前数据集
* 如果你需要清除内存中的数据集,可以使用clear命令。注意,这个命令会删除当前打开的数据集。
clear
* 9. 重新加载数据集
* 使用use命令加载已保存的数据集,例如加载myauto.dta。
use myauto.dta
* 10. 如果想加载新数据集并清除现有数据,可以使用clear选项
* 使用use命令并加上clear选项来清除当前数据集并加载新的数据集。
use myauto.dta, clear
寻求帮助
* 1. 使用 help 命令
* 当你不确定某个命令的用途时,使用 help 命令可以查看该命令的帮助文件。
* 示例:查看 probit 命令的帮助文件。
help probit
* 2. 使用 search 命令
* 如果你想查找关于某个主题或命令的相关信息,可以使用 search 命令。
* 示例:搜索关于 "probit regression" 的所有相关资源(帮助文件、文章、视频等)。
search probit regression
* 3. 限制搜索范围
* 如果你只想查看 Stata PDF 手册中的相关内容,可以使用 manual 选项来限制搜索结果。
* 示例:仅搜索 Stata PDF 手册中的关于 "probit regression" 的内容。
search probit regression, manual
* 4. 查找其他学习资源
* 如果你想查看 Stata 的其他学习资源和支持信息,可以使用 help resources 命令。
* 示例:查看 Stata 相关的学习资源,如书籍、培训课程、论坛等。
help resources
stata自带的数据集
* 1. 查看已安装的示例数据集
* 使用 help dta_examples 命令查看 Stata 中已安装的所有示例数据集。
help dta_examples
* 2. 查看数据集的描述
* 使用 sysdescribe 命令查看指定数据集的描述信息。
* 示例:查看 auto.dta 数据集的内容。
sysdescribe auto.dta
* 3. 加载 Stata 内置数据集
* 使用 sysuse 命令加载 Stata 内置的示例数据集。以下命令加载 auto.dta 数据集。
sysuse auto
* 4. 从 Stata 官网加载数据集
* 使用 webuse 命令从 Stata 官网下载并加载数据集。以下命令加载 apple.dta 数据集。
* 注意:需要互联网连接。
webuse apple, clear
* 5. 查看在线数据集的描述
* 使用 webdescribe 命令查看指定在线数据集的描述信息。
* 示例:查看 apple.dta 数据集的内容。
webdescribe apple
打开部分数据集
通过使用 use 命令中的 if 和 in 选项,以及对变量和观察值进行筛选,Stata 允许你灵活地加载数据集的部分内容。这样可以避免不必要的内存占用,并且更高效地进行数据分析。
* 1. 查看数据集的描述信息
describe using nhanes2l.dta
* 2. 加载部分变量
use diabetes agegrp bmi using nhanes2l
* 3. 加载前1000个观察值
use diabetes agegrp bmi using nhanes2l in 1/1000
* 4. 根据条件加载数据(例如:仅加载region == 1的数据)
use region diabetes agegrp bmi using nhanes2l if region == 1
* 5. 保存部分数据集
save nhanes2l_partial.dta
导入、导出数据
从 Microsoft Excel 导入和导出数据
* 1. 加载示例数据集
sysuse auto
* 2. 将数据导出到 Excel 文件
export excel myauto, sheet(auto) firstrow(variables)
* 3. 查看当前目录中的文件,确认是否保存成功
ls
* 4. 清空当前数据
clear
* 5. 导入 Excel 文件
import excel myauto, sheet(auto) firstrow
* 6. 查看导入的数据
describe
* 7. 保存导入的数据为 Stata 格式
save myauto,replace
从 Microsoft Excel 复制并粘贴数据
* 1. 加载示例数据集
sysuse auto
* 2. 将数据导出到 Excel 文件
export excel myauto, sheet(auto) firstrow(variables)
* 3. 清空当前数据
clear
* 4. 打开数据编辑器
edit
* 5. 在 Excel 中复制数据,粘贴到 Stata 数据编辑器中
* 注意:在 Excel 中选择数据并粘贴到 Stata 时,确保选择 "Treat first row as variable names"
* 6. 保存数据为 Stata 格式
save myauto
导入和导出CSV
使用 import delimited 和 export delimited 命令
* 1. 加载示例数据集
sysuse auto,clear
* 2. 将数据导出为 CSV 文件
export delimited myauto.csv
* 3. 查看当前目录中的文件,确认文件是否导出成功
ls
* 4. 清空当前数据
clear
* 5. 从 CSV 文件导入数据
import delimited myauto.csv
* 6. 查看导入的数据
describe
* 7. 保存数据为 Stata 格式
save myauto,replace
手动输入数据
使用input命令手动输入数据。使用 str12 指定变量类型为字符串,最大长度为 12 个字符。对于数值型变量,可以不指定类型。
clear
* 2. 输入第一个变量(name)
input str12 name
Ringo
John
Paul
George
end
* 3. 执行命令并查看数据
list
* 4. 清空数据并添加第二个变量(birthyear)
clear
input str12 name birthyear
Ringo 1940
John 1940
Paul 1942
George 1943
end
* 5. 添加第三个变量(instrument)
clear
input str12 name birthyear str12 instrument
Ringo 1940 "drums"
John 1940 "guitar"
Paul 1942 "bass guitar"
George 1943 "guitar"
end
* 6. 使用全名和乐器数据
clear
input str12 name birthyear str12 instrument
"Ringo Watts" 1940 "drums"
"John Jagger" 1940 "guitar"
"Paul Wyman" 1942 "bass guitar"
"Geo