【Stata学习笔记】Stata入门+代码

Love__Tay

已于 2025-02-11 20:36:08 修改

阅读量2.9k

点赞数 28

文章标签：笔记数据分析数据可视化线性回归

于 2025-02-11 20:34:22 首次发布

本文链接：https://blog.csdn.net/Love__Tay/article/details/145566289

版权

Stata基础

命令基础

* 1. 查看当前工作目录
* 这个命令显示当前的工作目录路径，帮助你了解Stata在哪个文件夹中操作。
pwd

* 2. 更改工作目录
* 如果你想切换到其他目录，可以使用cd命令，后面跟上你想切换到的目录路径。
cd c:\temp

* 3. 列出当前目录中的文件
* 使用ls命令列出当前工作目录下的所有文件。如果你使用的是Windows，命令是dir。如果你使用的是Mac或Linux，则可以使用ls。
ls

* 4. 打开Stata自带的数据集
* Stata自带了一些数据集，你可以通过sysuse命令加载。例如，打开auto.dta数据集（1978年的汽车数据）。
sysuse auto.dta

* 5. 查看数据集的基本信息
* 使用describe命令查看数据集的基本信息，包括变量的名称、类型、格式等。
describe

* 6. 保存数据集
* 你可以通过save命令将当前的数据集保存到本地硬盘。这里保存为myauto.dta。
save myauto.dta

* 7. 如果文件已存在，使用replace选项覆盖文件
* 如果已经存在同名文件并希望覆盖，可以在save命令后加上replace选项。
save myauto.dta, replace

* 8. 清除当前数据集
* 如果你需要清除内存中的数据集，可以使用clear命令。注意，这个命令会删除当前打开的数据集。
clear

* 9. 重新加载数据集
* 使用use命令加载已保存的数据集，例如加载myauto.dta。
use myauto.dta

* 10. 如果想加载新数据集并清除现有数据，可以使用clear选项
* 使用use命令并加上clear选项来清除当前数据集并加载新的数据集。
use myauto.dta, clear

寻求帮助

* 1. 使用 help 命令
* 当你不确定某个命令的用途时，使用 help 命令可以查看该命令的帮助文件。
* 示例：查看 probit 命令的帮助文件。
help probit

* 2. 使用 search 命令
* 如果你想查找关于某个主题或命令的相关信息，可以使用 search 命令。
* 示例：搜索关于 "probit regression" 的所有相关资源（帮助文件、文章、视频等）。
search probit regression

* 3. 限制搜索范围
* 如果你只想查看 Stata PDF 手册中的相关内容，可以使用 manual 选项来限制搜索结果。
* 示例：仅搜索 Stata PDF 手册中的关于 "probit regression" 的内容。
search probit regression, manual

* 4. 查找其他学习资源
* 如果你想查看 Stata 的其他学习资源和支持信息，可以使用 help resources 命令。
* 示例：查看 Stata 相关的学习资源，如书籍、培训课程、论坛等。
help resources

在这里插入图片描述

stata自带的数据集

* 1. 查看已安装的示例数据集
* 使用 help dta_examples 命令查看 Stata 中已安装的所有示例数据集。
help dta_examples

* 2. 查看数据集的描述
* 使用 sysdescribe 命令查看指定数据集的描述信息。
* 示例：查看 auto.dta 数据集的内容。
sysdescribe auto.dta

* 3. 加载 Stata 内置数据集
* 使用 sysuse 命令加载 Stata 内置的示例数据集。以下命令加载 auto.dta 数据集。
sysuse auto

* 4. 从 Stata 官网加载数据集
* 使用 webuse 命令从 Stata 官网下载并加载数据集。以下命令加载 apple.dta 数据集。
* 注意：需要互联网连接。
webuse apple, clear

* 5. 查看在线数据集的描述
* 使用 webdescribe 命令查看指定在线数据集的描述信息。
* 示例：查看 apple.dta 数据集的内容。
webdescribe apple

打开部分数据集

通过使用 use 命令中的 if 和 in 选项，以及对变量和观察值进行筛选，Stata 允许你灵活地加载数据集的部分内容。这样可以避免不必要的内存占用，并且更高效地进行数据分析。

* 1. 查看数据集的描述信息
describe using nhanes2l.dta

* 2. 加载部分变量
use diabetes agegrp bmi using nhanes2l

* 3. 加载前1000个观察值
use diabetes agegrp bmi using nhanes2l in 1/1000

* 4. 根据条件加载数据（例如：仅加载region == 1的数据）
use region diabetes agegrp bmi using nhanes2l if region == 1

* 5. 保存部分数据集
save nhanes2l_partial.dta

导入、导出数据

从 Microsoft Excel 导入和导出数据

* 1. 加载示例数据集
sysuse auto

* 2. 将数据导出到 Excel 文件
export excel myauto, sheet(auto) firstrow(variables)

* 3. 查看当前目录中的文件，确认是否保存成功
ls

* 4. 清空当前数据
clear

* 5. 导入 Excel 文件
import excel myauto, sheet(auto) firstrow

* 6. 查看导入的数据
describe

* 7. 保存导入的数据为 Stata 格式
save myauto,replace

从 Microsoft Excel 复制并粘贴数据

* 1. 加载示例数据集
sysuse auto

* 2. 将数据导出到 Excel 文件
export excel myauto, sheet(auto) firstrow(variables)

* 3. 清空当前数据
clear

* 4. 打开数据编辑器
edit

* 5. 在 Excel 中复制数据，粘贴到 Stata 数据编辑器中
* 注意：在 Excel 中选择数据并粘贴到 Stata 时，确保选择 "Treat first row as variable names"

* 6. 保存数据为 Stata 格式
save myauto

导入和导出CSV

使用 import delimited 和 export delimited 命令

* 1. 加载示例数据集
sysuse auto,clear

* 2. 将数据导出为 CSV 文件
export delimited myauto.csv

* 3. 查看当前目录中的文件，确认文件是否导出成功
ls

* 4. 清空当前数据
clear

* 5. 从 CSV 文件导入数据
import delimited myauto.csv

* 6. 查看导入的数据
describe

* 7. 保存数据为 Stata 格式
save myauto,replace

手动输入数据

使用input命令手动输入数据。使用 str12 指定变量类型为字符串，最大长度为 12 个字符。对于数值型变量，可以不指定类型。

clear

* 2. 输入第一个变量（name）
input str12 name
  Ringo         
  John          
  Paul          
  George        
end

* 3. 执行命令并查看数据
list

* 4. 清空数据并添加第二个变量（birthyear）
clear
input str12 name birthyear
  Ringo 1940               
  John 1940               
  Paul 1942               
  George 1943            
end

* 5. 添加第三个变量（instrument）
clear
input str12 name birthyear str12 instrument
  Ringo 1940 "drums"                       
  John 1940 "guitar"                       
  Paul 1942 "bass guitar"                  
  George 1943 "guitar"                     
end

* 6. 使用全名和乐器数据
clear
input str12 name birthyear str12 instrument
  "Ringo Watts" 1940 "drums"               
  "John Jagger" 1940 "guitar"              
  "Paul Wyman" 1942 "bass guitar"         
  "Geo