stata基础使用教程 (操作版)
(视频教程点这里)
文章目录
stata安装教程
Stata16安装教程(有问题先看P3,视频结尾附安装包)_哔哩哔哩_bilibili
stata用户界面介绍
Command窗口
-
往上翻、往下翻:PgUp、PgDn
-
自动补全变量名:Tab
结果显示窗口
-
查找:Edit->Find(Ctrl+F)
-
清屏:右击->Clear results(或Command窗口:cls)
Review回顾窗口
-
筛选:右上角漏斗
-
隐藏错误命令:右上角 “!”
-
单击命令:跑到Command窗口
-
双击命令:直接执行
-
右击选中的命令:有很多操作,如Font可以调整字体
Variables变量窗口
-
多选:点首->Shift->点尾(或Ctrl->点点点点点)
-
双击变量(或点变量最左边小箭头):跑到Command窗口
-
筛选:右上角漏斗
-
Name、Label一行右击:选择显示的内容
-
变量名排序:
- 点击Name一次:按字母表顺序倒向排序
- 点击Name二次:按字母表顺序正向排序
- 点击Name三次:返回原来状态
-
右击选中的变量:有很多操作,如Copy varlist可以复制变量列表
Properties属性窗口
-
变量属性:
- 左上角锁打开可修改
- 左上角左箭头:切换至上一个变量
- 左上角右箭头:切换至下一个变量
-
数据属性:显示整个数据文件的数据整体统计属性
viewer窗口
-
打开viewer窗口:help+命令名
-
查找:左下角Find
窗口控制(可调节窗口)
-
漏斗右边auto hide:自动隐藏或取消
-
拖动窗口:挪位置
-
显示窗口:Ctrl+12345(或Window菜单把窗口点出来)
Statistics菜单
-
Linear models and related->Linear regression(或Command窗口->db regress):线性回归
-
弹出的窗口设置好后:
- OK:执行并关掉窗口
- Submit:执行不关窗口
- 左下角help:命令细则
- 左下角reset:回到初始设置
- 左下角Copy command to Clipboard:复制命令到剪切板上
User菜单
- 可自定义子菜单,一般用的少
- 常用菜单:Data、Graphic、Statistics
log文档:记录操作过程
-
创建:File->Log->Begin(smcl:stata标记和控制语言,help文档和帮助文档就是scml编写的)
-
使用:(把结果显示窗口的全部操作保存在日志文件里)
- log using “文件路径\文件名”,replace smcl
- display “啦啦啦”
- log close
- viewer里打开log文件:左上角File->open->File or URL->OK(一般记事本打开)
stata处理数据全流程(Command窗口或Do文件)
数据的导入和简单管理
- 查看内置数据:File->Example dataset(点use导入)
- sysuse auto, clear:导入数据
- browse:浏览
- describe:数据文件的整体描述
- notes:对数据的笔记,如其来源
- summarize:对所有变量进行统计描述
- summarize 变量名:对某个变量进行统计描述
- summarize 变量名, detail:对某个变量进行详细统计描述
- codebook 变量名:对某个变量进行统计描述
- br if missing(变量名):只查看某个变量的缺失值(或br if 变量名==.)
- list 变量名 if missing(变量名):把符合条件的变量值列在显示窗口(或list 变量名 if 变量名==.)
- ssc uninstall 命令名:卸载命令
数据的描述性统计和作图分析
-
tabulate 变量名:一维列联表分析
-
tabulate 变量名1 变量名2:二维列联表分析
-
summarize(或sum)变量名 if 条件:对某个变量符合条件的值进行统计分析
-
by命令:前置命令
- 如:by 变量名1, sort:sum 变量名2(根据变量1的分类分别列表对变量2进行总结)
- 如:by 变量名1, sort:correlate 变量名2 变量名3(根据变量1的分类分析变量2与变量3之间的相关性)
-
t检验:比较两个平均数差异是否显著
-
ttest 变量名1, by(变量名2)(根据变量2的分类对变量1进行t检验)
-
correlate 变量名1 变量名2 …:分析多个变量之间的相关性
-
twoway:二维图像
- 如twoway(scatter 变量名1 变量名2):画散点图
- 如twoway(scatter 变量名1 变量名2)(lfit 变量名1 变量名2):画散点图和拟合图在一张画布上
- 如twoway(scatter 变量名1 变量名2)(lfit 变量名1 变量名2), by(变量名3):根据变量名3的分类,分别画散点图和拟合图在一张画布上
数据的回归分析
- 如回归模型:mpg=beta_0+beta_1 weight+beta_2 weight^2+beta_3 foreign+e
- generate 变量名3=变量名2^2
- regress 变量名1 变量名2 变量名3 变量名4
- predict 变量名5:生成拟合值
- predict 变量名6:生成参差
- 对变量2进行排序:sort 变量名2
- 画图显示拟合效果:twoway(scatter 变量名1 变量名2)(line 变量名5 变量名2), by(变量名4)
语法
基本命令
-
help:
- help 命令名:查看命令用法
- help functions:查看函数
- 命令名下横线:命令名最简写形式,比其再长点也行
- 蓝色字都可以点去学习
-
命令:
- list
- generate:gen model=substr(make,strpos(make,“ ”)+1,.)
- replace:replace model=make in 1/20 (接上面)
- keep
- expand 2000:扩充2000
- set more off:不用more,把数据全列出
- clear:clear、clear all
- count
- display:display r(N)
- quiet:quiet count
- drop:drop 变量名、drop in 1/20
-
if、in:
- if 判断语句
- in 1/20:列出前20行
-
选项:
separator(10):默认每5个值画线分开
-
变量:
如m*匹配所有m开头的变量
-
注意事项
- 判断语句一般加括号
- 值标签不加引号
画图命令
-
维度命令:
- twoway(graph_twoway):二维图
- surface :三维图(一般用Python画)
- graph3d:3D画图
-
画图命令
- scatter
- qfit
- lfit
-
if、in
- if 判断语句
- in 1/20:列出前20行
-
选项
- title
- by
-
Graph Editor
- 在图像显示窗口修改图像(不建议用)
- 修改大小、颜色可以
. graph3d:3D画图
-
画图命令
- scatter
- qfit
- lfit
-
if、in
- if 判断语句
- in 1/20:列出前20行
-
选项
- title
- by
-
Graph Editor
- 在图像显示窗口修改图像(不建议用)
- 修改大小、颜色可以