stata基本指令

//写在前面:做笔记用

切换数据集一定要用clear!!

命令结构:
[by varlist:]command [ ] [ ] [ ] [,option] //“,”是可选项的意思,但还是不太明白和前面不带都逗号的区别

log uising “”
set more on //显示开头,自己翻页
set more off

审视数据
d //查看所有变量名称及类型
list s lnw //查看某一变量数据
list s in 1/5 //1/5表示[1,5] 用斜杠表示很新颖!
     |  s |
     |----|
  1. | 12 |
  2. | 16 |
  3. | 14 |
  4. | 12 |
  5. |  9 |
     +----+
//排序
sort s
list s
gsort -s //gsort “-”倒序
list s 
数据计算gen+运算命令


在这里插入图片描述
图片来自于《stata软件教程(人大十八讲)》
图片来自于《stata软件教程(人大十八讲)》

拓展:gen与egen 生成逻辑变量
gen y=sum(tenure)//列表显示:累积求和
list y
egen z=sum(tenure)//一列全是sum
list z
gen p1=(price>=.27) //生成逻辑变量(虚拟)

结果:
在这里插入图片描述

统计分析
sum x[,detail] //",d"查看细节
 sum s
 

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
           s |        758    13.40501    2.231828          9         18
sum s,d //d(detail详细的描述性统计
(分位数)

tabulate price //经验分布函数,显示频率、百分比和累计百分比
. tabulate price //经验分布函数,显示频率、百分比和累计百分比

      price |      Freq.     Percent        Cum.
------------+-----------------------------------
        .26 |          1        3.33        3.33
       .262 |          1        3.33        6.67
    ……略
       .287 |          3       10.00       96.67
       .292 |          1        3.33      100.00
------------+-----------------------------------
      Total |         30      100.00

相关系数矩阵pwcorr

[,sig star]


. pwcorr consumption price income temp,sig star(.05)

             | consum~n    price   income     temp
-------------+------------------------------------
 consumption |   1.0000 
             |
             |
       price |  -0.2596   1.0000 
             |   0.1660
             |
      income |   0.0479  -0.1075   1.0000 
             |   0.8014   0.5719
             |
        temp |   0.7756* -0.1082  -0.3247   1.0000 
             |   0.0000   0.5692   0.0800
             |

//相关系数:“pwcorr”表示“pairwise correlation”(两两相关)//“sig”表示显示相关系数的显著性水平(即p 值)//star(.05)”表示给所有显著性水平小于或等于 5%的相关系数打上星号。
  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
回归模型在统计学和数据分析领域是用来建立因变量与一个或多个自变量之间的关系的一种方法。在 Stata 这种流行的统计软件中,可以利用多种命令来进行回归分析。 ### 使用 Stata 进行线性回归的基本步骤: #### 线性回归(Linear Regression) 如果你想要进行简单或多元线性回归分析,Stata 提供了 `regress` 命令。假设你要研究学生的 GPA(Grade Point Average)如何受到SAT分数的影响,并控制一些其他因素如性别、种族等,则可以使用以下命令: ```stata regress GPA SAT gender race ``` 这里,“GPA”是你想要预测的目标变量;“SAT”,“gender”,和“race”分别是自变量。你可以根据需要添加更多自变量到列表中。 #### 指定模型选项 除了基本的回归外,还可以指定模型选项,例如: - `robust`: 计算 robust 标准误差,这在数据存在异方差时更为可靠。 - `cluster`: 当观察值是分组的,比如在面板数据中,可以选择 `cluster(group_var)` 来处理群内相关性。 示例: ```stata regress GPA SAT gender race, robust ``` 或者 ```stata xtset id time xi: regress GPA i.year SAT, vce(cluster id) ``` 这里的 `vce(cluster id)` 表示按 `id` 分组计算标准误。 ### 其他类型的回归模型 #### 对数回归(Logarithmic Regression) 如果数据呈现出对数趋势,可以考虑对其中一个或多个变量取对数。 ```stata regress log(GDP) population year ``` #### 多元聚类回归(Multinomial Logistic Regression) 如果因变量是名义型的并且有三个及以上的类别,则可以使用 `mlogit` 命令。 ```stata mlogit outcome var1 var2 var3 ``` #### 单变量回归(Univariate Regression) 如果你仅想查看一个变量与另一个变量的关系而不进行调整,则使用 `scatter` 或 `twoway`. #### 面板数据回归(Panel Data Regression) 面板数据涉及时间序列数据和个人(或单位)的数据集合。可以使用 `xtreg` 命令进行固定效应或随机效应估计。 ```stata xtset id time xtreg GDP SAT, fe // 固定效应 ``` --- ### 相关问题: 1. 在 Stata 中如何验证回归结果的有效性? 2. 如何在 Stata 中应用交互项(interaction terms)于回归分析? 3. 使用 Stata 实施二阶段最小二乘法(2SLS)回归分析的方法是什么? 通过回答这些问题,可以帮助用户更全面地掌握在 Stata 中进行各种回归分析的方法和技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值