stata中计算公式命令_STATA使用教程第四章——数据处理和数据运算

本文介绍了STATA中关于数据处理和运算的基本操作,包括变量名的规则、变量标签与数值标签的设置、数据存储类型、缺失值处理、变量排序、新变量生成与赋值、虚拟变量创建、数值与字符变量的转换以及系统变量的使用。还讲解了如何通过generate、replace、recode等命令进行数据操作,并强调了数据选择在内存中的重要性。
摘要由CSDN通过智能技术生成

变量名

由英文字符,数字和下划线组成,且数字不能作为开始字符,用户最好不要使用字符e作为变量名,因为这与指数表达式中的e难以区分

在stata中所有的变量名都可以使用变量名当中排列在前面的字符串来指代。

变量标签

当数据中的变量有标签之后,stata在给出的结果(包括表格和图形中),将使用变量标签,而非变量名。

变量的数值标签

给变量的各个取值(通常也是由数字表示的)添加的说明,一共包含两步,首先,定义一个标签,然后把这个标签附加在变量上。

数字格式数据的存储类型

所占空间 数位精确度

byte 1

byte 2

int 2

bytes 4

long 4

bytes 9

float 4 7

double 8 16

缺失数据

在stata中,缺失值的默认表示方法是一个.

对于缺失数值,缺失值可以被认为是无穷大,这一点异常重要;

对于字符缺失值,缺失值被当做是数字取值,因此,如果按照字母顺序,缺失值则排在所有字符取值之前。

变量排序

order move 命令

生成新变量与变量赋值

generate命令式生成新的变量 replace则是修改现有的变量的取值

recode命令式直接更改原有的变量,而generate和replace的组合则是保留原有变量,而生成一个新的变量;

使用算术运算来重新赋值

虚拟变量的生成

使用generate、replace与recode命令

针对类别变量使用tabulate命令

针对二分变量使用算术运算

使用快捷方法

数值变量与字符变量的转换

从字符变量到数值变量,使用encode

从数值变量到字符变量,decode命令

系统变量

_b 是指在最近模型估算之后得到的系数

_cons 是指最近模型估算之后得到的常数项

_n是指当前观察个案所对应的个案数

_N 是指整个数据中的观察个案数

_pi圆周率的数值

_se 是指模型估算之后得到的系数的标准误

_result是指当前的特定的Stata运算结果中的统计量

使用函数生成新的变量

generate与egen 都可以用函数来生成新的变量,后者是前者的扩展形式。

数据的选择

数据的选择是在内存中完成的,没有涉及到更改硬盘中原始的数据。

保留或值删除观察个案

保留或是删除变量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值