【Stata】从入门到精通.零基础小白必学的教程,一学就fei

视频教程移步:https://www.bilibili.com/video/BV1hK4y1d714/?p=4&spm_id_from=pageDriver&vd_source=cc8074e9c81a225f214226065db53d32

P3 第二讲 Stata处理数据全流程(上) P3 - 01:37



内置数据 file example datasets

使用command 编辑命令

sysuse auto, clear





P3 第二讲 Stata处理数据全流程(上) P3 - 03:41



浏览数据 browse

横的是变量 竖的是观测值

红色是字符串 黑色是数字 蓝色是值标签value lable赋值之后方便处理



P3 第二讲 Stata处理数据全流程(上) P3 - 05:45



描述数据 describe

观测值obs 变量数vars 大小size

显示格式 display format 变量标签 variable label 解释变量的含义



P3 第二讲 Stata处理数据全流程(上) P3 - 06:51



查看notes

command 输入notes



P3 第二讲 Stata处理数据全流程(上) P3 - 07:39



呈现数据 summarize

obs观测值若有比其他变量是少的,证明有缺失值(一个极大的数)

准确查看某变量

codebook rep78

类别 numberic 数字型 int整型

range 范围 units单位值 unique values不同的值

missing . 缺失值个数

Freq. 出现的频次 value值 . 表示缺失



P3 第二讲 Stata处理数据全流程(上) P3 - 10:57



只查看缺失值

br if missing (rep78) \ br if rep78 == .



P3 第二讲 Stata处理数据全流程(上) P3 - 12:21



list 列示数据

list rep78 if rep78 == .

不使用 list 时

弹出窗口 表格复杂

使用list

在结果窗口直接展示 直观

【全流程 中】



P4 第二讲 Stata处理数据全流程(中) P4 - 01:45



查看数据 summarize price

详细查看 summarize price, detail

50% 中位数



P4 第二讲 Stata处理数据全流程(中) P4 - 03:30



查看频数分布 tabulate foreign

查看二维变量频数分布 tabulate rep78 foreign



P4 第二讲 Stata处理数据全流程(中) P4 - 06:44



summarize 简写是sum

sum mpg if foreign == 0

前置命令 by

by foreign, sort: sum mpg

mean 表示平均值



P4 第二讲 Stata处理数据全流程(中) P4 - 07:54



假设检验 ttest mpg by (foreign)

分析相关性 correlate mpg weight

弹出来的二乘二表格中 两变量交汇处负值表示负相关(也可以分析多个变量)

按照某变量分类分析相关性

by foreign, sort: correlate mpg weight



P4 第二讲 Stata处理数据全流程(中) P4 - 11:40



twoway (scatter weight length) (lfit weight length)

此处twoway 是画二维图像的命令,每个括号相当于图层, weight 和 length 是变量

scatter是散点图 llift是拟合出来的直线图

twoway (scatter weight length) (lfit weight length), by(foreign) 加入此命令可以分类显示图像

【全流程 下】

没看懂 不知道记啥

【viewer 窗口介绍】

主要功能

浏览帮助文件 help 某命令

(。・・)ノ若没有本地命令,viewer会自动在互联网中搜索来安装命令

类似浏览器的 蓝色链接跳转功能

find 在左下角的↙查找功能



P6 第三讲 Viewer窗口的介绍 P6 - 04:55



log文档的使用

在写命令前,先打开log begin,保存smcl后缀文件

然后进行操作 最后关闭log ,log close

整个log文档操作过程就全部记录在log文档了

而log后缀的文件可以不需要用viewer窗口直接用记事本打开(相当于txt文件)

【数据列示和基本命令语法】



P7 第四讲 数据列示和基本命令语法 P7 - 01:31



数据列示的命令 list 查找用法,help文档

  • 中括号里面的选项可填可不填

  • list 不接变量时显示所有数据,接几个变量列示几个数据

  • 命令下面的下划线 list 表示最简写的本命令

  • 即 l li lis list 都可以代表命令list



P7 第四讲 数据列示和基本命令语法 P7 - 04:44



  • 搭配通配符

  • list m* 列示所有m开头的变量

  • list price-weight 列示price 到weight所有的变量



P7 第四讲 数据列示和基本命令语法 P7 - 05:56



  • if 与 运算符

  • list price if (price <= 1000)

  • list price if (price<4000) & (price >3500)

  • if help文档中,有运算符介绍

  • == 等于 != 不等于

  • & and



P7 第四讲 数据列示和基本命令语法 P7 - 08:59



  • 在有值标签的变量下,if forign == 1 才是对的

  • 因为文字形式只是其描述而真正的值是数字



P7 第四讲 数据列示和基本命令语法 P7 - 09:25



  • in (一般表示范围)

  • list price in 1/20 (列出前二十个观测值)

  • (。・・)ノ若运算量过大,显示more选项,点击more查看更多或输入 set more off 关闭该模式

  • break按钮 终止运算

【生成新变量】

两个重要命令

generate 生成全新变量(简写为gen)

gen rep78_2 = rep78 ^ 2

gen rep78_2 = sqrt(rep78)

gen不能生成已有函数,对已有的修改需要用下面这个

replace 对原有变量修改

replace model = make in 1/20

注意此处等于号是赋值,把make的观测值赋值给了model

【删除变量和观测值】

clear 删除变量

全部删除 clear all

drop

接变量直接删除该变量以及观测值

接in 1/20 则删除所有变量前二十位(1/20指第一到第二十位)

keep

通过删除其他变量起到保留的作用

使用方法和drop对应

【stata作图】

二维图像 twoway

  • 0
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Bonefire20

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值