- 博客(20)
- 资源 (2)
- 收藏
- 关注
原创 大样本OLS模型假设及R实现
异方差1. 异方差的后果(1) OLS 估计量依然无偏、一致且渐近正态。因为在证明这些性质时,并未用到“同方差”的假定。(2) OLS 估计量方差表达式不再是原表达式,t检验,F检验失效;也就是说,你的得到的t值,F值错误。(3) 高斯-马尔可夫定理不再成立,OLS 不再是 BLUE(最佳线性无偏估计)。也就是得到的方程不是最佳的。2. 异方差的检验(1)直观法——绘制残差图(2)3. 异方差的处理(1)使用OLS+稳健标准误(2)加权最小二乘法(WLS)、可行加权最小二乘法(FW
2020-09-24 11:30:11 4780 1
原创 多元线性回归模型及stata实现:总论
多元线性回归方程及stata实现一、模型Y=β0+β1X1+β2X2+⋯+βnXn+eY: Dependent variable(因变量、应变量、反应变量、响应变量、被解释变量等)X1、X2⋯Xn:Independent variable(自变量、解释变量、控制变量)如果重点探究一个因素与另一个因素的作用时,纳入模型的其他X通常称为叫控制变量β1、β2⋯βn:偏回归系数、回归系数e: 残差项、残差、扰动项等(代表不包含在模型中的解释变量和其他一些随机因素对被解释变量的总影响项)残差的性质非
2020-06-30 20:49:53 45302 8
原创 stata代码笔记,随时更新
stata1.stata计数函数***产生新变量var1,其值为ID的重复次数 bysort ID: egen var1=count(ID)2.stata去重***删除ID重复的观测值,只保留不重复的观测值 duplicates drop ID ,force3.stata结果导出为doc***安装asdocssc install asdoc, replace***例1,把...
2020-05-03 10:57:07 11934 1
原创 自然语言处理、文本处理笔记
准备工作安装nltk packages下载和安装nltk资料库import nltknltk.download()运行上述命令,发现无法下载,但可以找到安装路径解决办法:本地下载packages存入该地址,也可以在D盘新建nlkt_data地址(python会在好几个默认地址自动寻找packages),存入D:/nlkt_data地址下运行from nltk.book import *出现text1 ~ text9,则表示安装成功,可以使用。正式开始NLKT(基于pyc
2022-04-14 18:06:05 1297
原创 科研绘图小字典
本来打算对常见图表的名称及用途做一个介绍的,但实在是太多了,给大家一些网址自己查吧,相当于查图的图典。The R Graph Gallery 网址 :https://r-graph-gallery.com/index.htmlData to Viz 网址 : https://www.data-to-viz.com/网址 : https://datavizproject.com/中文的,图之典 网址 : http://tuzhidian.com/蚂蚁数据可视化 网址 : https://ant
2022-04-07 15:15:52 5678 1
原创 R语言数据处理——基于tidyverse (一)
子集的选取——基于tidyverse准备工作1 选取行子集1.1 slice :根据行特征选取行子集1.2 filter :按条件选取行子集2. 去除重复行3 选取列子集the end准备工作(1)安装tidyverse,用于数据处理install.packages("tidyverse")(2)运用R及相关包库及帮助文件进行学习?filter # 查看filter帮助文件 ?slice # 查看slice帮助文件??select # 查看select帮助文件,
2022-03-23 18:03:46 2915
原创 MySql学习笔记(一)
预备MySql安装 参加大佬 https://blog.csdn.net/weixin_44949135/article/details/106661080MySql安装示例数据 参加大佬 https://blog.csdn.net/kikajack/article/details/801812631. 基础1.1 注释1.单行注释可以使用#注释符,#注释符后直接加注释内容。格式如下:#注释内容2. 单行注释可以使用--注释符,--注释符后需要加一个空格,注释才能生效。格式如下:-- 注释
2022-03-14 10:15:49 1040
原创 Stata重复与去重
我们在处理数据的时候,经常会遇到观测值(数据中,每一行叫一个观测值)有重复的情况;有些时候这些观测值是有差别的,而这些差别有可能要关注,也有可能不关注。下面我们来看一下下图的数据,我截取了某调查数据的一小部分。第一列是Iid,第二列是调查时间,第三列是年龄,第四列是性别。如果我们只看id,我们会发现这些数据存在重复项。观测值1.2.3(第1.2.3行)重复,id都是11004508,观测值4.5重复,id都是11004808,……但如果我们看id,age,sex,我们发现这些数据并不存在重复。例
2021-11-16 21:23:11 43194 4
原创 STATA中的Macro(宏、暂元)、通配符与循环——减少重复性的工作
1. Macro(宏、暂元)的介绍在STATA教程中,Macro也被翻译为宏、暂元等。Macro是程序中的临时变量,由Macro的名称和内容两部分组成,类似于变量名和变量值。Macro有局部宏和全局宏两种。局部宏只存在于定义它的程序之内,并且不能在其他程序中被引用;而全局宏一旦被定义,就会保留在当前Stata内存中,可以被当前STATA会话期间的其他程序所使用。2. 局部宏2.1 局部宏的定义与调用宏的方便之处之一在于,你可以在宏里面加入多个内容。尤其是你需要多次输入同一内容时,定义和调用宏是最简单
2021-09-10 20:53:08 8037 3
原创 R语言基础统计分析:正态性检验、方差齐性检验、T检验、方差分析、秩和检验
R语言基础统计分析1. 正态性检验1.1 Shapiro-Wilk正态检验方法1.2 QQ图2. 方差齐性检验2.1 Bartlett检验,适用于正态分布数据2.2 Levene检验,非正态分布与正态分布数据均适用3. t 检验3.1 单样本t检验3.2 两独立样本t检验3.3 两配对样本t检验4. 方差分析5. 秩和检验5.1 两样本比较5.2 多样本比较1. 正态性检验单变量正态性检验1.1 Shapiro-Wilk正态检验方法# 示列:shapiro.test(var) # 正态性检验,p
2021-04-18 17:29:48 19521
原创 R语言描述性统计分析
1. 简单描述1.1 数值变量summary() 函数summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。其格式为:summary(data1$var1)Hmisc包中的describe()函数Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数,以及五个最大的值和五个最小的值。其格式为library(Hmisc)describe(data1$var1)pastecs包
2021-04-15 11:37:46 11666 1
原创 R语言与数据基本处理
数据基本操作可以用用dplyr包1.数据筛选格式:filter(数据集名,变量名)如果需要根据多变量多条件进行筛选,加上 & 和 | 即可filter (data1,var1 =1 | var2 >6)filter (data1,var1 =1 & var2 >6)2.数据排序格式:arrange(数据集名称,变量名称)如果需要根据多个变量进行排序,按顺序即可desc表示逆序arrange(data1, var1, var2, desc(var3))3
2021-04-12 14:44:13 1258
原创 正态性/方差齐性检验及stata实现
正态性检验及stata实现1. 方法方法如下(假设变量名称为var1)summarize var1, detail / 这是对变量var1的详细描述,里面包含变量的分位数、最大最小值、均数方差标准差,偏度峰度等;正态分布的偏度 Skewness=0;峰度 Kurtosis=3。Skewness/Kurtosis tests命令:sktest var1 / 结果如下上图也包含了对Skewness(偏度)和Kurtosis(峰度)的检验,需两者均大于检验水准(你可以根据实际情况定为0.05等)
2020-07-06 12:04:12 41199
原创 数据、文件下载链接
年 数据、文件下载链接这些数据、文件都能到相应官网下载,注册账号、申请、审核通过即可下载。如果急用,可以在这里下载,但请务必按相关规定使用数据中国健康与养老追踪调查(CHARLS)官网:https://opendata.pku.edu.cn/dataverse/CHARLS链接:https://pan.baidu.com/s/17mbeJMNoPCpyt_G2Qr3bdw提取码:tb3d中国老年人健康长寿影响因素调查(CLHLS)官网:https://opendata.pku.edu.cn/d
2020-06-25 13:14:50 7830 13
原创 统计推断的前提和最应该知道的概念
统计推断的前提和最应该知道的概念之前收到一些同学朋友的咨询,大部分是关于如何计算p值的。诸如:我知道均数和方差可以计算p值吗?或者给我列了列联表让我我计算p值的。面对这样的问题,我很无奈,我的回答一般都是,你有原始资料吗,把原始资料给我看看?可以算,但是如果你仅仅给我均数方差N、仅仅给我一个列联表,它有什么意义呢?今天我将对我以上的发问进行解答,讲一讲在进行统计分析前,最应该知道的东西——样...
2020-05-03 18:18:26 1649
原创 被忽视的PDF编辑工具——word
相信小伙伴们都受到编辑PDF的苦恼,求诸各种途径,麻烦又费时。其实,大家都忽略了身边最简单的PDF编辑工具——word,你没听错,就是word(word的工作原理其实是PDF格式转换,并非真正的PDF编辑)。只要你的OFFICE是2013及以上版本,直接用你的Word打开PDF,就可以编辑了。此外,你不仅可以编辑这份PDF,还可以顺利地复制粘贴里面的表格。操作也很简单:如何编辑?直接进入wor...
2020-04-19 10:08:40 343
原创 Citespace下载,Citespace启动慢的解决办法
Citespace下载,Citespace启动慢的解决办法Citespace下载方法Citespace新下载方法三级目录Citespace下载方法上一期已经介绍了Citespace的下载方法。不过,Citespace的exe文件经常出现启动慢的问,这一部分先介绍介绍如何下载Citespace的压缩文件,两个文件可以同时放一起使用,相辅相成。Citespace新下载方法第一步还是进入Cite...
2020-04-12 14:21:45 8832 1
原创 缩减C盘空间之移动桌面位置
缩减C盘空间之移动桌面位置移动桌面位置移动文档的位置移动桌面位置相信很多朋友都深受C盘空间越来越少的苦恼,那么怎么精简C盘空间呢?一方面,可以利用各式各样的垃圾清理软件。另一方面,许多朋友的桌面文件默认位置都在C盘,而桌面文件的位置是可以改到其他盘符的,那么如何更改呢?到C盘目录下找到“桌面”图标;选中“桌面”图标,鼠标右键,查看属性,出现如下框面;出现的框面默认在“常规”属性,你...
2020-04-11 09:57:21 313
原创 Citespace介绍及安装
Citespacean介绍及安装Citespace介绍Citespace安装指南第一步 安装Java运行环境 (JRE)第二部 安装Citespace注意事项Citespace介绍是一款可用于海量文献进行可视化分析的软件。可用Web of Science,Scopus,,CNKI等数据库的海量文献进行主题、关键词,作者单位、合作网络,期刊、发表时间,文献被引,等进行可视化分析。Citespa...
2020-04-06 16:05:03 15209 8
Charls2015数据.zip
2020-04-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人