自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 stata备忘录

stata备忘录

2023-03-12 14:14:20 5861 3

原创 【stata】求滚动波动情况

假设 2008-2010的value分别为【6.264004 】、 【11.11958】 、 【18.7657】然后求这3年内的value的平均。等于【12.049761】再用逐年的数值减去均值,而后求平方项 / 3。

2024-04-14 15:34:08 792

原创 【stata】stata绘图模板(stata scheme)

【代码】【stata scheme】stata绘图模板(第一弹)

2024-04-02 02:03:30 295

原创 【推导结果】如何得到 回归均方误差 & 估计系数的标准误

对于①参数线性②不存在“严格多重共线性”③随机抽样④严格外生性⑤“球形扰动项”(条件同方差+不存在自相关)五个假定均能够满足时。OLS估计量为BLUE,最优无偏线性估计量。

2024-03-28 22:22:07 1236

原创 【Stata】实证模型差分后,与原模型如何等价?

【代码】【Stata】实证模型差分后,与原模型如何等价?

2024-03-27 12:29:41 780

原创 Stata连续和离散变量(c.和i.)傻傻分不清?i.的用法

【代码】Stata连续和离散变量(c.和i.)傻傻分不清?i.的用法。

2024-03-07 18:08:46 808 1

原创 stata高维面板数据生成

stata高维面板数据生成。

2024-03-02 11:37:49 396

原创 R语言setNames命令(stats)

setNames函数用于为对象设置名称,并返回带有新名称的对象。这在创建对象并希望在函数定义的末尾设置名称时非常有用,尤其是当你不希望为了分配名称而存储对象时。

2024-01-30 13:43:46 449

原创 R语言ggplot时间趋势图

【代码】R语言ggplot趋势图。

2024-01-30 09:23:52 365

原创 R语言tidyr最常见函数

tidyr。

2024-01-29 23:06:03 387

原创 R语言dplyr中的`cur_`系列函数

函数用于重新定义数据框的结构,包括列名、列的顺序等。它允许你指定新的列名和列的顺序,以便重新构建数据框的结构。将重新构建数据框,将列 A 重新命名为 X,列 B 重新命名为 Y,列 C 重新命名为 Z。等)中获取关于当前组或变量的信息的函数。函数主要用于在数据框中同时对多个列进行相同的操作。: 返回当前组的键,是一个tibble,每个组变量对应一列。来获取当前列的名称,然后对每列应用了相应的操作。: 返回当前组的大小,即当前组内的观测数量。返回了当前组的键,以列表形式存储。返回了当前组的行索引。

2024-01-29 11:06:33 374

原创 R语言do.call的简介及用法

do.call函数用于构造和执行一个函数调用,可以通过指定函数名称或函数对象以及一个包含参数的列表来实现。要调用的函数,可以是一个函数对象或一个非空的字符字符串,表示函数的名称。一个包含函数调用参数的列表。args列表的names属性提供参数的名称。一个逻辑值,指示是否引用参数。如果设置为FALSE(默认值),则参数在调用环境中进行评估,如果设置为TRUE,则对每个参数进行引用。一个环境,在其中进行调用的评估。如果what是一个字符字符串并且参数是符号或引用表达式,这可能会很有用。

2024-01-29 00:42:36 1097

原创 R语言数据reshape:dplyr包函数pivot_wider

pivot_wider函数1.pivot_wider 的用法:pivot_wider 用于将数据从长格式变为宽格式,增加列数,减少行数。它将某些列的值转换为新的列,并使用这些值填充新列。以下是一些关键参数:names_from: 用于指定要从中获取新列名的列。可以是一个或多个列。values_from: 用于指定要填充新列的值的来源列。可以是一个或多个列。names_prefix: 可选,添加到每个变量名的前缀字符串。names_sep: 可选,用于将 names_from 或 values_

2024-01-28 20:29:36 542

原创 R语言数据reshape:dplyr包函数pivot_longer

上述数据框中,Math_Score_Week1 和 Math_Score_Week2 是两个不同周的数学成绩,English_Score_Week1 和 English_Score_Week2 是两个不同周的英语成绩。在这个例子中,我们使用 .value 来表示数学和英语成绩的部分,同时指定了一个额外的 Week 列。这样,原始数据的宽格式就被转换成了长格式,每个学生每周的数学和英语成绩都被整理到了新的行中。names_sep:指定用于分割列名的字符,在这里是下划线 "_”。

2024-01-28 20:22:04 999

原创 R语言条件赋值case_when函数

来赋予不同的等级(A、B、C、D)。如果分数不符合任何条件,就返回默认值 “D”。会逐个检查条件,返回第一个满足条件的结果。如果没有条件满足,就返回默认结果。包提供的一种用于多条件条件语句的函数,它的作用类似于传统编程语言中的。用于根据一系列条件进行值的选择或替代。在这个例子中,根据不同的分数范围,使用。以下是一个简单的例子,说明了。

2024-01-27 21:42:42 627

原创 R语言sub和gsub的使用

这个命令与第二句类似,使用正则表达式,匹配字符串中以左括号 “(” 开始的部分,然后将其替换为空字符串。表示匹配任意字符,包括空格)直到遇到冒号和空格 ": ",然后将其替换为空字符串。表示匹配左括号),然后将其替换为左括号 “(”. 这样就保留了字符串中左括号及其左侧的部分,去掉了右括号及其右侧的部分。在正则表达式中,某些字符前面需要使用反斜杠进行转义,以表示它们的字面含义。的区别在这里并不明显,因为只有一个匹配到的模式需要替换。: 这个命令使用正则表达式,匹配字符串中以左括号 “(” 开始的部分(

2024-01-27 16:46:03 400

原创 R语言lappy的用法

将包含一个列表,其中每个元素都是对应年份的文件路径。这种操作对于批量处理文件路径、文件读取等任务非常有用。是R语言中的一个函数,用于将指定的函数应用于列表的每个元素,返回一个新的列表。请帮我解释一下这一句命令, 并结合这一句,教我lapply的用法。中的每个元素(年份),并返回一个包含结果的列表。函数生成的文件路径。函数创建一个列表,其中包含了通过。返回一个列表,其中包含了将。这一句代码是用R语言中的。

2024-01-26 11:33:26 340

原创 dplyr函数速查表

【代码】dplyr函数速查表。

2024-01-23 14:59:34 336

原创 python Pandas后缀速查表

【代码】python Pandas后缀速查表。

2023-12-16 18:44:24 43

原创 python循环入门(Iterative)

否则,保持’value’不变。这样就实现了对’id_str’为’New York’或’Shanghai’的行的’value’列进行除以2的操作。因此,这行代码的总体效果是,对于’id_str’是’New York’或’Shanghai’的行,将’value’除以2;对于其他行,保持’value’不变。if row[‘id_str’] in [‘New York’, ‘Shanghai’]:: 这是一个条件语句,检查当前行的’id_str’列是否包含在列表[‘New York’, ‘Shanghai’]中。

2023-12-16 18:43:06 62

原创 python数据清理入门

这段代码使用了一个 for 循环,它对 shanghai_data 数据框按照 ‘transaction_type’ 进行分组。然后,对每个分组进行处理。

2023-12-16 17:51:56 42

原创 python分析Zephyr数据

【代码】python分析Zephyr数据。

2023-12-16 13:38:40 87

原创 Memo1: Stata数据清洗入门教程

memo1, 2023.09.27

2023-10-11 17:08:54 915

原创 Memo2: Stata循环入门教程

memo2, 2023.10.11

2023-10-11 16:56:45 1095

原创 stata中,egen(egenmore)进阶函数

stata中,egen(egenmore)进阶函数

2023-09-25 11:43:45 673

原创 python循环提取txt文档词频

【代码】python循环提取txt文档词频。

2023-04-24 19:20:46 195

原创 python备忘录——pandas笔记

注意,DataFrame 的列由多种数据类型组成时,该操作耗费系统资源较大,这也是 Pandas 和 NumPy 的本质区别:NumPy 数组只有一种数据类型,DataFrame 每列的数据类型各不相同。调用 DataFrame.to_numpy() 时,Pandas 查找支持 DataFrame 里所有数据类型的 NumPy 数据类型。Pandas 为频率转换时重采样提供了虽然简单易用,但强大高效的功能,如,将秒级的数据转换为 5 分钟为频率的数据。Pandas 主要用 np.nan 表示缺失数据。

2023-03-20 21:20:48 469

原创 标注数字对应的文本_循环嵌套_全局暂元

【代码】标注数字对应的文本_循环嵌套_全局暂元。

2023-03-17 23:28:54 64

原创 Stata标注技巧:用for循环批量画图,标注相应文字

想用for循环批量输出结果,输出标题/label一般暂时使用数值,但结果不太直观。例如,hy2是国民经济行业分类代码。现在想要绘制每一个行业的出口额的时间趋势图。我们要做的是:将贸易额回归至时间虚拟变量上,考察lnv的时间趋势,使用如下命令。循环绘制时间趋势图,得到如下图结果。发现label是数字,不太直观。如何把数字对应的行业”文字“作为label加到图中?生成了标量s13~s45 用于储存行业代码编号。由此,我们就得到了中文label的时间趋势图。执行上述代码,sca list得到如下结果。

2023-03-17 23:23:33 1141

原创 Matlab计算完全消耗系数

matlab计算完全消耗系数

2023-03-12 16:09:21 394

原创 R语言备忘录

R语言备忘录:处理数据、画图、回归

2023-03-12 16:01:12 133

python数据清理入门对应数据

python数据清理入门对应数据

2023-12-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除