AccountingCoder-CSDN博客

原创实证分析 | STATA入门数据处理

STATA十八讲1-7讲1. 常用命令*--- 需求帮助 ---*helpsearch*--- 进入某路径 ---*cd*--- 设定内存 ---*set memory 20m*--- 打开和保存数据 ---*clearuessave*--- 导入数据 ---*inputeditimport*--- 重整数据 ---*appendmergexposereshapegenegenrenamedropkeepsortencodedecodeorde.

2021-09-01 19:11:47 9877

原创实证分析 | 中介效应检验原理与Stata代码实现

前言本文是温忠鳞和叶宝娟2014年刊载于《心理科学进展》的论文《中介效应分析：方法和模型发展》的简要笔记与拓展。温忠麟、叶宝娟：《中介效应分析：方法和模型发展》，《心理科学进展》，2014年第5期中介效应检验要了解中介效应，首先要引入中介变量的概念。考虑自变量XXX对YYY的影响，如果XXX通过影响变量MMM而对YYY产生影响，则称MMM为中介变量。在回归模型的体现$$\begin{align}Y &= cX + e_1 \tag{1} \M &= aX + e_2 \

2021-08-22 21:08:46 71516 505

原创文本分析 | 管理层讨论信息含量原理与代码实现

前言受读者建议，再次详细论述我们写的第一篇推文，讲讲管理层讨论信息含量这个指标如何构建。本文的主要内容分为管理层讨论信息含量的定义、计算原理、python和stata实现以及计量拓展定义参考孟庆斌等（中国工业经济，2017）的定义一方面，所有上市公司都处于相同的宏观经济环境、风险因素和政治、政策背景之下；另一方面，同一行业中的各上市公司又面临着相似的产业政策、竞争环境和市场特征。由此可见，每个上市公司MD&A 信息不可避免地在某种程度上与同行业其他上市公司以及市场其他行业上市公司存在一定的

2021-04-28 22:35:13 3842 20

原创可视化 | pyecharts之柱状图常用配置篇

前言pyecharts的可视化大法，让人爱不释手。柱状图是我们最为常用的可视化统计图，本篇主要介绍了pyecharts的绘制柱状图的常用配置，主要包括以下内容：基础柱状图隐藏图例标签数字坐标轴名称命名旋转X轴标签增加标记线或者标记点柱子宽度设置不同系列间柱间距离自定义柱状颜色柱状堆叠图在柱状图中同时绘制折线图实例详解基础柱状图from pyecharts import options as optsfrom pyecharts.charts import *x_inde

2021-04-20 11:38:16 7736 1

原创计量笔记(三) | 线性模型的拟合优度检验

计量笔记专栏计量笔记(一) | OLS估计量推导计量笔记(二) | OLS估计量性质前言前面通过计量笔记(一) | OLS估计量推导和计量笔记(二) | OLS估计量性质我们已经推导出了参数的OLS估计量的矩阵表达式即β^=(XτX)−1XτY\pmb{\hat\beta} = (X^{\tau}X)^{-1}X^{\tau}Yβ^β^β^=(XτX)−1XτY，以及证明了在经典假设成立的条件下参数的OLS估计量的矩阵表达式是最佳线性无偏估计量，以及随机扰动项σ2\sigma^2σ2的

2021-03-31 11:18:03 4083

原创计量笔记(二) | OLS估计量性质

上文中《计量笔记(一) | OLS估计量推导》我们通过基本公式和矩阵形式两种方式推导出了OLS估计量的表达式，那么OLS估计量有什么优良性质呢？在线性模型的经典假设的前提下，OLS估计量有优良的性质，即高斯-马尔可夫定理经典假设1、零均值假定假定随机干扰项ε\pmb{\varepsilon}εεε期望向量或均值向量为零E(ε)=E[ε1ε2⋮εn]=[E(ε1)E(ε2)⋮E(εn)]=[00⋮0]=0E(\pmb{\varepsilon})=E\begin{bmatrix}\varepsi

2021-03-28 16:54:27 11773

原创计量笔记(一) | OLS估计量推导

一、基准方程推导总体回归模型yi=β1+β2x2i+β3x3i+⋯+βkxki+εiy_i=\beta_1+\beta_2x_{2i}+\beta_3x_{3i}+\cdots+\beta_kx_{ki}+\varepsilon_iyi=β1+β2x2i+β3x3i+⋯+βkxki+εi样本回归模型yi=β^1+β^2x2i+β^3x3i+⋯+β^kxki+eiy_i=\hat\beta_1+\hat\beta_2x_{2i}+\hat\beta_3x_{3i}+\cdo

2021-03-19 21:44:09 14149 3

原创收藏文章 | python与stata藏文阁

PythonJupyter Notebook添加代码自动补全功能stata持续更新，欢迎关注微信公众号：乌龙PySta

2021-03-17 23:35:11 196

原创文本分析 | 年报转换TXT关键词频统计

前言上篇文章《【爬虫】30行代码轻松爬取全部A股公司年报》介绍了如何爬取2003-2019年A股全部年报，但是爬取的年报都是PDF格式，不能直接用于文本分析，需要先转换为TXT格式。因此，今天也学习了一下如何运用Python将PDF转换为TXT，并在此基础上统计年报相关主题关键词词频基本思路1.获取年报PDF文档2.利用PDFminer3k模块来抽取PDF内容并写入TXT文件3.读取TXT文件，统计关键词词频并写入Excel文件PDF转TXT导入Python第三方库import pandas

2021-03-13 22:20:10 9629 35

原创经管文本分析 | 金融学文本大数据挖掘方法与研究进展阅读笔记

姚加权张锟澎罗平《经济学动态》2020年第4期沈艳陈赟黄卓《经济学（季刊）》 2019年第4期前言本文是刊载于《经济学（季刊）》2019年第4期《文本大数据分析在经济学和金融学中的应用:一个文献综述》和《经济学动态》2020年第4期《金融学文本大数据挖掘方法与研究进展》的阅读笔记在金融学领域的传统实证研究文献中，研究数据多局限于财务报告数据、股票市场数据等结构化数据（structured data）。而在大数据时代，计算机技术的不断提高使得数据类型更加丰富，文本大数据已经.

2021-02-23 16:41:57 2544 1

原创经管文本分析 | 基于年报文本构建管理层讨论与分析披露的信息含量

经管文本分析 | 管理层讨论与分析披露的信息含量前言本文是刊载于《中国工业经济》2017年第12期《管理层讨论与分析披露的信息含量与股价崩盘——基于文本向量化方法的研究》关于文本分析构建变量的阅读笔记。原文借鉴Hanley and Hoberg （2010）的研究思路，基于文本向量化的信息构建回归模型测量文本的MD&A信息含量。本笔记主要记录指标构建思路，并且运用Python和Stata进行粗略复刻。信息含量的定义上市公司的MD&A不仅包括公司经营状况等历史信息，也包括与其他公司相似

2021-02-19 10:49:40 7615 10

原创财会论文变量 | 股价崩盘风险

股价崩盘风险首先通过以下扩展指数模型回归得到残差刻画上市公司的股价崩盘事件ri,t=αi+β1Rm,t−2+β2Rm,t−1+β3Rm,t+β4Rm,t+1+β5Rm,t+2+εi,tr_{i,t}=\alpha_i+\beta_1R_{m,t-2}+\beta_2R_{m,t-1}+\beta_3R_{m,t}+\beta_4R_{m,t+1}+\beta_5R_{m,t+2}+ \varepsilon_{i,t}ri,t=αi+β1Rm,t−2+β2Rm,t−1+β3Rm,t+β4

2020-08-09 09:45:42 7891 2

原创财会论文变量：企业融资约束

#企业融资约束不同参考文献计算融资约束有不同的方法，以下计算三种常用方法KZ指数借鉴Kaplan and Zingales(1997)，以中国上市公司为样本构建KZ指数，用以衡量融资约束程度。具体而言，按以下步骤构建KZ指数对全样本各个年度都按经营性净现金流/上期总资产（CFi,t/Ai,t-1）、现金股利/上期总资产（DIVi,t/Ai,t-1）、现金持有/上期总资产（Ci,t/Ai,t-1）、资产负债率（LEVit）和Tobin`s Q（Qit）进行分类。如果CFi,t/Ai,t-1低于中

2020-08-08 22:50:41 19761 5

原创玩转STATA：基本操作笔记1

STATA基本操作导入文件导入excel文件： import excel 文件名.xlsx, firstrow clear导入同一文件夹所有excel文件：local files: dir "." file "*.xls" //用暂元提取所有后缀为xls的文件名foreach file in `files'{ import excel "`file'", firstrow clear save "`file'.dta",replace }行列对调数据xpose,clea

2020-08-06 17:21:33 5528

weixin_47172744的博客