爱听雨声的北方汉
一个喜欢旅行的算法爱好者
展开
-
认识一些分布-Weibull distribution
Weibull distribution(译作威布尔分布)是一种连续概率分布,以瑞典数学家瓦洛迪·威布尔(Waloddi Weibull)命名。他最初提出该分布作为材料断裂强度的模型,但在他1951年的论文《一种广泛适用的统计分布函数》中意识到了该分布的潜力。今天,威布尔分布通常用于评估产品可靠性、分析寿命数据和建模失效时间。威布尔分布还可以拟合来自生物学、经济学、工程科学和水文学等许多领域的广泛数据(Rinne,2008)。尽管在大多数情况下非常有用,威布尔分布并不适合每一种情况。原创 2024-06-15 12:23:09 · 95 阅读 · 0 评论 -
认识一些分布-关于极值点分布的一些知识
可以参考下面资料:Extreme Value Distribution & the Extreme Value Theory - Statistics How To原创 2024-06-15 12:08:14 · 72 阅读 · 0 评论 -
认识一些分布函数-Frechet分布及其应用
Frechet分布也称为极值分布(EVD)类型II,用于对数据集中的最大值进行建模。它是四种常用极值分布之一。另外三种是古贝尔分布、威布尔分布和广义极值分布(theand the这种分布被用来模拟诸如洪水分析、赛马、人类寿命、最大降雨和水文学中的河流流量等广泛的现象。原创 2024-06-15 11:47:11 · 221 阅读 · 0 评论 -
经管博士科研基础【8】渐进性分析
假设你的任务是打扫你的房间。现在,任务的难度会是什么?这取决于房间有多分散。如果房间已经整理好了,你不会花太多时间,如果房间非常分散,你可能要花几个小时来整理。所以你看,任何任务的复杂程度或难度,都是由完成它需要多少时间来决定的。类似地,它也发生在计算机程序中。在编写算法时,我们需要确保它在给定的资源下最快地工作。在本文中,我们将学习什么是渐近性分析,如何计算时间复杂度,什么是渐近符号,以及一些常用算法的时间复杂度。原创 2023-08-20 15:34:08 · 244 阅读 · 0 评论 -
效率评价方法--DEA评价效率方法
认识和理解DEA模型及其应用原创 2023-02-08 18:03:35 · 3165 阅读 · 0 评论 -
实证研究方法——双重差分
双重差分原创 2023-02-08 09:27:59 · 640 阅读 · 0 评论 -
效率评价方法--数据包络分析
认识和理解DEA及其三阶段DEA模型原创 2023-02-06 20:24:02 · 1181 阅读 · 0 评论 -
深入浅出学习结构方程模型【3效度】
深入浅出学习结构方程模型原创 2023-02-02 16:21:16 · 1067 阅读 · 0 评论 -
深入浅出学习结构方程模型【2应用篇】
深入浅出学习结构方程模型原创 2023-02-02 16:17:11 · 920 阅读 · 0 评论 -
深入浅出学习结构方程模型【1理论篇】
深入浅出学习结构方程模型原创 2023-02-02 16:01:21 · 2561 阅读 · 0 评论 -
事件研究法与其应用(2)---Excel实操步骤
事件分析方法用Excel进行实操原创 2022-09-18 20:08:47 · 3197 阅读 · 1 评论 -
事件研究法及其应用(1)---初步认识
Event Study原创 2022-09-16 19:00:55 · 1910 阅读 · 0 评论 -
Stata教程(6)---帮助功能
Stata具有非常强的帮助能力,帮助的使用主要有两种方式。①在Stata中,需要了解某一个指令的格式或者说功能,这个时候只需要键入help(或者按下功能键F1),然后空一格键入该指令即可,例如:help regress。②使用菜单栏中的help命令,出现帮助窗口。...原创 2022-03-10 13:35:10 · 2914 阅读 · 1 评论 -
数据可视化小助手--Excel切片器
切片器具有两大功能:1.让数据分类直观呈现2.可以制作简单的动态图步骤一:选中增加切片的数据范围:插入-----切片器,得到如下形式:步骤二:整理切片器,进行数据筛选可以发现,通过点击切片器中的数据字段,实现数据的筛选功能。...原创 2020-01-09 14:45:52 · 744 阅读 · 0 评论 -
excel函数--if函数计算销售提成
我们在处理销售数据的时候,往往需要更具不同的销售额来计算销售人员的提成金额:比如下面的一个例子:临沂市朝阳汽车零件公司,公司规定当月销售额超过10000,提成5%;低于10000但是超过75000,提成3%,否则为零提成;计算销售人员的销售额这里看到例题中存在判断关系,因此立马想到if函数:if函数具有三个参数:(1)第一个参数为必需参数,为逻辑判断的条件,可以是计...原创 2019-08-26 11:12:11 · 15659 阅读 · 0 评论 -
Excel中的样式
excel开始---样式中存在三种选择,下面几种讲述:(1)套用表格格式即是使用表格的样式,对excel单元格进行操作,如下所示:(2)单元格格式(3)条件格式条件格式顾名思义,即是按照一定的条件设置的单元格格式,一般可以有以下几种条件或者规则:...原创 2020-01-09 15:04:17 · 679 阅读 · 0 评论 -
人工智能、机器学习和深度学习关系和区别:AI>ML>DL
机器学习和深度学习关系和区别原创 2021-03-04 22:53:55 · 494 阅读 · 1 评论 -
excel函数--判断一个人的户口所在地
我们在处理客户信息时,尤其是物流配送的时候往往会将客户进行分类,比如将客户按照身份进行分类,或者按照城市进行分类,如上例中,这里利用三个函数嵌套的形式来实现:=IF(ISNUMBER(FIND("临沂",B7)),"临沂","其他")FIND("临沂",B7):在单元格B7中查找“临沂”,如果查找到则返回true,否则返回“#Value!";ISNUMBER(FIND("临沂",B...原创 2019-08-26 10:49:11 · 1259 阅读 · 2 评论 -
excel中的筛选功能
一般在excel数据筛选中,可能涉及到多个筛选功能或者需要,下面几种整理一下:(1)添加筛选功能对以下数据进行筛选,增加筛选功能有两种方式。第一种方式是,可以通过工具栏添加筛选:第二章方式是通过CTRL+T增加筛选,总之两种方式均可以,最终得到下面的形式:(2)进行筛选操作筛选操作,可以按照各个栏目进行筛选操作,1、如对部门进行筛选;2、按照文本...原创 2020-01-09 14:37:56 · 659 阅读 · 0 评论 -
知识图谱及其关键技术
一、知识图谱相关概念知识图谱最初是谷歌提出的搜索数据应用范式,后广泛应用于谷歌搜索及其服务使用的知识库体系中,以通过从各种来源收集的信息来增强其搜索引擎的结果。1、前言大家在互联网搜索的早些使时间里,实际搜索某一词条时,可能发生搜索精度不高或者说搜索应答答非所问的情况,比如你在某搜索网站上面搜索“杰森.斯坦森’”,那么将会出现有关杰森.斯坦森的相关介绍;这种搜索是直接的根据词条进行的搜索;而当你搜索“《非常人贩》的男主角’’时,返回的结果也是“杰森.斯坦森”,在之前的搜索系统中,对于这一类的搜索原创 2021-03-03 21:33:55 · 4670 阅读 · 1 评论 -
数据分析总览--一文读懂数据分析
一文读懂数据分析的过程和要点原创 2022-02-25 12:13:36 · 671 阅读 · 0 评论 -
Python数据可视化----绘制二维图像(折线图、饼图、柱状图、散点图、等高线,3D图等)
(1)绘制一条折线图import matplotlib.pyplot as plt #调用matplotlib中的子模块pyplot绘制折线图# 定义2个列表分别作为X轴、Y轴数据x_data = ['2012','2013', '2014', '2015', '2016', '2017', '2018', '2019']y_data = [45000,58000, 60200,...原创 2019-09-03 18:46:04 · 11063 阅读 · 1 评论 -
Stata(20)--处理离群值
离群值的处理方法整理原创 2021-10-08 14:48:31 · 2545 阅读 · 0 评论 -
结构化数据和非结构化数据区别
结构化数据,即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据),而不方便或者无法采用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。1.结构化数据(行数据)姓名 性别 数学 语文 英语 lixi 女 98 87 91 liubing 男 85 95 97 huanghai 男 89 92 8原创 2021-03-03 22:04:29 · 1332 阅读 · 1 评论 -
计量经济学(十三)内生性问题的原因
1. 内生性的解释首先需要明确外生的意思,在计量经济学中的外生:是指的解释变量x和error term u独立影响被解释变量y。想一想,只有这样,我们才能提取出来“X这一个解释变量单独对Y的边际影响,才能分析经济问题或者说经济变量的影响机制。”那么,与外生对立的是,内生: error u 影响解释变量x,因而间接影响被解释变量y。换句话说,某个模型有内生性问题(endogeneity issue),是指模型中的一个或多个解释变量与误差项存在相关关系。2. 内生性的原因但是由于经济原创 2022-04-17 17:56:07 · 5622 阅读 · 0 评论 -
计量经济学(十二)Heckman 两阶段法
Heckman两阶段模型解决的是样本选择偏差(sample selection bias)的问题。我们主要从两个方面进行讲述Heckman两阶段法,最后简要介绍一下Heckman老爷子。1. 何为样本选择偏差样本选择偏差指的是在回归方程中估计出的参数是基于那些被选择进样本了的数据点(或者说是能够观测得到的数据点)而估计出来的,那么如果说一个数据点(观测值)是不是被选择进样本是一个外生的、纯随机的事件,那么据此得出的参数并不会有偏差(bias)——这个估计结果就不会有问题。但是事实上我们是无法避免掉内原创 2022-04-17 17:30:22 · 6335 阅读 · 0 评论 -
计量经济学(十一)工具变量法
工具变量法也就是 Instrumental Variable Analysis,简称IV,是用来处理内生性问题的重要方法,那么我们先从内生性问题出发,然后讲述工具变量法。1. 内生性问题对于上面式子中的多元线性回归方程,在采用OLS方法进行估计参数量时,我们一般假设随机扰动项与解释变量之间没有相关性,但是现实中肯定是无法满足的,比如我们遗漏了一些变量等,因此就出现了内生性问题,那么我们就需要解决内生性问题(endogeneity)。具体的讲,造成内生性问题的主要原因有:遗漏重要解释变量原创 2022-04-17 16:37:01 · 6341 阅读 · 0 评论 -
计量经济学(十)---模型选择:标准与检验
我们现在回到模型设定的开始,一般而言,模型构建前我们是隐含的假定“我们的模型是对现实的真实反应”,更为专业地讲,假定所选择的模型中不存在着设定偏差或者说设定误差,但是我们回头过来想一下个,我们所选择的模型就一定是没有任何误差的吗?我想,肯定不是的。那么,我们就回到了下面几个问题的解答上面:1.“好的”或者“正确的”模型是什么样的呢?有什么性质?2.存在哪些设定误差呢?设定误差的后果有哪些呢?我们如何诊断设定误差?一、模型评价标准计量经济学家哈维(Harvey)列出了模型的标准:节..原创 2021-09-26 11:33:07 · 1684 阅读 · 0 评论 -
计量经济学(九)---格兰杰因果关系检验
正如在计量经济学(八)中所陈述的那样,自回归分布滞后模型向我们解释了某一些变量的变化会受到其自身以及其他变量过去行为的影响,然而,许多的经济变量有着相互的影响关系,比如,GDP与消费就相互影响。因此,问题是,当两个两边在时间上有着向导--滞后效应时,我们能否从统计上考察这种关系究竟是单项的关系还是双向的关系,也就是说是先有鸡还是先有蛋呢?换句话说,主要是一个变量的行为在影响另一个变量的当前行为呢?还是双方的过去行为在相互影响着对方的当前行为呢?1. 格兰杰因果关系含义(Granger Cau..原创 2021-09-26 10:52:41 · 9807 阅读 · 0 评论 -
计量经济学(八)---滞后变量(Lagging variable)模型
一、什么是滞后变量模型呢?主要分为两种,一种为外生滞后变量模型(分布滞后模型),另一种是内生滞后变量模型(自回归模型)。二、滞后效应出现的原因和作用?2.1 滞后效应出现的原因2.2 滞后效应的作用三、滞后变量模型的形式四、分布滞后变量的参数估计基本思想是:对滞后变量进行加权,合成新的变量五、自回归滞后变量的参数估计基本思想是:考虑滞后被...原创 2021-09-26 10:49:14 · 1597 阅读 · 0 评论 -
计量经济学(七)----自相关性Autocorrelation.
在前面的基本线性回归模型中,我们假定的是随机扰动项无自相关性,那么也就是说Cov(ui,uj)=0,i不等于j,且i,j=1,2,.....n,这表明任意两次观测的ui,uj是不相关的,即u在某一次的观测值与任何其他观测中的值互不影响,称之为无序列相关性。一、自相关性的性质时间相关性:自相关问题通常是与时间序列数据相关的 空间相关性:在横截面数据中也可能产生自相关性问题,称之为空间相关,比如某一季度工人罢工对本季度及其下一个解读的产出的影响,某一个家庭的消费支出水平与另一个家庭的消费支出...原创 2021-09-25 22:22:14 · 3122 阅读 · 0 评论 -
计量经济学(六)---异方差性(Heteroskedasticity)
目录(1)异方差的性质(2)异方差的后果(3)异方差的检验方法一、异方差的性质异方差问题多存在与横截面数据中,在时间序列数据中较少出现; 规模效应;如果横截面数据来自于一组规模差异很大的对象,在数据中就会存在异方差性,比如不同规模的公司,大小公司之间的方差一般存在较大差异性;还比如低收入家庭,高收入家庭和中等收入家庭等; 在时间序列数据中,变量趋向于具有相似的数量等级水平。二、异方差的后果OLS估计量任然是线性的,也无偏的。 但无论是对大样本,还是对小样本,OLS估计..原创 2021-09-25 21:40:15 · 2418 阅读 · 0 评论 -
计量经济学(五)---其他的线型回归模型
一定要注意,线型分为参数线型和变量线型。一、双对数线型模型----测算弹性(即自变量变动X%,因变量变动Y%)(1)一元对数线型模型(2)多元对数线性模型最为常见的为:柯布道格拉斯生产函数二、半对数线型模型---测算增长率(自变量增长X%,因变量增长Y)自变量不为对数,因变量为对数三、线性对数模型(自变量是对数形式,因变量不是对数形式)四、双曲线型模型双曲面线型模型比如平均固定成本、恩格尔消费曲线、菲利...原创 2021-09-25 21:04:55 · 1079 阅读 · 0 评论 -
计量经济学(四)---多元线性回归模型
一元线性回归模型是指的自变量和因变量各有一个的回归模型,但是由于因变量可能会受到各种变量的影响,也就是说存在着多元因素影响,那么就需要构建多元线性回归模型。一、多元线性回归模型的基本形式二、多元线性回归模型的假设(1)零均值假设(2)同方差假设(3)无自相关性假设(4)随机项与自变量不相关假定(5)变量间的非线性相关性假定三、多元线性回归模型的估计与参数假设估计让采用OLS方程,首先求解各个变量下的偏导数,然后令其...原创 2021-09-25 15:36:34 · 3729 阅读 · 0 评论 -
计量经济学(三)--假设检验
为什么要假设检验呢?原创 2021-09-25 12:50:40 · 1056 阅读 · 0 评论 -
计量经济学(二)---置信区间
我们一般在抽样的时候,是从总体抽样得到样本个体,但是总体数量是巨大的,也就无法实现完全模拟总体的样本情况,但是我们为了分析总体,就可以采用抽样的形式,并透过样本推断总体,那么这样就出现了一个我们估计样本估计出来的样本参数值,这一个样本参数值仅仅是在本样本中成立的,对总体而言只是一个总体的估计,也就是说在总体中参数是固定的,而在样本中参数是随机的。那么根据样本推断总体参数时,我们不管是采用最小二乘法还是采用其他的方法,一般得到的都是总体参数的点估计,不管样本参数的准确性如何,我们抽取的样本在那里,不可能完原创 2021-09-25 12:14:07 · 1651 阅读 · 0 评论 -
计量经济学(一)---一元线性回归分析
在学习计量经济学之前,明确几个关系:(1)首先需要明确回归与函数的关系:(2)明确回归分析与相关分析的关系(3)明确回归关系与因果关系(4)明白一些变量称号y X1,X2,....Xn 因变量Dependent Variable 自变量Independent Varibles 被解释变量Exptained Variable 解释变量Exptanatory variables 内生变量Endogenous Variables 外生变量Ex..原创 2021-09-25 15:10:49 · 440 阅读 · 0 评论 -
控制变量、解释变量、调节变量、中介变量、工具变量
1.解释变量与控制变量解释变量是指着重研究的自变量,是研究者重点考查对因变量(被解释变量)有何影响的变量。控制变量是指与特定研究目标无关的非研究变量,即除了研究者重点研究的解释变量和需要测定的因变量之外的变量,是研究者不想研究,但会影响研究结果的,需要加以考虑的变量。也就是说:控制变量与解释变量的操作一样,而且控制变量应该和解释变量一起进入方程,否则会有遗漏误差。但在对回归结果的进行解释时,我们关心的是解释变量的参数大小和方向,而不是控制变量的参数。2.调节变量与调节作用、交互作用考虑变原创 2022-04-14 22:50:01 · 22312 阅读 · 0 评论 -
Stata教程(五)----操作方式
原创 2022-03-10 13:25:19 · 1407 阅读 · 0 评论 -
Stata教程(三)---认识变量
Stata最基础的命令整理和汇总原创 2022-03-07 14:16:41 · 3244 阅读 · 0 评论