自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (8)
  • 收藏
  • 关注

原创 【大数据综合试验区1008】揭秘企业数字化转型:大数据试验区政策数据集大公开!

今天给大家分享的是国内顶级期刊中国工业经济2023年发布的最新期刊《政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验》文章中所使用到的数据集——国家大数据综合试验区政策数据集以及工具变量数据,该文章基于2009-2019年中国上市企业面板数据,以国家大数据综合试验区为准自然实验,从数字生态视角考察国家大数据综合试验区政策对企业数字化转型升级的影响。

2024-07-04 21:02:23 520

原创 【数字基础设施1007】探索数字基础设施的影响:宽带政策变量数据集来了!

宏观数据主要包括数字基础设施发展状况、省市层面的控制变量、机制变量等。其中数字基础设施发展状况代理变量的“宽带中国”政策数据来源于工信部。省市层面的控制变量以及机制变量数据来源于CEIC数据库、复旦大学和第一财经研究院等发布的数据。微观数据来源于中国家庭追踪调查(CFPS)。

2024-06-28 20:57:53 820

原创 【碳排放控排1006】碳排放控排企业名单数据集,探索绿色生产!

中国碳排放权交易机制采取分地区和逐步试点的方式进行,论文中采用双重差分模型进行研究,具体模型构建如下:其中,TFP为企业全要素生产率,对于这一块指标的核算详细信息请查看论文解释变量CTS表示上市公司是否为碳市场控排企业,若上市公司为控排企业,定义为处理组,赋值为1,其他则归入对照组,赋值为0。变量CTS_Post表示企业为碳市场控排和进入时间的交互项,企业被纳入碳市场控排后的年份赋值为1,纳入之前的年份及其他为进入控排名录的企业赋值为0,该变量是论文主要关注的变量。Controls。

2024-06-19 13:09:44 566

原创 【智能制造1005】智能制造试点企业名单及工具变量数据,助力深入研究!

其中,被解释变量为企业创新能力衡量指标,以专利申请数量衡量企业的创新能力;解释变量IM为企业是否实施智能制造虚拟变量,如果企业当年实施智能制造,则IM在当年及之后取值为1 ,否则取值为0;控制变量(Control)包括企业规模、上市年龄、经营现金流、资产负债率、产权性质、第一大股东持股比例、固定资产净额、盈利水平、成长性以及管理层持股比例等,模型中还控制了年份固定效应()和公司层面固定效应(

2024-06-02 15:18:14 863 1

原创 【农村电商1004】 电子商务进农村示范县名单:全面数据集等你探索!

今天给大家分享的发表在国内顶级期刊金融研究的2023年论文《农村发展电子商务能减缓资本与劳动力要素外流吗?——以电子商务进农村综合示范案例为例》使用到的重要数据集电子商务进农村综合示范政策县数据,该论文采用了双重差分法和全国县域面板数据研究了电子商务进农村综合示范政策对农村要素流动的影响与机制。

2024-05-31 15:18:48 932

原创 【社会信用体系1003】 企业违规新解:社会信用环境改善的实证分析!

被解释变量:企业违规行为(EV)采用三种度量方式进行衡量:1、Fddummy,企业违规行为虚拟变量,若企业当年发生违规行为赋值为1,否则赋值为0;2、Fdnumber,采用企业各年违规并已被查处的次数总和度量;3、Fddegree,企业年度违规事件严重程度,根据违规惩罚的程度进行不同数值判别,具体看论文;解释变量:社会信用体系建设(Trus):若企业所在注册城市入选了社会信用体系建设试点城市,则该年份及以后年份Trust取值为1,否则为0;

2024-05-27 21:06:39 850

原创 【普惠金融1002】工具变量数据揭秘:核心节点与地理距离,精准测量普惠金融影响!

本文采用双向固定效应回归模型研究普惠金融对家庭负债的影响,具体模型设定如下:其中, 被解释变量代表第i个家庭在t时期的过度负债指标,论文中使用了客观过度负债和主观过度负债两个指标来表示,后续的分析中也使用了两个指标进行了回归分析,客观负债指标基于CHFS调查问卷中关于家庭债务情况获得的,主观负债指标通过调查问卷来构建衡量指标;解释变量代表第i个家庭t-1时期省级普惠金融指数;代表一系列控制控制变量,包括户主、家庭以及地区层面的控制变量数据;代表家庭固定效应;代表年份的时间固定效用;

2024-05-22 20:37:28 609

原创 【破产法庭1001】2023年期刊论文大数据:破产法庭如何影响商业银行?

该论文采用多期双重差分模型研究破产法庭设立对地方性商业银行的影响,模型构建如下:其中,被解释变量RISK代表城市商业银行和农村行业银行的风险,参考李双建和田国强(2020)、项后军和张清俊(2020)的研究,选取不良贷款率(NPL)、风险加权资产占比(RWA)以及Z_score指数(LNZ)三个指标来衡量银行风险,具体指标的计算查看论文完整过程。

2024-05-21 16:47:34 919

原创 【绿色工厂的影响】 2024年论文独家数据:绿色制造如何推动企业环境信息公开?

今天给大家分享的是经济研究期刊的《绿色制造与企业环境信息披露* ——基于中国绿色工厂创建的政策实验》论文重要数据,该论文以中国绿色制造体系示范建设项目下的绿色工厂创建为准自然实验,深入探究了自愿型环境规制政策对企业环境信息披露的影响效应和机理。

2024-05-19 11:49:25 749 3

原创 支持向量机:抽象难懂?看这里就明白了!

今天给大家分享的知识是关于支持向量机的内容,支持向量机算法是目前学习到的机器学习算法中最抽象、最难以理解的内容,不过支持向量机算法在实际使用过程中还是比较常见,无论是在医学研究还是经济研究中都能看到身影,所有,这一块内容还是非常重要的,而且很多面试中对这一部分的基础知识还是会考察,所以大家还是需要掌握理解。支持向量机(support vector machines,SVM)是一种二类分类模型,但是和一般的二分类模型例如逻辑回归模型在分类结果上还是有区别,支持向量机的二分类是正类和负类的划分。

2024-05-07 14:58:06 593

原创 探秘双重机器学习:因果推断新视角,揭开模型参数偏误之谜!

如果是这么简单就好了,第二个问题出现了,既然这么好,那么为什么机器学习出现之后,传统经济模型在因果推断领域生生不息,大家可以去了解该方面的文章,因果推断还是传统模型居多,说明什么?第二个方面的话,就想文章中说到的机器学习来研究经济问题是存在偏误的,因果推断注重解释,因此在有限数据的情况下,模型的偏误越小越好,但是机器学习追求泛化能力,因此会要求牺牲训练数据的准确性,来实现泛化能力,如果将机器学习直接使用到参数估计,会参数较大的偏差,并且随着数据量的增大,这个偏差会不断增大的,后续会有公式推导。

2024-04-11 15:54:44 2969

原创 处理不平衡数据问题的利器!分位数随机森林算法解密

第一、我们首先按照规则生成随机森林中的树,假设有T课,树的生成和随机森林其实规则不太一样,在分位数随机森林中,我们首先计算出指定分位数对应的值,遍历所有特征以及特征的值,选择一个特征及值作为分裂点,标准参考随机森林(信息增益、残差平方和最小),将数据中小于分位数的数据划分到左边,大于等于分到右边,按照这样的过程生成树,知道满足某种条件,参考随机森林。”回复关键词获得,同时与分位数随机森林的研究论文我也将放到公众号,大家也可以回复关键词获得,不用于盈利,只做知识的传播者!所对应的变量最小值称为该分布的。

2024-03-03 23:19:24 629

原创 贝叶斯定理与条件独立假设:朴素贝叶斯分类方法深度解读

今天给大家分享的是朴素贝叶斯算法,这个算法在实际使用中不是很多,因为现在很多算法已经发展的很好,性能上也比朴素贝叶斯算法的好很多,因此在实际中我们其实看到在实际应用中朴素贝叶斯算法的使用已经比较少,即使出现,最终的效果也是不及其他算法的,但是作为简单、基础的算法之一,我们掌握该算法的原理还是非常有必要的,同时在实际论文研究中也经常会使用贝叶斯算法的改进版,所以大家可以多了解了解。大家也可以根据贝叶斯定理的前验分布和条件概率分布求出某个数据特征的后验概率,从而可以得出数据的类别,大家可以指定。

2024-03-02 00:12:10 1085

原创 探秘XGBoost:GBDT算法的升级版极端梯度提升树解析

在得出该公式之后,在每一轮训练中,我们使用该公式可以得出每一轮训练候选模型的得分,只要选择得分最低的模型作为该轮训练模型的最优模型即可,由于我们得出最优的叶子结点权重以及叶子结点个数之后,我们是可以确定决策树的模型的,但是这样的模型并不是唯一的,因为输出为指定值以及指定个数的决策树模型肯定会存在多个,同时由于叶子结点的个数也是可以拓展的,因此,按照这样的方式来备选的决策树模型有无穷多个,因此,遍历选择最优的方法不具备实操性。代表第k个决策树模型,即XGBoost模型就是k个决策树模型的累加和。

2024-02-26 21:17:44 785

原创 GBDT——梯度提升树算法详解

和梯度提升模型一样,我们首先初始化一个模型,该模型的预测值是所有真实值的均值,然后,我们开始M轮模型的迭代更新,在每一轮子模型构建中,我们采用决策树模型来进行构建,通过决策树模型来不断拟合上一轮中真实值和预测值之间的“残差”,通过决策树子模型,我们可以利用数据的特征将数据划分到不同的叶子结点,再分别计算不同叶子结点中使得损失函数最小化的步长,计算完之后,新的模型就变成了原模型基础上加上一个使得残差不断减小的决策树子模型的结合,我们接下来将会使用实际案例进行展示。代表步长,我们怎么求得这个步长呢?

2024-02-25 13:09:14 968

原创 随机森林——基于Kaggle数据的销售额预测

将数据划分为训练集、测试集数据之后,我们使用了训练集数据进行模型训练和调优,当然调优是采用交叉验证将训练集数据划分一部分为验证集数据进行的,在训练完模型之后,我们还有更重要的一步就是使用外部数据集也就是测试集数据评估模型性能,对于回归模型性能的评估常用的指标有均方误差(MSE)、均方根误差(RMSE)、绝对误差以及。我们采用分位数距离的1.5倍为浮动区间,对数据进行选择,并对选择之后的数据观察分布,经过处理之后,数据分布逐渐成正态分布,我们就以周销售额数据分布为例进行展示,

2024-02-23 19:31:44 1655

原创 探秘Cart算法:决策树新视角,数据预测行云流水!

理论上的答案是不会。大家可能比较好奇为什么要减去最小的g(t),这是因为当模型完全拟合训练数据的时候,模型的预测准确率非常高,同时模型的复杂也比较高,但是模型的在未知数据上的性能不一定很好,因此,为了保证我们模型的精准率,我们只能选择选择减去最小损失减少程度的决策树,如果损失减少程度比较大的话,模型的性能可能得不到保障,因此我们只能从最小损失减少程度见起。但是实际过程中,仍然会出现过拟合的情况,因此在训练过程中我们还是会采取前剪枝相关的参数设置与交叉验证相结合,对其中的树模型进行修剪,降低过拟合。

2024-02-21 23:03:12 694

原创 决策树:解密算法的奥秘,理论与实践一网打尽!✨

假设我们有包含用户信息的数据包括年龄、收入等以及用户分类的数据,图中的圆形在决策树分类中代表用户的特征,例如年龄,被称为内部结点,图形中的正方形图案代表用户的分类,被称为叶子结点,对于有向边在决策树中代表不同的标准,例如按照年龄进行分类,左边是小于多少年龄的用户,右边是大于多少年龄的用户,因此,从整个树结构图中可以看出,数据总是能够按照某一条分裂路径找到属于自己的类别,以上就是树结构相关的基础知识。如果α越大,为了使整体取最小,只能让前面部分内容变小,因此,将会降低模型的复杂度。

2024-02-21 10:56:57 809

原创 聚类分析——基于Kaggle数据集实战

聚类算法在实际中的应用主要侧重在以下几个方面:一、目标划分、特征画像,将目标数据按照特征的相似性,将目标划分为不同的类别,然后再对不同的类别进行特征描述,最后做出与研究目标相关的建议,这一块的话在论文和竞赛中使用比较常见,尤其是竞赛中做客户的特征画像,分析不同群体特征,从而给出针对性的建议;本次使用的聚类算法是kmeans++算法和层次聚类两种聚类算法进行演示,其中K-means++是对传统Kmenas算法的改进,旨在改善初始质心的选择,以提高算法的性能和结果的稳定性。

2024-02-19 14:20:36 2343

原创 Lasso回归——基于R语言实现

R语言在数据分析和机器学习方面目前也使用得比较多,很多前沿论文以及实战也是采用R语言进行,因此,对于R语言的学习也有一定的必要,今天给大家展示R语言是如何实现Lasso回归以及分析一下python和R语言在回归时的差别和注意点,并且相关代码也会同步上传到公众号,大家前往公众号获得。首先,我们先导入R语言所需要的包文件,使用到的核心包为"glmnet"包,如果大家没有安装,可以先安装该包文件,安装命令也会在代码中附上,安装完之后添加包依赖,如果已经安装,直接添加包依赖即可。

2024-02-17 13:40:55 3132 2

原创 Lasso回归——基于Kaggle数据集实战操作

特征选择方面的应用在金融、医学等领域应用比较广泛,较常用的步骤是先通过Lasso回归选择出对目标变量影响最大的特征,然后再利用这些特征构建模型,在一定程度上降低了模型的过拟合,提升了模型的泛化能力同时提升了模型的可解释性。在机器学习中,偏差是指模型在不同样本集上真实值和预测值之间的差异,简单地说,偏差衡量了模型对真实关系的拟合能力,如果偏差较低,模型能够相对准确地拟合数据中的关系,在这种情况下,模型可能在训练集上表现得很好,但是在测试集上的性能还需要检验。模型使用的数据来自于Kaggle网站中的。

2024-02-16 16:59:15 1519

原创 pandas中数据切片datetime索引数据出现‘Value based partial slicing on non-monotonic DatetimeIndexes with non-exis

datetime类型数据处理的实践中出现了'Value based partial slicing on non-monotonic DatetimeIndexes with non-existing keys is not allowed.'异常该如何处理

2023-10-03 21:28:40 2082 2

原创 SpringBoot+SpringSecurity+ElementUI智能工厂项目

下面小编就详细给大家分享一下自己开发的智能工厂项目,本项目的实际业务需求主要是应用于一线公司生产,目前系统的主要功能模块包括用户模块、角色模块、权限模块以及实际业务功能成品验收模块,因为这是该项目的初步开发,功能模块还不是太多,后续肯定会对系统功能进行延伸,衍生的思路和目前开发模块的功能大致相似,系统会涉及到权限控制相关功能,权限控制框架采用的是SpringSecurity框架,该系统是一个完全的后台管理系统

2023-02-20 10:07:11 234 1

原创 SpringBoot整合SpringSecurity详细教程(实战开发讲解)

今天小编使用到了SpringBoot+SpringSecurity进行公司项目开发,之前使用到项目都是采用xml配置来整合SpringSecurity,对于第一次使用SpringBoot整合SpringSecurity也是比较陌生,过程中也是遇到各种各样的问题,在CSDN的知识海洋中遗留的相关的整合教程也是五花八门,找一篇完整的教程简直像是大海捞针,so,小编决定亲自挥笔,整顿这种低质量博文

2023-02-07 19:01:45 8429 7

原创 Java如何获取客户端主机真实IP地址

项目开发中,小编遇到一种需求,就是将系统项目与某台主机的IP地址绑定,让该系统只能在某台主机上使用,不要问小编为什么,我也是第一次遇到这么奇怪的需求,当然也不要问小编为什么不使用权限控制,现在的权限控制组件已经发展的比较好了,答案就是领导嫌麻烦,我也很难办,事情难归难,可还是得解决,怎么解决这个事情呢?小编最开始的思路是这样的

2023-01-09 17:01:27 1709

原创 Dubbo++七牛云图书上传+ElementUI+SpringSecurity图书借阅管理系统

接下来的话给大家分享一下自己做的图书借阅管理系统,系统的组织架构如下,原本的系统设计是包括前台借阅申请系统和后台管理系统,前台系统分别包括电脑端和微信端都有页面访问,但是由于公司硬件不支持,所以就只开发了电脑端端访问页面,电脑端前端访问页面主要包括三个部分内容:分别是用户注册、图书借阅、图书归还;后台系统图书管理、借阅管理以及用户管理三个部分;后台系统的权限控制是由springSecurity来完成的

2023-01-09 16:38:46 224

原创 Docker搭建FastDFS环境出现容器开启闪退现象的详细解释

今天,小编在学习到FastDFS的实践知识时,需要使用Docker搭建FastDFS的环境,小编在FastDFS环境搭建过程中,都是正常的按照标准的环境搭建步骤进行的,但是在搭建过程中却出现了容器闪退的现象,并且在该容器的日志信息里面出现。二、小编开始创建相关的容器,因为在这过程中需要创建两个容器,两个容器都遇到了相同的问题,这里这将其中的一个容器进行展示,另一个容器一样,容器创建的命令这里就不做演示,大家可以去网上查看。,这一看还真的发现了问题,大家可以看到我的FastDFS镜像的架构是。

2023-01-04 17:51:30 498

原创 在IDEA中使用拉取在gitee上的项目文件的操作步骤明细

今天小编今天开始进行团队开发项目实践,团队开发合作的挑战和难度其实比个人开发的过程更具有难度和挑战性,对于第一次进行团队开发的萌新,自己也是在快速适应,首先自己在从git上面拉取项目就存在问题,平时自己使用idea拉取项目也不是很多,所以对于这一方面的操作自己也是不太熟悉,我相信会有和我同样经历的朋友,因此自己会从一个初学者的角度一步一步的进行这样的一个操作实践,来帮助大家顺利地实现这样的一个操作流程。第一步、点击File->New->选择项目从版本控制,也就是上面的Version Co

2022-03-24 18:15:46 21498 5

原创 Spring整合mybatis、springMVC详细步骤以及配置文件信息详细解释

今天小编的学习已经往更深层次前进,开始学习到了spring框架,新阶段的学习与之前传统的学习任务已经内容有了一定的变化,对于这种变化小编开始还是不太适应,该开始之前的编程学习需要写很多的代码,实战学习也是由潜入深,虽然说每次编写的代码量都很冗长复杂,但是不可否认,在一点一点的代码编写过程中,自己对代码执行流程和各个部分执行的功能理解也会好很多,但是学习到了框架之后,较多的内容已经以配置文件的形式进行一个呈现,其中对于以前重来没有出现过的配置信息以及新模块的使用,初次接触还是感觉陌生,所以小编将自己学习过程中

2022-03-22 19:13:09 1371

原创 AOP概念及作用详细解释

今天学习spring的时候接触到一个新的知识以及概念AOP,老师当时讲这个知识点的时候,并没有讲太多关于这方面的知识,我们所学习到的知识侧重于应用,所以对这一块的理论知识是有一点缺少,以至于小编在学习完AOP之后,也不太清楚这是一个什么东西,到底有什么作用?因此小编自己在课余时间对这方面知识进行了一个补充学习,并且将自己的课后积累进行一个分享,希望能够帮助到和我一样迷惑到学习者!小编的每一遍文章自己都有很用心的在编写,希望自己的这份用心能够在帮助大家的同时得到大家的支持和鼓励,如果各位客官觉得小编的文章对各

2022-03-20 16:45:22 16860 5

原创 使用springmvc注解开发关于静态资源被拦截的解决方案

初次接触到springmvc,在编写自己的项目等时候,出现jQuery不能访问的情形,在使用ajax发送请求的时候出现jQuery不能被找到的情况,出现404红码!自己的项目结构如下对于这样的情形,小编也是第一次遇到,刚开始小编将自己的jsp页面以及jQuery文件都是放在WEB-INF目录之下的,后面经过别人的讲解,将jQuery以及静态配置文件放在WEB-INF目录之下其实不好,因为js是通过url进行加载,而WEB-INF目录下的文件是无法直接通过url进行加载获取,所以会存在拦截的.

2022-03-19 11:44:58 2209

原创 关于IDEA中JAVA工程Maven项目左边project结构以及右边maven结构突然消失的解决办法

在使用idea进行springmvc学习的工程中,创建的maven项目,左边的project结构和右边的maven结构突然消失,只留下空荡荡的两条杠,编程代码的空间倒是大了,但是耐不住小编需要使用这两个快捷键啊!于是带着一点的不安和好奇,小编开启了自己的快捷键查询旅程,终于成功的找到那个谜一般的快捷键,特此分享,希望和我有相同问题的朋友可以学习借鉴,节省时间!!一打开idea,惊呼我的左膀右臂呢!!对于一个初学者来说,突然消失的助手对我的学习还是造成了一定的困扰。于是我决定最终还是被

2022-03-18 13:03:20 1552 1

Eureka 全部配置详细解释

Eureka 全部配置详细解释

2022-05-21

15-spring-boot-短信发送.md

15-spring-boot-短信发送.md

2022-04-12

09.Shiro.md

09.Shiro.md

2022-04-12

06-spring-boot-文件上传下载.md

06-spring-boot-文件上传下载.md

2022-04-12

01-spring-boot-基础.md

01-spring-boot-基础.md

2022-04-12

03-spring-boot-mybatis-plus数据层框架.md

03-spring-boot-mybatis-plus数据层框架.md

2022-04-12

05.Mybatis.md

05.Mybatis.md

2022-04-12

dubbo-admin的安装使用手册

dubbo安装手册,文件内容会对dubbo-admin的安装进行详细介绍,解决你的dubbo-admin安装过程中的问题,能够让你在使用dubbo-admin的开发中少一份问题,多一分安心!

2022-04-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除