自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(160)
  • 收藏
  • 关注

原创 蓝桥杯嵌入式开发实战指南:从代码优化到高效调试的进阶之路

在蓝桥杯的赛场上,优秀开发者需要兼具工程师的严谨与艺术家的创造力。通过本文阐述的寄存器级优化、RTOS应用与智能调试方法,开发者不仅能提升竞赛成绩,更能培养出对嵌入式系统深层的理解力。记住:真正的技术突破往往发生在芯片手册的字里行间,在示波器的波形跳变瞬间,在那些反复调试的深夜时分。愿这些经验之谈,能成为您嵌入式开发之路上的明灯。

2025-04-23 14:45:12 961

原创 《Cangjie Magic:智能体开发的范式革命与实践启示》

Cangjie Magic不仅是一个开发框架,更是智能体技术演进的催化剂。当开发者用仓颉代码书写智能体的"生命逻辑"时,我们正在创造的是一个具有社会属性的数字物种。这场始于代码的革命,终将重塑人类与智能的共生范式。

2025-04-23 14:36:43 531

原创 Tomcat新手登峰指南:从零到部署的原子化实践

掌握版本生命周期(当前LTS版本为10.1.x)建立配置变更记录制度(推荐使用Git管理conf目录)参与Tomcat中文社区(获取最新调优方案)

2025-03-14 14:51:40 608

原创 Keil5调试必杀技:资深工程师不愿透露的7大实战秘籍

在2024年嵌入式开发者调研报告中,73%的工程师反馈调试时间占项目总工期的40%以上。笔者曾亲历一个典型案例:某智能家居团队花费3周定位温控系统偶发故障,而掌握高级调试技巧后,同类问题可在2小时内解决。本文将揭示7个经过实战检验的Keil5调试技巧,助你实现从"printf调试法"到"精准外科手术式调试"的跨越。// 自动执行初始化序列// 创建观测面板。

2025-03-14 14:45:27 1194

原创 【JS性能优化黑魔法】从8秒到0.8秒的奇迹の逆袭(祖传代码大改造)—— 让老板跪下喊爸爸的极致优化指南

为什么transform比top性能好?—— 就像搬家时打包所有东西一次运走,比来回跑20趟高效!闭包就像前任,该放手时就放手!Chrome DevTools的Memory面板是你的捉鬼敢死队。遇到动态元素就上事件委托,就像学校装个校长信箱,比给每个学生配秘书靠谱!:输入即搜索导致API爆炸。:暴力遍历 vs 哈希映射。:大数据处理导致界面冻结。:购物车动画卡成PPT。:万级数据列表点击卡顿。:SPA应用越用越卡。

2025-03-12 10:57:12 265

原创 【Python机器学习整活指南】从调参师到炼丹师の奇妙冒险(附祖传代码)—— 零基础也能搞定的AI摸鱼实战手册

— 祖师爷Weka说过:"能用默认参数解决的问题,就不要调参!(注:本文包含约15个可运行代码片段,完整项目文件可通过三连后私信小编获取🐶):"conda安装失败"的108种解法 & 祖传虚拟环境配置大法。类别特征处理:pd.get_dummies()一键召唤独热编码。:⭐⭐⭐(需要和pandas DataFrame斗智斗勇)为什么不用深度学习?—— 杀鸡焉用牛刀!:⭐⭐⭐⭐(可以发朋友圈的水平):⭐(比泡面多加个蛋还简单)

2025-03-12 10:50:49 338

原创 MATLAB代码开发实战:从入门到高效应用

开发者不仅能掌握MATLAB代码开发的核心方法,还能获取经过验证的实战方案。点击下方开启高效开发之旅!

2025-03-12 10:36:41 886

原创 用纯C语言打造迷宫游戏:从源码解析到实践应用的终极指南

define MAZE_WIDTH 50 // 迷宫列数#define MAZE_HEIGHT 50 // 迷宫行数#define CELL_SIZE 20 // 像素单位单位 #define WALL_THICKNESS 2通过本项目的学习,您将获得:✅ 深入理解内存管理与算法优化✅ 掌握SDL图形编程核心技巧✅ 建立系统级编程思维✅ 获得可写入简历的完整项目经验立即下载源码,加入全球10,000+开发者都在学习的C语言迷宫项目!在评论区留言"迷宫挑战"即可获取独家调试工具包。

2025-02-21 16:33:49 564

原创 Elasticsearch实战应用:从“搜索小白”到“数据侦探”的进阶之路

Elasticsearch是一个分布式的搜索和分析引擎,基于Apache Lucene构建。它能够快速地存储、搜索和分析大量数据。分布式:数据可以分布在多个节点上,实现高可用性和扩展性。实时性:数据几乎可以实时地被索引和搜索。全文搜索:支持复杂的全文搜索功能,包括模糊搜索、短语搜索等。多租户:支持多个索引和类型,可以在一个集群中管理多种数据。通过今天的介绍,相信大家对Elasticsearch有了更深入的了解。Elasticsearch不仅是一个强大的搜索工具,还是一个灵活的数据分析平台。

2025-02-21 16:10:49 892

原创 服务器虚拟化:从“一机一用”到“一机多用”的魔法之旅

首先,让我们来理解一下什么是虚拟化。简单来说,虚拟化就是通过软件技术,将一台物理服务器“分割”成多个虚拟服务器,每个虚拟服务器都可以运行独立的操作系统和应用程序。你可以把它想象成在一台电脑上同时运行多个虚拟机,每个虚拟机都像是一台独立的电脑。通过今天的介绍,相信大家对服务器虚拟化有了更深入的了解。虚拟化技术不仅提高了服务器的资源利用率,还为企业带来了更高的灵活性和可扩展性。无论是小型企业还是大型数据中心,虚拟化都是未来IT基础设施的基石。我们下次再见,继续探索更多有趣的技术话题!

2025-02-21 14:34:16 824

原创 各类病例报告

农牧区散养户饲喂牛羊霉变玉米秸秆致死亡的病例报告。一例GMS染色确诊犬胃腐霉病的病例报告。犬先天性腭裂病例报告。

2024-12-30 15:29:29 228

原创 Docker实践与应用:操作指南与实际案例

创建一个自定义的桥接网络:Copy code通过本文的介绍和实际操作案例,读者应该对Docker的基本使用有了深入的了解。Docker的强大之处在于它能够简化应用的部署和运维工作,提高开发和生产环境的可移植性。未来,随着容器技术的不断发展,Docker将继续在云计算和微服务架构中扮演重要角色。希望本文能够帮助读者更好地掌握Docker的使用,并在实际工作中发挥其价值。

2024-12-27 09:34:58 459 1

原创 基于图神经网络的动态物化视图管理

局限性: 传统的MV管理依赖于数据库管理系统中的优化器来估算MV的效益,但在动态工作负载的情况下,这种方法往往无法准确反映MV的真实收益,从而导致低效的MV管理。由于静态的MV不能有效应对查询分布的变化,提出了一种基于学习的方法以提高收益估计的准确性。挑战效益估计:如何在大量查询中,准确评估每个MV对每个查询的效益,以生成高质量的MV。高效维护:如何在动态场景中高效维护MV集合,以适应新的查询工作负载,保持高精度的效益估计。

2024-12-27 09:31:22 924

原创 全国数据库数据分享(第二期)

雨天(Rainy),晴天(Sunny),多云(Cloudy),雪天(Snowy) 问题描述 天气类型分布分析 特征相关性分析 异常值影响分析 特征重要性评估。数据说明 字段 说明 Plant_ID 每株植物的标识符 Date 观测日期 Temperature (°C) 温度,以摄氏度为单位 Humidity (%) 湿度水平,以百分比表示 TDS Value (ppm) 总溶解固体值,以百万分之一(ppm)为单位 pH Level 环境的pH值 Growth Days 植物从开始生长到完全长成所需的天数。

2024-12-23 09:51:54 856

原创 战术:我做你看 - 加示例

本文探讨了一个提升提示词效果的重要策略——增加示例。通过添加示例,模型能够更好地学习和应用相关内容,从而优化输出效果。文章总结了构建提示词示例的几个关键原则:示例的构造应遵循由少到多的顺序,确保示例的正确性,保证其代表性与多样性,并且示例构造可以自动化。遵循这些原则,将有助于充分发挥提示词示例的效果。

2024-12-18 20:02:13 63

原创 提示词战术技巧-前导课

提示词是用于引导大模型生成期望输出的输入文本。设计好的提示词可以显著提升模型的表现。

2024-12-18 19:55:01 87

原创 MATLAB 操作指南(结尾附实操案例)

MATLAB(矩阵实验室)是一个高级技术计算语言和交互环境,它主要用于数值计算、数据分析、算法开发和可视化。MATLAB 的核心功能是矩阵运算,它能够处理向量和矩阵为中心的数学问题,方便用户进行算法的开发和数据可视化。% 返回输入的平方end将该代码保存为% result 将得到 25。

2024-12-12 10:49:50 3367

原创 拆解:复杂任务应对之道

掌握大语言模型的提示词需要实践和经验。清晰明确:确保您的提示词明确且具体。灵活应变:不要害怕尝试不同的提示词并进行调整。持续学习:关注其他用户的提示词示例,学习如何在不同场景下应用它们。记录与迭代:保持提示词的记录,分析哪些有效,哪些无效,以便不断提高。通过以上的策略和案例分析,我们希望能帮助您在使用大语言模型时更有效地构建和优化提示词,从而提高工作的效率和输出的质量。继续探索,不断实践,您将能更好地掌握这一强大的工具,在各种复杂任务中游刃有余。

2024-12-12 10:14:04 70

原创 上市公司环保处罚数据(截至2023.12)

上市公司环保处罚是指因违反环境保护法律法规而对上市公司及其关联企业实施的行政处罚。主要针对企业在生产活动中产生的环境污染、违规排放、未按要求处理废弃物等行为。数据说明:统计日期截至2023.12,包含是否环保处罚、处罚次数等。本次分享的数据包括历年上市公司是否环保处罚、以及处罚次数等数据。上市公司环保处罚数据-excel格式。上市公司环保处罚数据-stata格式。数据名称:上市公司环保处罚数据。数据年份:1999-2023年。数据样本:6.45万条。数据来源:生态环境局。

2024-12-05 14:40:17 649

原创 企业风险投资、融资事件数据(1921-2024)

数据包括历年上市与非上市企业的风险投资融资数据等数据,包括融资时间、被投企业、投资方、退出方等数据,希望对大家的研究有所帮助。全数据集资源,需要的小伙伴欢迎私信沟通。企业风险投资融资数据-excel格式。数据名称:企业风险投资、融资事件。数据年份:1921-2024.2。数据说明:包含投资、融资相关信息。数据范围:上市与非上市企业。数据样本:27.8万条。

2024-12-05 14:27:47 242

原创 数据库数据分享

颜色:指观察到的生咖啡豆的颜色。一、数据介绍 数据名称:全球各国-经济制度距离 数据年份:2005-2022年 样本数量:3130条 数据格式:面板数据 二、指标说明 主要包括:国家、年份、经济距离(根据美国传统基金会世界经济自由度指数整理)、经济距离(参考(Kogut&Singh,1988)构建经济制度距离) 三、数据文件 全球各国-经济距离数据2005-2022.xlsx;如性别、年龄、职业、睡眠时间、睡眠质量、身体活动水平、压力水平、BMI类别、血压、心率、每日步数、以及是否有睡眠障碍等细节。

2024-12-03 10:01:43 698

原创 测评:全面把握提示词效果

在计算机科学及人机交互领域,提示词是用来引导用户输入信息、提供反馈或触发相关功能的文本或语句。它们可以是简单的文本提示,也可以是复杂的指令,旨在帮助用户更好地理解系统的功能及使用方法。

2024-12-03 09:27:27 401

原创 战略:定义什么是好的提示词

本文指出掌握提示词的战略思想是提示词创作的宏观指导思想,也是提示词好坏的重要判断标准。从专注聚焦到清晰具体、充分详尽、避免歧义和确保安全,每一个策略都为我们指明了提示词编写的方向。提示词编写过程中不要拘泥于某种特定的提示词框架,我们需要根据实际场景融会贯通。此外,在进行提示词创作之前,我们需要有多次调优的心理预期。提示词的编写难以一蹴而就,需要根据结果不断进行迭代和优化,逐步逼近模型能力的上限。“一千个读者,就有一千个哈姆雷特”,每个人对好提示词的定义各不相同。

2024-12-03 09:01:44 107

原创 JavaScript 前端开发操作指南

JavaScript 是一种广泛使用的前端开发语言。它允许开发人员创建动态交互式网站和应用程序。现代 JavaScript(通常称为 ES6 及以上)引入了许多新特性,使得编写和维护代码变得更加容易。以下是阿里开源的一套企业级的 UI 设计语言和 React 实现,使用 TypeScript 构建,提供完整的类型定义文件,自带提炼自企业级中后台产品的交互语言和视觉风格、开箱即用的高质量 React 组件与全链路开发和设计工具体系。JavaScript 是前端开发的核心语言,它为我们提供了大量的工具和功能。

2024-11-28 14:59:46 621

原创 基础:提示词创作和调优的必备知识

为了系统掌握大语言模型提示词的创作与调优,首先必须掌握一些基础知识。这包括大语言模型提示词提示词模板提示词工程模型微调RAG的概念和关系。此外,我们应认识到,并非所有问题都能通过提示词工程来解决,了解还有哪些常见的其他手段。掌握这些知识将为后续系统学习提示词创作与调优技巧奠定坚实基础。提示词(Prompts)是与大型语言模型(如通义千问、GPT-4)互动时输入的一段文字或问题。这段文字或问题引导模型生成相应的回答或内容。通俗来讲,如果你需要将一个任务交给另外一个人,你就需要把任务给对方说清楚。

2024-11-28 14:28:22 219

原创 Python 网络爬虫操作指南

网络爬虫(Web Crawler)是一种自动抓取网站信息的程序。不同于手动从网页上提取数据,爬虫可以高效、自动化地获取大量数据。我们将爬取一个新闻网站的标题和链接。这里以“http://news.ycombinator.com/”作为示例,该网站提供了最新的技术新闻。通过本文的学习,你已经掌握了网络爬虫的基本知识、环境配置、编码示例及数据存储等操作。爬取动态网页的数据,使用Selenium库实现。存储爬取数据至数据库,如SQLite或MongoDB。实现更复杂的爬虫框架,如Scrapy。

2024-11-23 11:09:12 2761

原创 开篇词:如何才能精通提示词?

相信在学习完本小册之后,你将对提示词工程有一个深刻的认识,能够系统地掌握大语言模型的提示词工程,轻松编写高质量的提示词与大模型进行交互,高效解决工作、学习和生活中的各种问题,助力你成为“更擅用 AI 的人”,更好地享受 AI 快速发展的红利。:我们将讲解常见的提示词框架,教大家学会“偷懒”实现自动化提示词编写,介绍提示词的安全防御相关知识,通过提示词创建各种智能体为工作、学习和生活提效,还会给出系统地提示词调优思路、方法和案例,最后对提示词的局限性和未来发展进行展望。最关键的是要对业务和任务有深入的理解。

2024-11-14 10:02:42 122

原创 系统掌握大语言模型提示词 - 从理论到实践

现阶段正处于AI应用崛起的前夜,提示词工程作为大语言模型的沟通桥梁,是一门重要的技能,也是一门“提问的艺术”。掌握编写高质量的提示词的诀窍,了解调优思路和方法,能更好地发挥大语言模型的作用,为你的生活、学习、工作(甚至是换工作)带来巨大的助力。以大厂为例,在应用 AI 化的背景下,学会大模型业务选型、提示词工程编写与调优,那么你比其他人更快、更容易拿到更好的业务结果。在这个 AI 快速发展的时代,你是否也希望更好地驾驭大语言模型提高工作、学习的效率、助力业务的发展?

2024-11-14 09:59:37 465

原创 图像识别

图像识别是计算机视觉的一部分,其目的是让计算机能够理解图像内容。它可以包括识别图像中的物体、场景、行为等信息。本文详细介绍了图像识别的基础知识、技术栈选择及实用的操作指南。通过实际操作,您学会了如何构建和训练一个基本的图像分类模型,并通过数据增强和迁移学习来提升模型性能。同时,还展示了如何将其作为API进行部署。图像识别是一个快速发展的领域,您可以通过不断学习和实践,进一步拓展应用场景和技术深度。如果您有任何疑问或想更深入了解某一部分,请随时联系我!

2024-11-14 09:41:52 2206

原创 小程序开发操作指南

本文简要介绍了小程序开发的基础知识、配置、组件、API 使用及数据存储等。通过实践,可以更深入地理解小程序的开发流程和特性。希望您能在小程序开发的道路上越走越远,创造出更好的应用!如果您有任何疑问或需要进一步的指导,欢迎继续交流!

2024-11-14 09:35:31 943

原创 湖北统计年鉴

湖北统计年鉴》内容分为24个章节,涵盖了综合概况、人口结构、就业与工资水平、固定资产投资情况、对外经济贸易及旅游业发展、能源消耗与利用、财政收支和金融状况、物价变动趋势、城乡居民生活水平、城市基本概况、自然资源与环境保护、农业生产、工业发展、建筑业现状、服务业表现、交通运输及邮电通讯业发展、国内贸易活动、科技创新与教育事业、医疗卫生服务、社会福利与保障、文化体育事业发展以及公共管理等多个方面。数据名称:免费共享-《湖北统计年鉴》2000-2023年。《湖北统计年鉴》2000-2023年。

2024-11-04 15:25:14 489

原创 Linux系统性能调优技巧操作指南

Linux系统的性能调优是一个复杂而重要的过程,尤其在高负载、高并发的环境下。通过本文的介绍,您将了解一些Linux性能调优的基本理念、工具和技术,并附带实际的操作案例与代码示例,以帮助您更好地应对性能瓶颈。

2024-11-04 10:19:05 832

原创 JavaScript 网页设计案例操作指南

随着互联网的发展和现代网页设计的需求,JavaScript 已成为构建动态网页和增强用户体验的重要工具。无论是简单的网页交互,还是复杂的单页应用,JavaScript 的使用场景都越来越广泛。在本指南中,我们将通过构建一个简单的动态网页应用示例,深入探讨 JavaScript 在网页设计中的实际应用。我们将实现一个待办事项列表 (To-Do List) 应用,涉及 HTML、CSS 和 JavaScript 的协作,提供具体的代码示例和详细的操作步骤。首先,创建一个新的文件夹,命名为 。在该文件夹中,我们将

2024-10-31 10:56:07 1237

原创 Docker 安装使用操作指南

有时我们需要构建自己的 Docker 镜像。可以通过 Dockerfile 来实现。Docker 是一个强大的工具,通过容器化技术,为开发者提供了一种高效的应用部署方式。在本指南中,我们讨论了 Docker 的安装、基本命令、自定义镜像构建、数据持久化、Docker Compose 以及容器管理等方面的内容。通过实际案例的演示,相信你已经掌握了如何利用 Docker 来简化开发与部署流程。在实际项目中,能够灵活运用 Docker 的各种功能,将极大地提升你的工作效率与开发体验。

2024-10-31 10:18:30 1080

原创 《Spring Boot 应用开发研究》

未来,Spring Boot 将继续发展,与更多的技术进行融合,为开发者提供更加便捷的开发体验。在当今快速发展的软件行业中,开发高效、可靠的应用程序是企业和开发者的共同追求。Spring Boot 作为一种轻量级的 Java 开发框架,以其简洁的配置、快速的开发速度和强大的功能,在企业级应用开发中得到了广泛的应用。Spring Boot 中的自动配置类根据项目中引入的依赖和环境变量,自动配置应用的各种组件。它将能够根据项目的具体情况和开发者的习惯进行更加精准的配置,进一步减少开发者的配置工作量。

2024-10-17 14:15:10 900

原创 大数据治理:挑战与策略

某金融机构通过建立数据治理框架,制定数据标准,加强数据质量管理,保障数据安全和隐私,推进数据集成与共享等措施,实现了大数据的有效治理。我们应积极应对大数据治理的挑战,把握大数据治理的发展趋势,不断提高大数据治理的水平,为企业和组织的发展提供有力的支持。本文首先阐述了大数据治理的概念和目标,接着分析了大数据治理面临的挑战,包括数据质量、数据安全、数据隐私、数据集成等方面。然后,详细介绍了大数据治理的策略和方法,包括建立数据治理框架、制定数据标准、加强数据质量管理、保障数据安全和隐私、推进数据集成与共享等。

2024-10-17 14:10:03 1399

原创 Elasticsearch 实战应用与优化策略研究

本文深入探讨了 Elasticsearch 的实战应用与优化策略,取得了以下主要研究成果。在 Elasticsearch 的基础理论方面,我们详细介绍了其架构与原理,包括文档存储与索引的分布式架构以及 Java API 和 HTTP 的 Restful API 两种交互方式。同时,通过与 B-Tree 索引对比,阐述了倒排索引在性能上的优势,如减少磁盘随机访问次数、节省磁盘空间等。并且解释了 Elasticsearch 实现快速索引的原理,包括分词、建立倒排索引、优化策略以及压缩技术等。

2024-10-16 16:43:43 1218

原创 自动化运维的研究与应用

自动化运维通过引入自动化技术和工具,实现了运维工作的自动化、智能化和高效化,大大提高了 IT 系统的可靠性和稳定性,为企业的业务发展提供了有力的保障。本文介绍了自动化运维的概念、特点和优势,详细阐述了自动化运维的关键技术和工具,通过实际案例分析了自动化运维在企业中的应用效果和价值,并对自动化运维的未来发展趋势进行了展望。自动化运维是指利用自动化技术和工具,对 IT 系统进行自动化的配置管理、监控管理、部署管理、故障管理等运维工作,以提高运维效率、降低运维成本、提升 IT 系统的可靠性和稳定性。

2024-10-16 16:34:40 1045

原创 React 前端框架操作指南

React 是一个用于构建用户界面的 JavaScript 库,由 Facebook 开发和维护。它使用组件化的方式来开发,允许开发者将 UI 拆分成独立、可重用的部分,并在每个部分之间管理状态和行为。并发模式允许 React 中断和恢复渲染以保持流畅的用户体验。利用该功能,您可以让 React 针对用户与应用的交互优先处理重要更新。目前大多数功能仍在开发中,建议关注后续文档以获得最新信息。

2024-10-12 11:32:31 2285

原创 计算机学习实战

计算机学习是一种使计算机从数据中学习并进行预测的技术,通常不需要显式编写规则和逻辑。它包括若干子领域,如监督学习、无监督学习和强化学习。

2024-10-08 17:41:04 1096

各国数字服务贸易进出口额(2010-2022年)

01、数据简介 数字服务贸易进出口额是指各国在数字服务领域进行的出口和进口活动的总金额。这一指标反映了各国在数字服务贸易领域的规模和发展水平,是评估数字服务贸易竞争力的重要依据。 数字服务贸易涵盖了保险和养老金服务、金融服务、知识产权使用费、电信、计算机和信息服务、个人、文化和娱乐服务、其他商业服务等多个领域,每个领域都有其独特的特点和发展趋势。随着全球数字化进程的加速推进,数字服务贸易将继续保持快速增长的态势,为全球经济的发展注入新的动力。 数据名称:各国数字服务贸易进出口额 数据年份:2010-2022年 数据来源:UNCTAD数据库 02、相关数据 Insurance and pension services保险和养老金服务、Financial services金融服务、Charges for the use of intellectual property知识产权使用费、Telecommunications, computer, and information services电信、计算机和信息服务、Personal, cultural, and recreational services个人、文化和娱乐服务、Other business services其他商业服务。 03、数据截图

2025-06-10

银监会-金融许可信息明细数据(1948-2024.5)

参考《经济研究》中蔡庆丰(2020)的做法,团队利用“中国银监会许可证发布系统”获取金融机构网点及地理位置信息。对机构持有、变更、失控、退出明细数据进行整理,最终得到金融机构的信息明细。对研究金融网点有一定的参考价值,希望对大家有所帮助 一、数据介绍 数据名称:银监会-金融许可信息明细 数据范围:全国金融机构 数据年份:1948-2024.5 样本数量:559374条,包括持有、变更、失控、退出 数据来源:中国银监会许可证发布系统 更新时间:2024年5月 ➤统计网址:https://xkz.cbirc.gov.cn/jr/ ➤对机构持有、变更、失控、退出明细进行整理 ➤识别机构所在县域、经纬度等地理信息 ➤匹配所属地区的行政区划代码 ➤保留金融机构的信息明细 三、指标说明 来源表 机构编码 机构名称 所属银行 机构类型 业务范围 机构住所 地理坐标 行政区划代码 所属区县 所属城市 所属省份 邮政编码 发证日期 批准日期 发证机关 流水号 是否失控 失控日期 失控原因 是否退出 退出日期

2025-06-10

中国各省数字经济指数数据(2011-2023年)

01、数据介绍 中国各省级数字经济指数是指根据相关指标和权重,对各省的数字经济发展水平进行评估和比较的指数。该指数通常基于多个维度,包括数字化基础设施、数字产业化、产业数字化、等方面的发展情况。这些指标可以反映各省份在数字经济领域的竞争力和发展潜力,为政策制定和投资决策提供参考。 数据名称:中国各省级数字经济指数数据 数据年份:2011-2023年 02、相关数据及指标 省份 id 年份 互联网宽带接入率 互联网普及率 移动电话设施规模 长途光缆线路长度 网页数 域名数 人均电信业务总量 移动电话普及率 信息传输、软件和信息技术服务业法人单位数 信息软件业就业人员占比 国内专利申请授权量 国内专利申请受理量 数字普惠金融 有电子商务交易活动的企业数比重 电子商务销售额 每百家企业拥有网站数 二三产业增加值 科技创新投入 快递量 数字经济指数

2025-06-10

国家农业龙头企业数量(2010-2022年)

1、数据简介 国家农业龙头企业数量主要指的是经过国家相关部门认定,并在农业产业化方面发挥重要引领作用的企业的总数。这些企业通常以农产品加工或流通为主业,通过各种利益联结机制与农户相联系,带动农户进入市场,实现农产品生产、加工、销售的有机结合和相互促进。 数据名称:国家农业龙头企业数量 数据年份:2010-2022年 02、相关数据 省份、年份、龙头企业数量。

2025-06-10

中国县城建设数据库(平衡面板2015-2022年)

中国县城建设数据库,是根据历年《中国县城建设统计年鉴》数据整理。包括市政公用设施水平、人口和建设用地、维护建设财政性资金收支、固定资产投资、供水、节约用水、燃气、集中供热、道路和桥梁、排水和污水处理、环境卫生、园林绿化12个部分 与团队整理的中国县域数据库(点击查看)不同,中国县城建设数据库主要围绕县城建设,包括全国1000多个县。共计256个指标。内含原始数据、线性插值、回归填补3个版本 一、数据介绍 数据名称:中国县城建设数据库 数据范围:1585个县 数据年份:2000-2022年 样本数量:1585县*8年=12680条 数据来源:《中国县城建设统计年鉴》 数据整理:各指标存在不同程度缺失 更新时间:2024年9月 二、整理方法 第一,识别年鉴。利用NLP算法识别《中国县城建设统计年鉴》,并转为面板数据 第二,统一单位。对不同单位的情况,进行单位换算 第三,人工验证。得到指标的面板数据,并人工抽样验证 第四,平衡面板。将非平衡面板转为平衡面板数据 第五,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版 第六,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版 最终,保留原始版本、线性插值版、ARIMA填补版

2025-06-09

5月更新上市公司年报文本、整理面板(1998-2024年)

注:该数据2025.5更新,年报文本已更新至2024年,仅限长期会员领取,仅用于学术研究 上市公司年度报告是指公司整个会计年度的财务报告及其他相关文件。证监会规定上市公司应于每年的4月30日前向证券交易所及投资者披露其前一财年的年度财务报告。上市公司年报文本为学术研究提供了丰富的原始资料,不仅包含详尽的财务数据,还涵盖管理层讨论与分析、风险披露、战略规划、公司治理结构等非结构化信息 团队将“沪深京”三市的上市公司年报原始文本整理成了面板数据,并保留原始PDF文件、TXT文件、上市公司年报面板数据,时间跨度为(1998-2024年),希望对大家有所帮助 相关数据:上市公司数字化词频数据,上市公司MD&A数字化词频数据,人工智能词频数据 一、数据介绍 数据名称:上市公司-原始年报、整理面板 数据范围:A股上市公司 时间范围:1998-2024年 样本数量:68470条 数据来源:上市公司年报 更新时间:2025年5月 更多说明:含原始PDF、TXT、全文面板数据 二、整理说明 ➤爬取上市公司年报原始文件1998-2024年 ➤统计年报年份、公开时间、报告内容 ➤将报告文本整理为面板数据 ➤保留中英文、数字,统计全文文本总长度 ➤保存PDF、TXT文件 ➤保存原始文本面板数据 三、数据指标 类别 股票代码 年报年份 公司简称 年报标题 公告时间 年报内容 全文-文本总长度 仅中英文-文本总长度

2025-06-09

新质生产力关注度-城市、省级(2023-2024)

新质生产力是一个内涵丰富、意蕴深厚的经济范畴,代表着一种生产力的跃迁,是科技创新在其中发挥主导作用的生产力,尤其是关键性颠覆性技术实现突破的生产力,具备高效能,体现高质量,区别于依靠大量资源投入、高度消耗资源能源的生产力发展方式,是摆脱了传统增长路径、符合高质量发展要求的生产力,是数字时代更具融合性、更体现新内涵的生产力 新质生产力,是一个关注于创新和高技术的生产力概念。地区新质生产力的关注度,可能意味着该地区的企业和研究机构在这些领域有较大的活动,或者地方对这些技术的发展给予了较多的支持 团队整理了全国34省、358个城市"新质生产力"的百度指数、资讯指数,以衡量各地区的新质生产力关注度 相关数据:新质生产力-工作报告词频统计;新质生产力-原始数据+dofile测算 数据介绍 数据名称:新质生产力关注度 关键词汇:新质生产力 数据范围:全国34省、358个城市 数据年份:2023.9-2024.4 数据样本:358城市*209天=74822条 数据来源:百度指数 更新时间:2024年4月

2025-06-09

数字经济政策-地级市、省级、中央(1954-2024年)

本次数据为地级市、省级、中央三级数字经济60个词频、扩展词频,三类数据更新至2024年 2023年,团队参考金灿阳(2022)和陶长琪(2022),根据各省、市政府工作报告,统计了省级、地级市60个数字经济相关词频,以衡量“数字经济”的政府政策支持力度 2024年4月,团队对“数字经济”词频数据进行更新,分别统计数字经济政策词频A、数字经济政策词频B 相关数据:北大法宝-地方数字经济政策,地级市/省级-数字经济关注度,地级市数字经济指数测算,政府工作报告-原始全文 “数字经济”历年相关词频和-中央 一、数据介绍 数据名称:数字经济政策-60个相关词频 数据范围:地级市、省级、中央 样本数量:6494条 数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024) 数据来源:地方政府网站 数据说明:内含数字经济相关的60个词频明细、扩展词频 更新时间:2024年4月 二、整理说明 ➤从地方政府网爬取工作报告原始文件 ➤将报告文本整理为面板数据 ➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和 ➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频 ➤利用正则表达式统计60个扩展词频 ➤保留中英文、数字,统计全文文本总长度 ➤保存文本词频总数、60个词频明细、文本长度

2025-06-09

全国省、市、县-专利分类统计数据(1985-2020年)

一、数据介绍 数据名称:全国省、市、县-专利分类统计数据 数据范围:全国各省份、各城市、各区县 数据年份:1985-2020,申请总量3600余万 数据来源:国家知识产权局 更新时间:2021年12月20日 二、数据指标 年份 国内发明专利申请受理量(项) 地区代码 国内外观设计专利申请受理量(项) 地区名称 国内实用新型专利申请受理量(项) 国内发明专利授权受理量(项) 利用知识产权局的高级检索,选择地区、年份、专利类型,对各地区的专利数目进行统计 将检索结果整理为面板数据 检索时间:2021年12月20日 注:因检索日期不同,结果会有微量差异

2025-06-09

中国城市数据库5.0版-线性插值、ARIMA填补(平衡面板1990-2022年)

注:本版本为全市版本,市辖区版本详见-中国市辖区数据库-5.0版 5.0版更新说明: 数据更新至2022年 4.2版更新说明: 1.更新2021年部分指标数据 4.0版更新说明: 1.数据更新至2021年 2.调整部分旧指标 3.新增指标,当前190个指标 3.0版更新说明: 1.数据更新至2020年 2.调整部分指标,当前174个指标 2.4版更新说明: 1.更新部分缺失值 2.将数据转为平衡面板 3.填补升级。内含原始版本、线性插值、ARIMA填补三个版本数据 一、数据介绍 数据名称:中国城市数据库 数据来源:《中国城市统计年鉴》、地方统计局 数据年份:1990-2022年 数据范围:300个地级市(包括直辖市) 样本数量:平衡面板9900条(300*33=9900) 更新时间:2024年5月,当前为5.0版,点击查看 更新版本:点击查看中国城市数据库6.0版本 二、整理方法 第一,识别年鉴。利用NLP算法识别《中国城市统计年鉴》,并转为面板数据 第二,完善数据。对比主流数据库、地方统计局,进一步完善城市数据 第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称 第四,统一单位。对不同单位的情况,进行单位换算 第五,匹配位置。利用高德地图API,得到地区的经纬度 第六,人工验证。得到所有指标的面板数据,并人工抽样验证 第七,平衡面板。将非平衡面板转为平衡面板数据 第八,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版 第九,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版 最终,保留原始版本、线性插值版、ARIMA填补版

2025-06-09

中国城市数据库6.0版-线性插值、ARIMA填补(平衡面板1990-2023年

6.0版更新说明: 1.根据2024年鉴整理,数据更新至2023年 2.新增指标,当前214个指标 5.0版更新说明: 数据更新至2022年 4.2版更新说明: 1.更新2021年部分指标数据 4.0版更新说明: 1.数据更新至2021年 2.调整部分旧指标 3.新增指标,当前190个指标 3.0版更新说明: 1.数据更新至2020年 2.调整部分指标,当前174个指标 2.4版更新说明: 1.更新部分缺失值 2.将数据转为平衡面板 3.填补升级。内含原始版本、线性插值、ARIMA填补三个版本数据 一、数据介绍 数据名称:中国城市数据库 数据来源:中国城市统计年鉴1991-2024年、地方统计局 数据年份:1990-2023年 数据范围:300个地级市(包括直辖市) 样本数量:平衡面板10200条(300*34=10200) 更新时间:2025年2月,当前最新6.0版 二、整理方法 第一,识别年鉴。利用NLP算法识别《中国城市统计年鉴》,并转为面板数据 第二,完善数据。对比主流数据库、地方统计局,进一步完善城市数据 第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称 第四,统一单位。对不同单位的情况,进行单位换算 第五,人工验证。得到所有指标的面板数据,并人工抽样验证 第六,平衡面板。将非平衡面板转为平衡面板数据 第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版 第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版 最终,保留原始版本、线性插值版、ARIMA填补版

2025-06-09

中国主要城市数据库5.0(1949-2023年)

中国主要城市数据库,包括我国36个主要城市的经济、人口、房地产、财政、教育医疗等指标数据,当前已经更新至5.0版,年份为1949-2023年,统计范围主要为36个主要城市 相关数据:中国城市数据库5.0版,中国市辖区数据库5.0版,中国城市建设数据库 5.0版更新说明: 1.同步统计局数据 2.更新到最新年份2023年 4.0版更新说明: 1.同步统计局数据 2.更新到最新年份2022年 3.0版更新说明: 1.同步统计局数据 2.更新到最新年份2021年 3.内含长面板、原始数据、线性插值、回归填补四个版本数据 一、数据介绍 数据名称:中国主要城市数据库 数据年份:1949-2023年 数据范围:36个主要城市 指标数目:39个指标 数据来源:国家统计局 更新时间:2024年7月 二、数据范围 36个主要城市:上海、乌鲁木齐、兰州、北京、南京、南宁、南昌、厦门、合肥、呼和浩特、哈尔滨、大连、天津、太原、宁波、广州、成都、拉萨、昆明、杭州、武汉、沈阳、济南、海口、深圳、石家庄、福州、西宁、西安、贵阳、郑州、重庆、银川、长春、长沙、青岛

2025-06-09

更新!企业数字化转型-MD&A报告314个词频、文本统计(2001-2024年)

注:2025年5月更新,本次数据为MD&A报告统计,统计数据更新至2024年 在前文,团队利用上市公司年报,对“数字化转型”相关词频进行了统计。在本期附赠数据中,进一步对MD&A文本进行统计 MD&A文本筛选:2014年及以前主要在“董事会报告”中筛选,2015年主要在“管理层讨论与分析”中筛选,2016年及往后主要从“经营情况讨论与分析”中筛选,2021-2024年主要在“管理层讨论与分析”中提取 相关数据:上市公司数字化词频数据,人工智能词频数据,上市公司年报原文数据 一、数据介绍 数据名称:企业数字化转型-MD&A报告词频、文本统计 数据范围:5706家上市公司 数据年份:2001-2024年 样本数量:65483条,345个变量 数据来源:上市公司“管理层讨论与分析”文本 数据说明:内含数字化转型314个词频、各维度水平、文本统计面板 更新时间:2025年5月 二、整理说明 ➤爬取2001-2024年上市公司年报 ➤将MD&A报告文本整理为面板数据 ➤统计年报全文的文本长度 ➤统计全文中,中英文部分的文本长度 ➤构建数字化术语词典,将词汇扩充到python的jieba库 ➤去除停顿词,统计精确词汇数目 ➤计算数字化转型词频和、各维度水平词频和 ➤计算3种方式下的数字化转型水平

2025-06-09

亿量级 - 人口迁徙规模数据-367个城市(2018-2023年)

在前文,参考《中国工业经济》中王春杨(2020)的做法,团队利用“百度迁徙”大数据整理了各省份间的人口迁徙数据(点击查看)、城市间人口迁徙数据(点击查看) 与前文不同,本次分享的是迁徙规模指数,可以进行城市之间的比较。包括367个城市两两之间的人口迁徙意愿指数、 实际迁徙指数,对于研究人口迁徙有一定的参考价值 一、数据介绍 数据名称:亿量级 | 人口迁徙规模数据 数据范围:367个城市之间(包括直辖市) 时间范围:2018.6-2023.12 样本数量:1.12亿条 数据来源:高德地图 数据整理:包括日度、月度、年度数据 更新时间:2024年3月 二、指标说明 指标说明 年份 月份 日期 始发城市 始发城市所属省份 始发城市代码 终点城市 终点城市所属省份 终点城市代码 年度迁徙意愿指数 年度实际迁徙指数 月度迁徙意愿指数 月度实际迁徙指数 日度迁徙意愿指数 日度实际迁徙指数

2025-06-09

企业数字化转型-年度报告314个词频、文本统计(1999-2023年)

注:本次数据更新至2023年,新增企业行业、数字化转型词频C 2022年8月,团队参考吴非、赵宸宇两位老师做法,首次整理了数字转型词频统计数据,受到了广大研究人员的欢迎,并被多篇TOP期刊引用。2023年6月,团队对数据进行了更新 2024年5月,目前最新2023年年报已基本公开,团队继续对数据进行更新,数据更新至2023年,并额外增加行业信息、增加甄红线老师的139个关键词,助力学者们在数字化领域的研究 相关数据:上市公司年报原文数据,人工智能词频数据,MD&A数字化词频数据 一、数据介绍 数据名称:企业数字化转型-年度报告词频、文本统计 数据范围:5630家上市公司 数据年份:1999-2023年 样本数量:63051条,345个变量 数据来源:上市公司年度报告 数据说明:内含数字化转型314个词频、各维度水平、文本统计面板 更新时间:2024年5月 二、整理说明 ➤爬取1999-2023年上市公司年报 ➤将原始报告文本整理为面板数据 ➤统计年报全文的文本长度 ➤统计全文中,中英文部分的文本长度 ➤构建数字化术语词典,将词汇扩充到python的jieba库 ➤去除停顿词,统计精确词汇数目 ➤计算数字化转型词频和、各维度水平词频和 ➤计算3种方式下的数字化转型水平

2025-06-09

更新至2023!各城市各行业-新注册企业数据(2000-2023年)

团队从中国工商企业注册数据库获取企业注册登记数据,注册总量2.8亿+,并根据注册地址整理,获得了各城市各行业的新注册企业数据 目前该数据覆盖年份为2000-2023年,包括368城市、20个行业的数据 相关数据:各区县各行业-新注册企业数据 一、数据介绍 数据名称:各城市各行业-新注册企业数据 数据范围:368城市、20个行业 数据年份:2000-2023年 样本数量:368城市*20行业*24年=176640条 更新时间:2024年10月 二、整理说明 ➤获取中国工商企业注册数据 ➤根据年份、城市、行业,统计新注册企业数目 ➤利用民政部数据,匹配城市的行政区划代码 ➤匹配城市地域、胡焕庸线划分数据 ➤将统计结果整理为面板数据 三、指标说明 年份 行政区划代码 城市名称 所属省份 所属地域 胡焕庸线 所属行业 新注册企业数目

2025-06-09

环境相关词频统计-地级市、省级、中央(1954-2024年)

本次数据为地级市、省级、中央三级环境规制15个词频、扩展词频,三类数据更新至2024年 2023年,团队参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021),统计了省级、地级市的环境规制相关词频,以衡量地区“环境规制力度” 2024年6月,团队对“环境规制”词频数据进行更新,分别统计中央、省级、地级市三个层面的环境规制词频明细数据,并将三个层面数据更新至2024年 相关数据:政府工作报告-原始全文 “环境规制”历年相关词频和-中央 一、数据介绍 数据名称:环境规制-15个相关词频统计 数据范围:地级市、省级、中央 数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024) 数据来源:地方政府网站 数据说明:内含环境规制相关的15个词频明细、扩展词频 更新时间:2024年6月 二、整理说明 ➤从地方政府网爬取工作报告原始文件 ➤将报告文本整理为面板数据 ➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和 ➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频 ➤利用正则表达式统计15个扩展词频 ➤保留中英文、数字,统计全文文本总长度 ➤保存文本词频总数、15个词频明细、文本长度 三、指标说明 一共24个指标,并额外统计扩展词频 年份 地区 文本总长度 仅中英文-文本总长度 文本总词频-全模式 文本总词频-精确模式 环境规制词频和 环境保护 环保 污染 能耗 减排 排污 生态 绿色 低碳 空气 化学需氧量 二氧化硫 二氧化碳 PM10 PM2.5

2025-06-09

企业数据资产化221个词频统计(1999-2023年)

参考《中国工业经济》中何瑛(2024)的做法,团队统计了上市公司年报221个数据资产相关词频。以“信息”“网络”“数字”“数据”四个词作为种子词汇,构建相似词词集,并依据数据资产的具体用途,将其划分为自用型数据资产和交易型数据资产 数据资产化构建 一、数据介绍 数据名称:上市公司-数据资产化221个词频 数据范围:5630家上市公司 数据年份:1999-2023年 样本数量:63051条,233个变量 数据来源:上市公司年度报告 数据说明:内含数据资产化221个词频明细、文本统计面板 更新时间:2024年11月 二、整理说明 ➤爬取1999-2023年上市公司年报 ➤将原始报告文本整理为面板数据 ➤统计年报全文的文本长度 ➤统计全文中,中英文部分的文本长度 ➤构建数字化术语词典,将词汇扩充到python的jieba库 ➤去除停顿词,统计各明细词汇数目 ➤计算数据资产化词频和 ➤保留数据资产化词频和、明细词频

2025-06-09

企业人工智能-年报73个词频、文本统计(1999-2023年)

参考《管理世界》中姚加权(2024)的做法,团队根据上市年报文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-人工智能水平,包括精确词汇、扩展词汇两种方式 在前文,团队利用上市公司年报文本全文数据,对“人工智能”73个相关词频进行了统计,衡量上市公司人工智能水平,本次团队继续更新数据至2023年 相关数据:人工智能企业数据库,上市公司年报原文数据,数字化转型词频数据,MD&A数字化词频数据 一、数据介绍 数据名称:企业人工智能-年报73个词频、文本统计 数据范围:A股上市公司 数据年份:1999-2023年 样本数量:63052条,84个变量 年报来源:巨潮资讯网 数据说明:内含人工智能73个词频、精确和扩展词汇两种方式 更新时间:2024年7月 二、整理说明 ➤从巨潮资讯网下载1999-2023年上市公司年报 ➤将原始报告文本整理为面板数据 ➤统计年报全文的文本长度 ➤统计全文中,中英文部分的文本长度 ➤构建人工智能术语词典,将词汇扩充到python的jieba库 ➤去除停顿词,统计精确词汇、扩展词汇数目 ➤计算两种方式下的人工智能水平

2025-06-09

中国城市空气质量每日数据、良好天数(2001-2024.12)

空气质量数据。是通过各种监测手段收集的反映大气环境中污染物浓度和成分的信息。包括API(2001-2013)、AQI(2014-2024)、首要污染物等数据。能够帮助研究人员评估空气污染状况及其对经济和环境的影响 本次分享的数据为369个城市空气质量指数的日度详细数据、良好天数统计情况,时间跨度为2001年1月-2024年12月 一、数据介绍 数据名称:中国城市空气质量每日数据、良好天数 数据范围:369个城市 数据日期:2001.1-2024.12 样本数量:172万条 数据来源:中国空气质量在线检测分析平台 数据说明:内含日度详细数据、良好天数统计情况 更新时间:2024年12月 二、整理说明 ➤获取各个城市的空气质量日度数据 ➤将日度数据整理为年度统计数据,非平衡面板 ➤根据空气质量级别统计达到及好于二级的天数以及占比情况 ➤保留原始日度数据和年度统计数据 三、指标说明 日期 年份 行政区划代码 城市名称 AQI API 空气质量级别 首要污染物 天数 空气质量达到及好于二级的天数 统计总天数 空气质量达到及好于二级的天数占比

2025-06-09

上市公司-内部薪酬差距数据(2000-2023年)

上市公司内部薪酬差距‌是指企业内部不同职位或层级员工之间的薪酬差异。这种差距通常体现在高管与普通员工、不同层级管理人员之间的薪酬水平上。 一、上市公司内部薪酬差距数据的介绍 信息不对称和代理冲突等问题均会导致内部薪酬结构不断偏离合理水平,加剧企业内部收入分配不平等。基于此,特对上市公司薪酬数据进行收集并分享,以帮助研究者分析管理层与普通员工的薪酬差距,并探索其中的原因和影响因素。 本分享数据涵盖2000年至2023年间的上市公司薪酬数据,包含dta、excel两种格式。 二、数据指标 指标 定义 计算方式 管理层平均薪酬 上市公司管理层(董事、监事、高管等)的年均薪酬 管理层薪酬总额 / 管理层人数 员工平均薪酬 除管理层外的普通员工年均薪酬 支付给普通员工的薪酬总额 / 普通员工人数 内部薪酬差距 管理层与普通员工之间的薪酬差距 管理层薪酬 / 员工薪酬 管理层劳动收入份额 管理层在总收入中所占的比例 管理层总收入 / 总劳动收入 员工劳动收入份额 员工在总收入中所占的比例 员工总收入 / 总劳动收入 三、参考文献 [1] 江轩宇; 朱梦遥; 谢蓉蓉; 城市群政策的收入分配效应——基于微观企业劳动收入份额视角的研究[J]; 财经研究; 2023年06期。 [2] 孔东民, 徐茗丽, 孔高文. 企业内部薪酬差距与创新[J]. 经济研究, 2017, 52(10):14. DOI: CNKI:SUN:JJYJ.0.2017-10-011. [3] 魏志华,王孝华,蔡伟毅. 2022. 税收征管数字化与企业内部薪酬差距[J]. 中国工业经济,(3):152-170.

2025-06-11

上市公司-绿色全要素生产率(2007-2022年)

上市公司绿色全要素生产率(Green Total Factor Productivity,简称GTFP)是衡量企业绿色发展和资源配置效率的重要指标,其不仅关注经济效益,还强调环境效益,体现了绿色发展理念。 一、上市公司绿色全要素生产率的介绍 上市公司绿色全要素生产率是衡量企业在实现绿色发展的过程中,如何有效地利用劳动、资本、能源等资源进行生产的综合效率。本分享数据涵盖2500+家上市公司,数据年份为2007-2022年,共46424条样本,含证券代码、年份、绿色全要素生产率、绿色技术效率变化指数、绿色技术进步变化指数。 二、数据指标 绿色全要素生产率 绿色技术效率变化指数 绿色技术进步变化指数 用于衡量企业绿色发展效率的综合指标 反映绿色技术使用效率的变化 衡量绿色技术进步的效果 三、测算方式 企业绿色全要素生产率的测算采用了非径向SBM-ML指数(简称“ML指数”)模型。该模型通过将企业的环境污染、绿色技术进步等因素纳入生产效率评价体系,全面反映了企业在绿色发展方面的整体表现。 具体的测算方式如下: (1)要素投入:以企业员工数作为劳动投入的代理变量,企业固定资产净额作为资本投入的代理变量,企业所在城市的工业用电量根据企业从业人员占城市城镇人员就业比重进行换算作为能源投入的代理变量。 (2)期望产出:以企业的营业收入作为期望产出的代理变量。 (3)非期望产出:将企业从业人员占所在城市城镇人员就业比重与“工业三废”(即工业二氧化硫、工业废水、工业烟粉尘排放量)结合,进行换算,作为非期望产出的代理变量。 四、参考文献 崔立志,孙旺,黄敏敏.新能源示范城市建设对企业绿色全要素生产率的影响研究——基于A股上市公司的实证分析[J].广西财经学院学报,2023,36(01):92-104.

2025-06-11

上市公司股吧舆论数据(2008-2023年)

进入互联网新媒体时代,“股吧”作为一类专门针对上市公司的社交媒介,已经成为中小投资者分享投资经验和发表对公司运营意见的重要平台,股吧舆论作为投资者情绪的反映,直接影响股票的市场表现。 一、上市公司股吧舆论数据的介绍 “股吧”作为新兴社交媒体代表,本身并不提供信息,仅提供多方交互平台,其将个体间的实时交流和回应形成公众关注和舆论;因此,股吧舆论数据可以帮助研究人员深入分析网络舆论与企业表现之间的关系,并为投资者提供情绪波动的参考依据。 本分享数据年份为2008年到2023年,数据来源于东方财富网股吧,涉及A股上市公司的讨论情况,涵盖了股吧发帖数量、阅读量、评论次数等多个维度。 二、数据指标 指标名称 描述 计算方法 Post 股吧发帖数量 上市公司当年度东方财富网股吧发帖数量之和加1并取自然对数 Positive 正面帖子数量 上市公司当年度东方财富网股吧正面帖子数量之和加1并取自然对数 Negative 负面帖子数量 上市公司当年度东方财富网股吧负面帖子数量之和加1并取自然对数 Neutral 中性帖子数量 上市公司当年度东方财富网股吧中性帖子数量之和加1并取自然对数 Read 股吧阅读量 上市公司当年度东方财富网股吧被阅读次数之和加1并取自然对数 Comment 股吧评论量 上市公司当年度东方财富网股吧被跟帖评论次数之和加1并取自然对数 三、数据说明 本数据集的统计范围为A股上市公司,数据分为三个版本: 未剔除金融STPT未缩尾版本 已剔除金融STPT未缩尾版本 已剔除金融STPT已缩尾版本 四、参考文献 [1] 江轩宇, 朱琳, 伊志宏. 网络舆论关注与企业创新[J]. 经济学(季刊), 2021(1):22. [2] 王丹, 孙鲲鹏, 高皓. 社交媒体上"用嘴投票"对管理层自愿性业绩预告的影响[J]. 金融研究

2025-06-11

上市公司-劳务外包相关数据(2012-2023年)

上市公司劳务外包作为企业经营中的一种灵活用工模式,能够帮助企业控制人力成本、提升运营效率并优化人力资源配置,因此,近年来得到了广泛应用 随着企业对外包劳务需求的增加,劳务外包报酬数据成为了衡量外包成本及劳动市场变化的重要指标,本次对相关数据进行了分享 一、上市公司劳务外包报酬数据的介绍 数据包括上市公司劳务外包报酬总额、劳务外包工时、外包工作量等关键指标,旨在帮助企业与学术界更好地理解劳务外包的经济影响 数据时间:2012-2023年 数据范围:上市公司 二、数据指标 证券代码 证券简称 统计截止时间 报表类型 结算方式 劳务外包工时总数 劳务外包工作量总数 劳务外包工作量单位 劳务外包支付的报酬总额 劳务外包总人数 币种 三、参考文献 [1]汤旭东,贾洋.社保费征管与企业灵活用工:来自社保新规的准自然实验[J].世界经济,2024,(08):228-256. [2]杨国超,魏爽,院茜,龚强.企业为何选择劳务外包——基于经济政策不确定性的解释[J].中国工业经济,2023,(09):136-154.

2025-06-11

数字普惠金融对新质生产力的影响研究(2015-2023年)

基于2015—2023年中国制造业上市公司数据,探讨了数字普惠金融对制造业企业新质生产力的影响及作用机理。研究发现,数字普惠金融有助于促进制造业企业新质生产力的发展,尤其是在数字普惠金融的使用深度较大的情况下,其对新质生产力的促进作用最为显著 参照师栋楷(2024)的做法,团队对来自经济问题《数字普惠金融对制造业企业新质生产力的影响及作用机理》一文中的基准回归部分进行复刻 一、数据介绍 数据名称:数字普惠金融对新质生产力的影响研究 数据范围:A股制造业上市公司 数据年份:2015-2023年 有效样本:18364条 数据说明:参考宋佳等(2024)的研究测算新质生产力水平,数字普惠金融水平用北大数字普惠金融指数衡量 二、数据指标 股票代码 股票简称 年份 省份 城市 区县 省份代码 城市代码 区县代码 行业代码 行业名称 企业上市年龄_年 是否ST或金融类 董事会人数_人 独立董事占比 两职合一 企业新质生产力水平 前十大股东持股比例_% 审计意见类型 市-数字普惠金融指数 三、参考文献 师栋楷.数字普惠金融对制造业企业新质生产力的影响及作用机理[J].经济问题,2024,(12):78-87.

2025-06-11

全球各国产业链韧性、上下游数据

产业链韧性是全球经济体系中至关重要的一个概念,它反映了一个产业链应对外部冲击、维持稳定性并防止断裂的能力。随着全球化的不断深化,产业链的稳定性与安全性已成为关注重点。 一、产业链韧性的介绍 产业链韧性是全球价值链稳定性的重要保障,也是各国经济增长与产业发展的核心,而产业链韧性数据可以帮助学者和决策者更好地理解产业链的运作机制及其面临的挑战。 本分享数据年份为2024年,涵盖OECD66个国家、45个行业,样本总量达到72360个观测值,包含dta、python、excel三种格式。 二、数据指标 序号 指标名称 描述 1 纯国内价值链长度-上游 衡量产业链上游环节的纯国内价值链长度。 2 纯国内价值链长度-下游 衡量产业链下游环节的纯国内价值链长度。 3 传统贸易长度 衡量传统贸易活动中的产业链长度。 4 价值链长度 衡量整个全球价值链的长度。 三、参考文献 [1] 宋跃刚, 王紫琪. 基于区域服务贸易协定深度的制造业全球价值链重构效应研究 [J]. 经济管理, 2024, 46 (05): 5-27. [2] 李光勤, 邱欣悦. 双向FDI与全球价值链韧性:来自跨国数据的经验证据 [J]. 世界经济研究, 2024, (05): 75-91+135. [3] 马黄龙, 屈小娥. 数字经济赋能全球价值链韧性:理论机制和实践路径 [J]. 现代经济探讨, 2023, (11): 65-71. [4] 杨仁发, 郑媛媛. 数字经济发展对全球价值链分工演进及韧性影响研究 [J]. 数量经济技术经济研究, 2023, 40 (08): 69-89.

2025-06-11

顶刊复刻:人工智能技术应用如何影响企业创新(2007-2023年)

本文基于中国A股上市企业数据,分析了逻辑型和学习型AI技术应用对企业创新的影响。通过机器学习生成AI词典并分析年报文本,测量AI应用水平。研究发现,AI应用通过增加知识多样性、打破组织惯例和提高资源配置效率促进企业创新,且企业的吸收能力增强了这一促进作用 参照李玉花(2024)的做法,马克团队对来自中国工业经济《人工智能技术应用如何影响企业创新》一文中的基准回归部分进行复刻 团队将原文数据更新至2023年,并对基准回归进行复刻。数据年份为2007-2023年,包括原始数据、处理dofile,基准回归代码 一、数据介绍 数据名称:人工智能技术应用如何影响企业创新 数据范围:A股上市公司 数据年份:2007-2023年 有效样本:33615条 数据说明:参考《管理世界》中姚加权(2024)的做法,测算人工智能水平 数据整理:内含原始数据、dofile和基准回归 二、数据指标 股票代码 股票简称 年份 省份 城市 区县 省份代码 城市代码 区县代码 行业代码 行业名称 企业上市年龄_年 是否ST或金融类 总资产_万元 营业收入增长率_% 资产负债率_% 总资产收益率_% 研发投入占营业收入比例_% 人工智能词频和 人工智能词频和加1取对数 企业专利申请总量 企业发明专利申请量 企业专利授权总量 企业发明专利授权量

2025-06-11

地级市乡村振兴指数数据(2000-2023年)

乡村振兴战略的实施,旨在破解农业、农村、农民的问题,促进农业发展、农村繁荣与农民增收。乡村振兴评价指标体系的使用成为研究该战略的重要基础,它为不同地区的乡村振兴情况进行监测、评价和对比提供了依据 、地级市乡村振兴水平数据的介绍 本分享数据涉及产业兴旺、生态宜居、乡风文明、治理有效、生活富裕五个维度,旨在为研究者研究中国乡村振兴进程提供数据支撑 数据年份:本分享数据包含中国各省、市乡村振兴数据,其中,地级市乡村振兴数据年份为2000-2023年,省市级乡村振兴数据年份为2000-2022年 数据格式:dta、excel

2025-06-11

地级市数字基础设施水平数据(2003-2024年)

新型数字基础设施的建设内容是在“新基建”基础上,依托信创云以及四中台打造的城市级数字大底座,为城市提供随需获取、按需计费的便捷数字化服务,助力城市全领域数字化转型。 新型数字基础设施的建设水平是推动经济社会发展的重要因素之一。随着数字化转型的不断推进,地方政府也逐渐重视数字基础设施的建设。 一、地级市新型数字基础设施发展水平数据的介绍 本分享数据涵盖了2003-2024年间地级市新型数字基础设施的发展水平测量值。数据的核心来自地方政府工作报告中提及的相关词汇,并通过对这些报告的分词和频次统计,得出每个城市在该领域的数字基础设施发展水平。 数据覆盖全国285个地级市,包含5G、移动通信、信息技术等51个数字基础设施相关词汇的原始词频数据,政府工作报告总词数,涵盖5700多条数据。 二、数据指标 指标 描述 数据范围 移动通信 与移动通信相关的数字基础设施词频 285个地级市,2003-2024年 信息技术 涉及信息技术的基础设施建设情况 285个地级市,2003-2024年 信息经济 地区信息经济发展水平相关词汇频次 285个地级市,2003-2024年 信息基础设施 数字信息基础设施建设相关数据 285个地级市,2003-2024年 大数据 大数据基础设施建设的词频数据 285个地级市,2003-2024年 数字产业 数字产业相关词汇的词频 285个地级市,2003-2024年

2025-06-11

企业数字化转型测算结果(2003-2023年)

01、数据简介 企业数字化转型是指企业或组织将传统业务转化为数字化业务,利用人工智能、大数据、云计算、区块链、5G等数字技术提升业务效率和质量的过程。 当无形资产明细项包含“软件”“网络”“客户端”“管理系统”“智能平台”等与数字化转型技术相关的关键词以及与此相关的专利时,将该明细项目界定为“数字化技术无形资产”,再对同一公司同年度多项数字化技术无形资产进行加总,计算其占本年度无形资产的比例,即为企业数字化转型程度的代理变量。 本数据包含:原始数据、参考文献、代码do文件、最终结果。 数据名称:企业数字化转型测算结果 数据年份:2003-2023年 参考文献:张永珅,李小波,邢铭强-企业数字化转型与审计定价[J].审计研究,2021(03):62-71. 02、相关数据 证券代码、证券简称、统计截止日期、报表类型、无形资产净额、资产总计、年份、期末余额(元)、数字化转型。

2025-06-11

世界各国生产能力指数(PCI)(2000-2022年)

01、数据简介 世界各国生产能力指数(PCI)是联合国贸易和发展会议(UNCTAD)推出的一项新指数,用于衡量各国经济投入和潜力,为国家的发展提供了更好、更多维的衡量标准。 世界各国生产能力指数是一个全面、多维的衡量标准,用于评估各国的经济投入和潜力。通过了解各国在PCI上的表现,我们可以更加深入地了解各国的经济状况和发展前景。 数据名称:世界各国生产能力指数(PCI) 数据年份:2000-2022年 02、相关数据 国家名称、国家代码、生产能力指标、人力资本能力指数、ICT能力指数、政府稳定性和效率、自然资本能力、跨境贸易便利性、结构变化、交通运输能力、能源能力。

2025-06-11

上市公司-高管团队稳定性数据(2006-2023年)

01、数据介绍 高管团队稳定性不仅关注团队成员的离职或变动情况,还考虑团队凝聚力、团队参与积极性、内部冲突以及组织结构稳定性等因素。这些因素在一定时期内保持相对稳定的状态,也被视为高管团队稳定性的体现。对企业创新管理、战略决策以及长期发展等方面具有重要影响。 高管团队的稳定性有助于企业形成稳定的经营环境和文化氛围,有利于企业的长期发展。 数据名称:上市公司-高管团队稳定性数据 数据年份:2006-2023年 参考文献:高管团队稳定性会影响企业技术创新绩效吗-张兆国 02、相关数据及指标 证券代码、统计截止日期、人员ID、姓名、具体职务、具体职务ID、任职开始日期、任职结束日期、是否在职、任期、距离离任剩余日期、离职原因、职务名称、代码、年份、STMT。

2025-06-10

地级市-城市出口韧性数据(2011-2022年)

出口韧性是地级市在面对外部震荡和压力时,能够承受并迅速适应、应对变化的能力。这种能力体现在地级市经济结构的灵活性、创新能力和竞争力,以及地方政府的政策支持和产业调整能力等多个方面。 城市出口韧性对于城市的经济发展、就业稳定、国际贸易地位以及风险抵御能力等方面都具有重要影响。因此,城市应加强出口韧性的建设,提高应对外部冲击的能力,以推动其经济的可持续发展。 数据名称:地级市-城市出口韧性数据 数据年份:2011-2022年

2025-06-10

上市公司-监管距离(2000-2022年)

01、数据简介 监管距离是上市公司与其主要监管机构之间的地理距离。通常是以上市公司注册地与监管机构所在地之间的实际空间距离来衡量。在我国,由于中国证监会及其派出机构(证监局)是上市公司主要的监管机构,因此监管距离具体指的是上市公司注册地与所属证监局之间的地理距离。 上市公司与其监管机构之间的地理接近程度,并可能对公司的治理和运营产生实质性的影响。 参考(肖红军,2021等)通过收集监管主体的经纬度坐标计算整理其与上市公司注册地的相应距离。 数据名称:上市公司-监管距离 数据年份:2000-2022年 02、相关数据 股票代码 股票简称 统计截止日期 注册具体地址 注册地经度 注册地纬度 所属省份代码 所属省份 所属城市代码 所属城市 机构 机构经度 机构纬度 监管距离(KM)

2025-06-10

上市公司-数字化转型工具变量(2001-2023年)

01、数据介绍 数字化转型是指企业或个人利用数字技术,如大数据、云计算、人工智能等,对其业务流程、运营模式、决策方式等进行全面、深入的变革,以提高效率、降低成本、提升质量、增强竞争力。在这个过程中,工具变量扮演着至关重要的角色。 本数据包含:原始数据、参考文献、代码do文件、最终结果。 数据名称:上市公司-数字化转型工具变量 数据年份:2001-2023年 参考文献1:数字化转型能提升企业ESG表现吗?—基于合法性理论与信息不对称理论的研究 参考文献2:数字化转型如何影响劳动技能溢价——基于 A 股上市公司数据的经验研究 参考文献3:数字化转型是否促进了企业内共同富裕-来自中国 A 股上市公司的证据 02、相关数据及指标 企业代码 企业代码 年份 股票简称 企业数字化转型程度。基于吴非方法构建 工具变量:同行业其他企业数字化转型程度的均值 工具变量:同行业数字化转型程度的均值 工具变量:同行业同年份其他企业数字化转型程度的均值 工具变量:同行业同年份数字化转型程度的均值 工具变量:同地区同行业同年份数字化转型程度的均值 工具变量:同地区同行业同年份其他企业数字化转型程度的均值 行业名称 制造业取两位代码,其他行业用大类

2025-06-10

省级-物流业碳排放及其能源消耗数据(2011-2022年)

01、数据介绍 随着全球经济的迅猛发展和电子商务的兴起,物流业作为连接生产与消费的桥梁,其重要性日益凸显。然而,这一行业的快速发展也伴随着显著的碳排放和能源消耗问题。 物流业作为碳排放和能源消耗的重要领域之一,其节能减排工作任重而道远。通过推广绿色物流、加强技术创新、完善政策法规以及开展国际合作等措施,我们可以有效降低物流业的碳排放和能源消耗水平,为构建绿色低碳的可持续发展社会贡献力量。 本数据包括能源原始消耗数据、划算为标准煤的消耗量、碳排放量三种数据。 数据名称:省级-物流业碳排放及其能源消耗数据 数据年份:2011-2022年 02、相关数据及指标 id year 省份 原煤(万吨) 焦炭 原油 汽油(万吨) 煤油(万吨) 柴油(万吨) 燃料油(万吨) 天然气(亿立方米) 原煤(万吨) 焦炭 原油 汽油(万吨) 煤油(万吨) 柴油(万吨) 燃料油(万吨) 天然气(亿立方米) 折标准煤 原煤(万吨) 焦炭 原油 汽油(万吨) 煤油(万吨) 柴油(万吨) 燃料油(万吨) 天然气(亿立方米) 碳排放量

2025-06-10

上市公司-多元化经营数据(2000-2023年)

01、数据简介 上市公司多元化经营数据是一个复杂且多维度的领域,它涉及到公司在不同行业或产品领域的经营扩张情况,不只局限于一种产品或一个产业,而实行跨产品、跨行业的经营扩张。它是企业发展多品种或多种经营的长期谋划。 上市公司多元化经营数据是反映公司经营状况、评估风险与收益、指导企业战略调整的重要依据。投资者和分析师可以通过获取和分析这些数据,做出更明智的投资决策。 1、是否多元化经营虚拟变量 Div_dum ,即当公司主营业务收入涉及的行业数大于1时,Div_dum取值为1,否则为0 2、多元化经营行业数目 Div_num ,占主营收入5%以上的行业数目 3、收入赫芬达尔指数 Div_HHI,Div_HHI=Σpi2,pi为第i个行业在总收入中的比重,该指数越大,多元化程度越低 数据名称:上市公司-多元化经营数据 数据年份:2000-2023年 参考文献:多元化经营、财务杠杆与过度投资-曾春华 02、相关数据 证券代码、证券简称、stkcd、year、Dyh_dum、Dyh_n、Dyh_entro、Dyh_hhi、行业代码、行业名称、所属省份、所属省份代码、所属城市、所属城市代码。

2025-06-10

285个地级市邻接矩阵、经济地理矩阵(2003-2022年)

01、数据简介 地级市空间计量权重矩阵是一个n×n的矩阵,其中n代表研究区域内地级市的数目。矩阵中的每个元素代表两个地级市之间的空间关系强度或权重,这种权重通常基于地理、经济或其他相关因素来确定。地级市空间计量权重矩阵是一个重要的空间计量分析工具,能够量化地级市之间的空间关系强度,并支持各种空间计量模型的应用。在构建和应用此类矩阵时,需要充分考虑研究区域的特点和研究目的,选择合适的权重确定方法和矩阵类型。 本数据包含空间邻接矩阵、空间经济距离矩阵(GDP )、空间地理距离矩阵(经纬度)、经济地理权重矩阵(GDP 和经纬度)、经济地理嵌套矩阵(GDP 和经纬度) 数据名称:285个地级市邻接矩阵、经济地理矩阵 数据年份:2003-2022年 参考文献:邵帅,李欣,曹建华,杨莉莉,中国雾霾污染治理的经济政策选择–基于空间溢出效应的视角[川经济研究,2016,51(09):73-88. 02、相关数据 人均GDP、经济地理权重矩阵(GDP和经纬度)、经济地理嵌套矩阵(GDP和经纬度)、空间经济矩阵(非对称)、空间经济地理矩阵(非对称)。

2025-06-10

省级-新产品开发项目数+新产品开发经费支出+新产品销售收入(2009-2022年)

01、数据简介 新产品开发项目数是在特定省份内,企业在一定时期内(如一年)启动并正在进行的新产品开发项目的总数,新产品开发项目数的多少在一定程度上可以反映出一个省份内企业的创新活力和研发能力。 新产品开发经费支出是指企业在开发新产品过程中投入的资金总额,包括研发人员的工资、实验设备购置费、材料费、测试费等。新产品开发经费支出的多少可以反映出一个省份对企业创新的重视程度和支持力度。 新产品销售收入是指企业在一定时期内(如一年)通过销售新产品所获得的收入总额。新产品销售收入的多少可以反映出一个省份内企业创新成果的转化能力和市场竞争力。 数据名称:省级-新产品开发项目数+新产品开发经费支出+新产品销售收入 数据年份:2009-2022年 02、相关数据 年份 省份 新产品开发项目数(项) 新产品开发经费支出(万元) 新产品销售收入(万元)

2025-06-10

上市公司-研发投入数据(1998-2023年)

01、数据简介 公司研发投入是衡量其创新能力和长期发展潜力的重要指标。不同类型和行业的上市公司在研发投入方面存在差异,但整体呈增长趋势。同时,相关监管机构对研发投入的信息披露要求也在逐渐提高,有助于提升上市公司的透明度和信誉。然而,研发投入也面临一些挑战和风险,需要上市公司进行谨慎决策和风险管理。 数据名称:上市公司-研发投入数据 数据年份:1998-2023年 02、相关数据 证券代码 统计截止日期 数据来源 报表类型 研发人员数量 研发人员数量占比(%) 研发投入金额 研发投入占营业收入比例(%) 研发投入(支出)费用化的金额 研发投入(支出)资本化的金额 资本化研发投入(支出)占研发投入的比例(%) 资本化研发投入(支出)占当期净利润的比重(%) 币种 说明

2025-06-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除