自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

原创 如何判断NP-hard问题

判断一个问题是否为NP-hard,主要方法是通过归约法,找一个已知的NP-hard问题,并证明这个问题可以多项式时间归约到你要判断的问题。通过这种方法,如果归约成立,那么你要判断的问题就是NP-hard。

2024-05-31 15:51:11 862 1

原创 让 Matplotlib静态数据图动起来

代码实现了如下功能:定义静态图形绘制函数,该函数用于绘制动态绘图中的一个帧,该函数基于传入的随机数种子计算1000个随机数的均值,并将其绘制在一个柱状图中。然后使用matplotlib.animation.FuncAnimation让静态图动起来,其基于传入参数,依次绘制动画的每一帧图形,然后联合成动画效果。这里我们让其绘制分别以1-50为随机数种子得到的柱状图。,使用matplotlib绘制动画,由于代码只展示了核心部分,数据也没有共享,本篇文章提供一个可直接运行的示例,以供读者测试。

2024-05-22 19:17:34 271

转载 让 Matplotlib、seaborn 静态数据图动起来

继上一篇介绍如何使用matplotlib.pyplot实现实时数据动态显示后,这一篇将介绍如何让 Matplotlib、Seaborn 的静态数据图动起来。

2024-05-18 16:40:01 39

转载 双重差分法(DID)的种类和区别-如何选取合适的DID

双重差分法(DID)是近年来的“学术明星”,常用于各种经济政策的评估。只要有一个政策外生冲击使得我们的被解释变量y在两个维度发生变化,其实就可以考虑双重差分法(DID)。当然,这两个维度一般都是时间维度和地区维度,所以DID常见于面板数据。不过,双重差分法(DID)是一个大家族,除了标准DID模型之外,还存在多种扩展的(准)DID模型,今天咱们就来总结和梳理一下“DID大家族”的成员信息。

2024-05-17 13:45:49 849

转载 优化|贝叶斯优化系列 (一):基础算法原理

贝叶斯优化是一种处理黑盒函数优化问题的重要方法。它通过构建一个目标函数的代理模型,并且利用贝叶斯机器学习方法如高斯过程回归来评估代理模型的不确定性。基于代理模型,通过一个采样函数来决定在哪里进行采样。本推文简单描述了贝叶斯优化方法的框架,包括高斯过程回归和三种常用的采样函数:期望提升,知识梯度,熵搜索和预测熵搜索。最后,本文提供了一些常用的高斯过程回归和贝叶斯优化的软件包。论文作者:Peter I. Frazier。文章由『运筹 OR 帷幄』原创发布。

2024-04-13 08:58:51 240

原创 强化学习中SARSA(State-Action-Reward-State-Action)和Q-learning的区别

SARSA(State-Action-Reward-State-Action)和Q-learning是两种经典的强化学习算法,它们都用于学习最优策略以使智能体在一个环境中获得最大的累积奖励。总的来说,SARSA和Q-learning都是强化学习算法的经典代表,它们在更新方式和适用情况上有所不同,选择哪种算法取决于具体的问题和应用场景。SARSA 和 Q-learning 在更新策略时的一个重要区别在于它们是同策略(on-policy)和异策略(off-policy)学习算法。

2024-03-15 15:09:43 948

原创 关于我使用numpy.random.choice()遇到坑这件事

做仿真时经常使用到随机数,下面是一个场景:使用np.random.choice([0,1],p=[0.5,0.5],size=1)去进行随机的二选一,假设需要随机选择1000次,为了保证结果的稳健性,对前述过程重复50次,为了保证可复现性,对每次重复给予特定的随机数种子,即第n次重复时,设置np.random.seed(n)。我想观察的是1000次随机选择是否存在偏误(倾向于某个选项),因此我对1000次随机选择的结果求平均值,平均值低于0.5表明偏向于选项0,高于0.5表明偏向于选项1。

2024-03-05 21:16:15 502 1

转载 如何理解 95% 置信区间_95%CI

首先明白置信区间的定义是什么:在统计学中,一个概率样本的置信区间(英语:Confidence interval,CI),是对产生这个样本的总体的参数分布(Parametric Distribution)中的某一个未知参数值,以区间形式给出的估计。相对于点估计(Point Estimation)用一个样本统计量来估计参数值,置信区间还蕴含了估计的精确度的信息。1Keyword置信区间并非评价该组样本的发生概率置信区间是通过概率样本来推测未知的总体参数置信区间给出的是对于总体参数的区间估计,而非点估计。

2024-02-25 10:09:29 4220

原创 python实现对导入包中的全局变量进行修改

在写程序中遇到这样一个问题,有一个base.py在另一个主程序test.py中,导入这个文件,并使用其中的print_x函数,但是我想修改base.py中全局变量x的值,于是在test.py运行test.py之后,发现输出仍然是'base',这是因为在 Python 中,全局变量是相对于模块(文件)的,而不是相对于代码中的位置。当在 test.py中使用 global x来定义x并赋值为 'test'时,这个 x是属于test.py模块的全局变量,而不是 base.py中的全局变量 x。

2024-01-10 22:50:14 813

转载 离散选择模型下需求函数的估计-BLP

本文是 IO 中需求估计的一派方法的起点,文中除了介绍 BLP 的计量结构和算法,也强调了改写模型的意义以及其与之前的经典模型(McFadden 的 Multinomial Logit 以及 Nested Logit)的对比,强调 BLP 引入的随机系数的模型是如何优于 MNL 以及 Nested Logit。其可以被认为是 Berry 1994 的一种特例,但由于给出了数值积分以及压缩映射的算法,使具体的算法可以得到应用,因此更为著名。

2024-01-09 21:27:27 341

转载 python并发编程(理解多进程,多线程,多任务)

多线程与多进程的基本概念,python中实现多线程与多进程的示例代码。

2024-01-07 23:26:57 131

转载 Python 基础:深入了解Python中的GIL(全局解释器锁)(下篇)

在上一篇 GIL 的文章中,感性的了解了 GIL,本篇文章尝试从源码层面来简单解析一下 GIL,这里使用 cpython 3.7 版本的源码 (其实这块没有太大的改变,所以你看 3.5、3.6 的 Python 源码都可以),你可以直接通过 github 浏览相关部分的源码。

2024-01-07 23:13:35 141

转载 Python 基础:深入了解Python中的GIL(全局解释器锁)(上篇)

熟悉 Python 的人理应都听过 GIL(Global Interpreter Lock,全局解释器锁) ,大概也知道它就是造成 Python 多线程并发其实是「伪并行」的核心原因,但依旧很多人没有深入其中,所以 HackPython 尝试以上、下两篇文章来阐释 GIL,分别从其表现现象、对应源码以及 Python 对 GIL 改进等方面进行讨论。

2024-01-07 23:08:22 174

原创 爬虫实战3-js逆向入门:以黑猫投诉平台为例

【代码】爬虫实战3-js逆向入门:以黑猫投诉平台为例。signature参数逆向

2024-01-05 22:16:14 2537 1

原创 Python 遍历某文件夹下所有文件夹或文件

os.listdir(path) 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表(不包含子文件夹里的文件夹和文件)os.scandir(path)返回指定文件夹下文件夹和文件对应的os.DirEntry对象的迭代器(不包含子文件夹里的文件夹和文件),运行效率比os.walk高。

2024-01-03 23:31:56 963

转载 时间序列分析:ARIMA 模型(Python实践)

ARIMA模型全称为自回归差分移动平均模型(Autoregressive Integrated Moving Average Model)。ARIMA模型主要由三部分构成,分别为自回归模型(AR)、差分过程(I)和移动平均模型(MA)。

2023-12-20 22:21:31 277

转载 时间序列分析进阶全面指南(附 Python 代码)

时间序列是在规律性时间间隔记录的观测值序列。依赖于观测值的频率,典型的时间序列可分为每小时、每天、每周、每月、每季度和每年为单位记录。有时,你可能也会用到以秒或者分钟为单位的时间序列,比如,每分钟用户点击量和访问量等等。

2023-12-20 22:04:19 189

转载 如何简单地理解时间序列分析

时间序列分析的文章更新到这里,总共介绍了两个时间序列分析的体系:时间序列分解模型体系和 AR/MA/ARMA/ARIMA 模型体系。两者的分析原理是不同的,时间序列分解是力求将时间序列分解成不同的变动成分,分析每种变动成分的规律,然后在综合各种成分的规律用于预测;AR/MA/ARMA/ARIMA 模型体系是从时间序列数值本身的相关关系出发,将移动平均技术、相关分析技术和平稳技术(差分)等纳入模型,力求建立时间序列数值之间的回归方程,从而达到预测的目的。

2023-12-19 23:26:45 202

转载 Stata——固定效应模型、随机效应模型、混合效应模型(区别、实例)

在面板数据线性回归模型中, 如果对于不同的截面或不同的时间序列, 只是模型的截距项是不同的, 而模型的斜率系数是相同的, 则称此模型为固定效应模型。随机效应模型认为截距项和解释变量不相关,而固定效应模型认为截距项和解释变量是相关的。

2023-11-05 09:36:02 32583

转载 stata 无法识别调用 plus 外部命令,报错:command XXX is unrecognized 如何解决?

stata无法识别调用plus外部命令,报错:command XXX is unrecognized 如何解决?简单几步即可解决

2023-09-24 10:33:09 5916

转载 几个更优雅、更高效 Pythonic 代码写法!

本文分享几个鲜为人知的 Pythonic 技巧。这些技巧非常有用,但并不广为人知。通过学习和使用这些技巧,可以帮你节省时间和精力,并使你的代码更加优雅和高效。

2023-09-06 16:07:03 219

转载 【Appium】最新版本环境搭建 - 包含 JDK+SDK+Appium + 模拟器配置_appium server

众所周知,万事开头难,而环境搭建就是我们的第一道坎,在版本选择及配置时总会遇到各种问题。这篇我尽可能详细的介绍了搭建过程中的步骤,希望对你有所帮助。

2023-08-06 18:01:21 5965

原创 SDK Manager打开闪退问题的解决方法-已下载JDK并配置了环境变量

SDK Manager打开闪退问题的解决方法-已下载JDK并配置了环境变量

2023-08-06 15:34:59 2388 4

转载 什么是 P 问题、NP 问题、NPC 问题和NP-hard问题?

转载一篇由[Matrix67](https://http://www.matrix67.com/)大神在17年前所写的博客,介绍P问题、NP问题、NPC问题和NP-hard的概念辨析

2023-07-14 10:20:29 94

原创 scipy.optimize应用-使用curve_fit和minimize进行函数拟合与非线性规划 Python

​在上一篇文章中,我们使用scipy.optimize.curve_fit来拟合自有数据的函数,获得函数中未知参数的值。在本文中,我们将结合scipy.optimize.curve_fit和scipy.optimize.minimize两个方法实现拟合自有数据函数表达式,并进行非线性规划寻找拟合后函数的最大值或最小值。

2023-07-11 13:48:56 3817

原创 Numpy基础-np.random.shuffle()、np.random.permutation()

Numpy基础-np.random.shuffle()、np.random.permutation()随机排列数组

2023-07-09 11:53:12 1006

原创 Numpy基础-np.random.choice()、np.where()

Numpy基础-np.random.choice()、np.where()

2023-06-29 19:17:59 149

原创 Python-使用matplotlib.pyplot实现实时数据动态显示

用python做仿真一个痛点就是不能像netlogo等一些其他软件可以很方便的实现实时数据可视化,也正是由于这一点,调试仿真系统时不够直观。因此,掌握如何根据仿真系统即时生成的数据绘制动态图形很重要。已经有几位博主给出了详细的博文,这里给大家列举出来。为了增加点新东西,,方便大家读懂代码。

2023-06-29 16:34:42 12693

转载 详解Python CONDA

本文介绍 Anaconda 的**强力管家 Conda:可灵活管理 python 的包 package 和环境 environment

2023-06-21 10:56:56 1879

转载 详解Python pip!

相信对于大多数熟悉 Python 的人来说,一定都听说并且使用过 pip 这个工具,但是对它的了解可能还不一定是非常的透彻,今天小编就来为大家介绍 10 个使用 pip 的小技巧,相信对大家以后管理和使用 Python 当中的标准库会有帮助。

2023-06-21 10:43:14 231

原创 爬虫实战2续-批量爬取某博博文、评论和回复

在上一篇文章中,我们针对一篇博文编写代码实现完整爬取该博文下的所有评论和回复,在这篇文章中,将对代码进行修改和增加,实现对用户搜索关键词后展示的所有博文的博文内容、评论和回复的完整爬取。

2023-06-20 15:16:44 744

原创 爬虫实战2-某博评论和回复

1、爬取wb正文存储于txt文件中2、爬取博文下的评论和回复,分别存储于两个表格中,并存储主码与外码,方便后续连接

2023-06-15 10:20:05 1111 4

原创 使用Python进行方差分析-方差齐性检验、正态性检验、两种方差分析

方差分析是用于分析定类数据与定量数据之间的关系情况。例如研究人员想知道三组学生的智商平均值是否有显著差异。进行方差分析需要满足如下假定:(1)抽取数据的随机性与独立性假定这一假定要求随机抽取样本,确保一组数据一定独立于实验中的任何其他数据。(2)抽取数据的正态性假定这一假定要求在抽样的时候一定要在正态总体中随机抽取数据,即保证抽取的数据服从正态分布。但方差检验对数据的正态性的有一定的耐受能力,只要数据近似正态即可接受。如果数据严重不正态,则可使用非参数检验。

2023-06-01 08:30:00 4548 5

原创 如何根据自有数据拟合绘制3D曲面图-Python matplotlib

在网上找了很久怎么用自己有的dataframe数据,拟合出3d的曲面图,大部分人都是根据已知函数去绘制,有几篇进行拟合绘制,但是还是根据特定函数生成的数据,没有一篇直接用dataframe数据画3d曲面图的。讲的比较好的几篇这里列出来供大家参考,本文主要针对使用自有数据拟合绘制3d曲面图进行详解。

2023-05-30 14:03:31 9533 6

转载 python的zip()、map()、enumerate()、filter()、apply()函数用法

zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存。我们可以使用 list() 转换来输出列表。

2023-05-20 19:09:47 239

转载 ABM_靠谱吗?以建模病毒扩散为例

对模型的基本要求,是其灵活性足以捕捉研究对象的核心特点,或者说,决定系统演进的核心机制。,因此,在更长的时间尺度看,对病毒的记忆可能让人调整自己的行为规则 (behavioral rule adjustment),并在下次遇到相似情况时表现得不同,比如对信息更警觉,反应更快、更强,对政策更配合,这在群体层面上也影响着病毒的扩散。的,会依据一定的行为规则 (behavioral rule) 对环境做出反应,包括病毒的威胁、政策的约束、他人行为的变化等,之后,群体行为的变化又会反过来作用于环境。

2023-05-16 08:58:55 277

原创 系统仿真中的验证(Verification)与确认(Validation)

通过验证过程使仿真程序与仿真模型保持一致,并能准确地反映模型中各部分之间的逻辑关系、各参数之间的数量关系以及对模型所作的简化和假设等,从而使人们确信,在计算机上运行该仿真程序能够复现仿真模型内在的逻辑和数量关系,进而展示实际系统的基本性能。将仿真模型的输出数据与所研究的现实系统的实际数据作比较,可能是模型确认最决定性的步骤。仿真模型的确认过程是对模型和实际系统作反复比较的过程,并且利用两者的比较差别来改进和修改模型,使之逐步向实际系统逼近,直到仿真模型被确认为实际系统的真正代表为止。

2023-05-13 12:14:53 3607

转载 强化学习入门:基本思想和经典算法(转载)

强化学习(Reinforcement learning,RL)讨论的问题是一个智能体 (agent)怎么在一个复杂不确定的环境 (environment)里面去极大化它能获得的奖励。通过感知所处环境的状态 (state)对动作 (action)的反应 (reward), 来指导更好的动作,从而获得最大的收益 (return),这被称为在交互中学习,这样的学习方法就被称作强化学习。强化学习在强化学习过程中,智能体跟环境一直在交互。智能体在环境里面获取到状态,智能体会利用这个状态输出一个动作,一个决策。

2023-05-12 22:31:15 806

翻译 文献翻译:User Acceptance of Information Technology: Toward a Unified View(UTAUT理论)

用户对信息技术的接受度:走向统一的观点作者:Viswanath Venkatesh,马里兰州大学罗伯特·史密斯商学院;Michael G. Morris弗吉尼亚大学麦克林泰尔商学院;Gordon B. Davis明尼苏达大学卡尔森管理学院;Fred D. Davis山姆·沃尔顿商学院阿肯色大学。

2023-05-11 22:30:58 2658

原创 使用python实现固定效应模型

使用固定效应模型一定要重新设置索引,且必须设置两个,(否则会报错:ValueError: The index on the time dimension must be either numeric or date-like)无论是使用时间固定效应还是个体固定效应或双固定效应,这里指定firm和year列为新的索引,另外PanelOLS.from_formula中的EntityEffects和TimeEffects分别指定个体固定效应和时间固定效应,两者都包含在参数中则表示双固定效应模型。

2023-05-09 22:26:25 5888 4

航空航天订票系统-C语言

内容概要:数据结构与算法课程设计,运用C语言结构体、指针、队列、堆栈、数组等数据结构,实现航空航天订票系统的功能,功能菜单包括查询航线、订票和退票。 适用对象:C语言初学者

2023-06-20

批量爬取某博博文、评论和回复

任务描述 1、爬取某博正文存储于单独文件中 2、爬取博文下的评论和回复,分别存储于两个表格中,并存储主码与外码,方便后续连接 解决方案 1、爬取网页解析后得到博文编号 2、从开发者工具中的抓包工具中查看json格式数据,找到存储评论数据的json文件,及目标服务器地址 3、识别下滑产生的新评论数据包与就评论数据包之间的联系 4、根据2中联系的规则,循环爬取评论 5、对于每条评论中的回复,同样识别新旧回复数据包之间联系,并依规则循环爬取

2023-06-20

层次分析法:对旅游电商网站进行评分排名-《信息资源管理》实验报告

本次实验主要运用层次分析法和模糊综合评价两种信息分析方法,通过定量与定性相结合方法对国内五个知名旅游电商网站进行综合评价,使用层次分析法和模糊综合评价对相应对象进行综合评价主要是通过构建判断矩阵,求出评价指标的权重系数,再根据权重系数对相应对象进行评价的过程。 层次分析法的基本原理是根据问题的性质和要达到的总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同层次聚集组合,形成一个多层次的分析结构模型,从而最终使问题归结为最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要权值的确定或相对优劣次序的排定。 模糊综合评价的基本原理是根据模糊数学的隶属度理论把定性评价转化为定量评价,即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价。

2023-04-21

《数据挖掘与大数据分析》实验报告-数据预处理

本实验报告使用数据集选自机器学习存储库 UCI,数据集标题为心脏病数据库,数据采集自克利夫兰诊所基金会、匈牙利心脏病研究所、加州长滩退伍军人管理局医疗中心、瑞士苏黎世大学医院。UCI在原数据库的基础上提供两个数据集,一个数据集包含所有的 76 个原始属性,另一个数据集仅包含过去实验实际使用到的 14个属性,本实验选取后者,共303 条数据。实验报告内容包括数据清洗(缺失处理、异常值、噪声)、数据归约(维度约减(特征选择、PCA)、样本抽样)、各种距离计算

2023-04-21

《数据挖掘与大数据分析》分类与聚类实验报告

使用数据集选自机器学习存储库UCI,数据集标题为心脏病数据库,数据采集 自克利夫兰诊所基金会、匈牙利心脏病研究所、加州长滩退伍军人管理局医疗中 心、瑞士苏黎世大学医院。UCI 在原数据库的基础上提供两个数据集,一个数据 集包含所有的76 个原始属性,另一个数据集仅包含过去实验实际使用到的14 个属性,本实验报告选取后者,共303 条数据。进行数据的分类与聚类操作,包括各种分类算法的比较、各种聚类算法的实现,以及绘制决策树和神经网络结构图等内容。

2023-04-21

ChatGPT的工作原理是什么?大语言模型原理详述

ChatGPT 能够自动生成一些读起来表面上甚至像人写的文字的东西,这非常了不起,而且出乎意料。但它是如何做到的?为什么它能发挥作用? 我在这里的目的是大致介绍一下ChatGPT 内部的情况,然后探讨一下为什么它能很好地生成我们认为是有意义的文本。 我首先要说明一下,我将把重点放在正在发生的事情的大的方向上,虽然我会提到一些工程细节,但我不会深入研究它们。(我所说的实质内容也同样适用于目前其他的 “大型语言模型” LLM 和 ChatGPT)。

2023-04-21

css2019年中国社会状况综合调查数据

“中国社会状况综合调查”(Chinese Social Survey,简称CSS)是中国社会科学院社会学研究所于2005年发起的一项全国范围内的大型连续性抽样调查项目,目的是通过对全国公众的劳动就业、家庭及社会生活、社会态度等方面的长期纵贯调查,来获取转型时期中国社会变迁的数据资料,从而为社会科学研究和政府决策提供翔实而科学的基础信息。 该调查是双年度的纵贯调查,采用概率抽样的入户访问方式,调查区域覆盖了全国31个省/自治区/直辖市,包括了151个区市县,604个村/居委会,每次调查访问7000到10000余个家庭。此调查有助于获取转型时期中国社会变迁的数据资料,其研究结果可推论全国年满18-69周岁的住户人口。 为了兼顾纵贯调查的连续性和社会议题的现实性, CSS的调查问卷在设计上分为基础模块、更替模块和热点模块三个部分。其中基础模块固定不变,包含了个人基础信息、劳动与就业、家庭结构、家庭经济状况等内容;更替模块如社会阶层地位流动、社会保障、休闲消费、社会价值观等,隔一定周期后重复调查;热点模块则与时俱进,目前已进行了社会群体利益关系、民生问题、城镇化等主题的研究。

2023-03-31

文本分词常用中文停用词表

使用jieba分词时,需要载入停用词表,这四个是常用的停用词表,文件名对应如下: 中文停用词表 cn_stopwords.txt 哈工大停用词表 hit_stopwords.txt 百度停用词表 baidu_stopwords.txt 四川大学机器智能实验室停用词库 scu_stopwords.txt

2023-03-31

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除