高山莫衣-CSDN博客

原创一文搞懂：如何在深度学习中使用GPU和cuda加速

接下来，我们使用 x.tolist() 方法将 x 转换为Python列表并将其添加到 result 中，或者使用 x.cpu().numpy() 方法将 x 转换为CPU上的NumPy数组，然后将该数组添加到 result 中。不是的，len(Xdata)并不在GPU上。要在GPU上创建一个列表，并将张量对象添加到该列表中，可以使用PyTorch的torch.Tensor.tolist()方法或者torch.Tensor.cpu().numpy()方法先将张量转换为NumPy数组，再将数组添加到列表中。

2023-12-02 10:17:42 9945 2

原创菜鸟学Java public static void main(String[] args) 是什么意思？

包名的层数没有硬性的限制要求，你可以根据需要组织包的层次结构。一般来说，官方网站或文档会提供相应的版本兼容性信息，你可以参考这些信息选择适合你的项目的版本。而对于第三方库和框架包，你需要下载相应的库文件，并在项目中进行配置和引用，以便使用其功能。方法中使用其他类型的参数，你可以将命令行传入的字符串参数解析为你需要的类型。），包含了方法要执行的代码块。在这个例子中，方法体内部没有给出具体的代码，你可以在这个代码块中添加你要执行的操作。对于包的层数并没有硬性的限制要求，你可以根据自己的需要来组织包的层次结构。

2023-06-25 17:16:31 31540 7

原创联邦学习算法介绍-FedAvg详细案例-Python代码获取

在DP-FedSGD中，被选中的参与方使用全局模型参数对局部模型进行初始化，通过批梯度下降法进行多轮梯度下降，计算梯度更新量。而在DP-FedAVG中，是利用一个批次的数据进行一次梯度下降，计算梯度更新量。由服务端收集各客户端的梯度信息，通过聚合计算后再分发给各客户端，从而实现多个客户端联合训练模型，且“原始数据不出岛”，从而保护了客户端数据隐私。假设中心方是好奇的，那么客户端通过某种规则向其他客户端广播梯度信息，收到梯度信息的客户端聚合参数并训练，将新的梯度信息广播。面向神经网络模型, 假设网络总共有。

2023-03-12 10:36:34 28055 201

原创 MySQL 案例-教学管理信息系统

MySQL简单案例，通过构建数据库、建立表格，以及约束。向表格中插入值等操作。

2023-03-11 20:04:16 8550 4

原创知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

你好！这是一款实体关系联合标注的本地小程序，以Python3Python3Python3实现。本系统是一种标注文本语料中命名实体与关系或属性的半自动化软件系统，应用PythonPythonPython编程实现可视化界面和主要功能，利用HTMLHTMLHTML和CSSCSSCSS提示标注教程与规范(无需关心它们如何实现)。利用本系统进行文本标注将原始段落文本更新为带有事先定义的命名实体、关系或属性的文本标签数据。

2022-10-31 15:44:50 9301 103

原创 python爬虫技术实例详解及数据可视化库

前言在当前数据爆发的时代，数据分析行业势头强劲，越来越多的人涉足数据分析领域。面对大量数据，人工获取信息的成本高、耗时长、效率低，是否能用代码去完成大量复杂的工作，从而从网络上获取到目标信息？由此，网络爬虫技术应运而生。网络爬虫简介网络爬虫（web crawler，又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种用来自动浏览万维网的程序或者脚本。爬虫可以验证...

2020-02-24 11:58:56 8195 8

原创读取手机通信录vCard文件（后缀vcf）文件并导出为excel表格

程序能够系统性地遍历VCF文件，识别每个以"BEGIN:VCARD"开始、“END:VCARD"结束的联系人数据块，并从中提取关键字段。解析出的信息会结构化地存入数据集合，最后利用。库生成包含"姓名”、“电话”、"邮箱"等列的Excel文件（.xlsx格式），确保所有联系信息一目了然，方便后续的查找、编辑或导入其他设备。它专门解决了VCF文件（vCard格式）用文本编辑器查看杂乱无章、无法直接筛选或批量编辑的痛点，使得备份的通讯录数据变得可读、可管理。，并将其中的联系人信息（如姓名、电话号码、邮箱等）

2026-01-06 09:29:57 543

原创【概念初识】什么是因果推断？

摘要：本文深入探讨了相关分析与因果推断的核心差异。相关分析（如相关系数）仅描述变量间的统计关联，而因果推断（如随机对照试验）旨在确定变量间的因果关系。通过经典案例（冰淇淋销量与溺水人数的虚假相关）揭示混淆变量的影响，并对比了两种方法的适用范围与局限性。文章强调“相关性不等于因果性”，并介绍因果推断的关键方法（如工具变量、断点回归等），指出回归分析可作为工具但需满足严格假设才能用于因果推断。最后以教育回报、药物试验等案例，说明如何在统计实践中实现从相关到因果的跨越。全文系统阐述了因果推断的理论框架与实践路径，

2025-10-10 10:46:57 942

原创论文《Inference for Iterated GMM Under Misspecification》的例子3

例子3展示了在非线性矩条件下，迭代GMM的收敛性依赖于误设程度。只有当方差误设较小（σ223σ22/3) 时，迭代才保证收敛。否则，可能需要使用稳健推断方法。

2025-09-26 21:02:02 951

原创论文《Inference for Iterated GMM Under Misspecification》的例子2

在论文《Inference for Iterated GMM Under Misspecification》的例子2中，作者通过一个线性工具变量（IV）模型展示了在模型误设（misspecification）下迭代GMM估计量的行为。该例子旨在说明，即使工具变量无效（违反排除限制），迭代GMM估计量仍能通过收缩映射收敛到一个伪真实参数（pseudo-true parameter），且该固定点对误设程度不敏感。

2025-09-26 20:02:28 765

原创《Inference for Iterated GMM Under Misspecification》的例子1

在论文《Inference for Iterated GMM Under Misspecification》的例子1中，位置模型用于演示在模型误设（misspecification）下迭代GMM估计量的行为。该例子考虑一个简单的位置模型，其中观测值 Xi=(Yi,Zi)X_i = (Y_i, Z_i)Xi=(Yi,Zi) 是独立同分布的（i.i.d.）。矩函数定义为 m(Xi,θ)=(Yi−θ,Zi−θ)′m(X_i, \theta) = (Y_i - \theta, Z_i - \theta)'m(

2025-09-26 17:29:25 1122

原创广义矩估计错误指定时的一个推导【续7】

正文中的描述：定理3。设θ^T(2){\widehat{\theta }}_{T}\left( 2\right)θT(2)为基于WT=V^T−1{W}_{T} = {\widehat{V}}_{T}^{-1}WT=VT−1和θ∗(2)=θ∗(V−1){\theta }_{ * }\left( 2\right) = {\theta }_{ * }\left( {V}^{-1}\right)θ∗(2)=θ∗(V−1)的第二步GMM{GMM}GMM估计量。同时假设假设1、3-7以及假设A.1-A.9成

2025-09-22 16:15:14 1094

原创长期方差（Long-run Variance）与异方差自相关一致（Heteroskedasticity and Autocorrelation Consistent, HACC）估计量

特征长期方差 (S)HACC估计量 (S\hat{S}S本质理论参数估计量角色目标（Target）工具（Tool）/ 方法（Method）可知性未知，但存在可以用样本数据计算出来性质一个固定的值一个随机变量（不同样本得到不同估计）核心要求无一致性S→pSS→pS一个完美的类比：长期方差SSS就像是总体均值μ\muμ。它是一个描述总体性质的理论概念。HACC估计量S\hat{S}S就像是样本均值Xˉ\bar{X}Xˉ。它是我们用来估计总体均值的工具。“一致”

2025-09-22 15:51:35 961

原创广义矩估计错误指定时的一个推导【续6】

附录作者证明思路定理2的证明。同样，设cTT1/2H1TH2T2H2T3→dN0Ω∗A.9其中Ω∗G∗′WΩ11WG∗Ω22G∗′Ω33G∗G∗′WΩ12G∗′WΩ13G∗Ω21WG∗G∗′Ω31WG∗Ω23G∗G∗′Ω32。

2025-09-22 15:20:14 1225

原创广义矩估计错误指定时的一个推导【续5】

在证明定理1、2和3时，我们使用以下结果。在假设1,2,4−61,2,4 - 61,2,4−6 和假设A.1-A.6的基础上，依据标准论证(例如，Newey 和 McFadden(1994，第2.1定理)以及 Wooldridge(1994，第7.1定理))得出θ^T→pθ∗.(A.6){\widehat{\theta }}_{T}\overset{\mathrm{p}}{ \rightarrow }{\theta }_{ * }. \tag{A.6}θT→pθ∗.(A.6)其中 θ∗{\thet

2025-09-22 14:50:11 1084

原创广义矩估计错误指定时的一个推导【续4】

基准对照（情况 i）：最简单的设定，用于建立直觉。标准第一步（情况 ii）：分析过度识别模型的第一步估计。“最优”GMM的理论与实践（情况 iii & iv）：这是论文的重中之重。它揭示了在误设下，理论上的最优权重（情况iii）和实践中使用的“最优”权重（情况iv）不再等价，并且会产生根本不同的结果。当你模型设定错误时，你从标准软件包中得到的那种“最优”GMM估计结果，其统计性质可能比你想象的要糟糕得多（例如，收敛速度更慢，分布可能退化）。

2025-09-22 14:19:28 973

原创广义矩估计错误指定时的一个推导【续3】

要理解这一点，我们需要看清公式 (9) 是如何得出的，以及矩阵H∗H_*H∗在其中扮演的角色。

2025-09-22 14:04:50 711

原创广义矩估计错误指定时的一个推导【续2】

在GMM估计的渐近推导中，公式(9)是从公式(5)到(8)通过代入关键简化和代数操作得到的。

2025-09-22 11:48:37 989

原创广义矩估计错误指定时的一个推导【续1】

H2T1H2T1H2T1cTGTθT−GTθ∗′WTμ∗H2T1cTGTθT−GTθ∗′WTμ∗cTc_TcT是缩放因子（通常cTTcTTGTθ∂gTθ∂θ′GTθ∂gTθ∂θ′是样本矩函数的导数矩阵（维度q×pq \times pq×pWTW_TWT是加权矩阵（维度q×。

2025-09-22 11:36:26 923

原创广义矩估计错误指定时的一个推导

是唯一的随机变量部分，因为它捕获了样本矩的随机波动，而其他项收敛到常数，因此在渐近分析中被视为非随机。这种处理是渐近理论的标准方法，允许我们推导估计量的渐近分布。这个推导是GMM渐近理论的基础，特别是在模型误设下，它揭示了估计量的收敛行为依赖于加权矩阵。在推导渐近分布时，我们通常将公式(4)右边的常数部分提取出来，只关注随机部分。被视为非随机（或渐近常数），是由于渐近理论中的关键性质和行为。在GMM估计的渐近推导中，公式(4)的右边之所以将。最后，为了得到公式(4)，我们引入缩放因子。

2025-09-22 10:32:26 961

原创什么是可测的（measurable）？

它是一个技术性、基础性的假设，确保我们使用的数学对象（期望、概率）是定义良好的。它不同于连续性。可测性是关于函数能否被积分，而连续性是关于函数值是否平滑变化。在实践中，几乎所有你在应用中会遇到的经济学和统计学函数都是可测的（例如，连续函数、分段连续函数、单调函数等都是可测的）。这个假设主要是为了在理论推导中排除那些极端怪异、现实中几乎不存在的数学反例，从而保证理论的严谨性。所以，大致理解为：“我们假设这些函数足够规则，以便我们可以安全地对其进行积分和概率运算，而不会遇到数学上的麻烦。

2025-09-19 21:29:09 748

原创什么是紧集(compact set)？

在有限维的欧几里得空间RpRp（这是我们处理参数向量θ\thetaθ一个集合是紧集，当且仅当它是有界且封闭的。在计量经济学的语境中，当说“Θ\ThetaΘ参数空间Θ\ThetaΘ是明确设定的，而不是整个无穷的RpRp空间。这个设定好的空间是有界的（例如，所有参数的绝对值都小于某个很大的数BBB这个空间是封闭的（通常通过包含等号来实现，例如θ≤Bθ≤B而不是θB\theta < BθB这个假设是保证极值估计量具有良好大样本性质（如一致性）的。

2025-09-19 21:06:50 1133

原创 SPSA为什么要求三阶可导

一阶可导保证了梯度。

2025-08-29 14:19:27 788

原创迁移框架下的期望分位数回归的纠偏

模块核心作用数学体现领域差异隔离分离源域迁移与目标域适应，避免分布差异污染δ\deltaδ仅优化目标域数据（公式 2.20）噪声偏差修正用目标域无噪数据抵消隐私噪声的影响损失函数展开中的线性项（公式 2.21）局部特征适应使参数更贴合目标域的条件分位数特性（如偏态尾部分布）ρτ\rho_\tauρτ对残差的非对称加权稀疏性保持通过 Lasso 控制增量δ\deltaδ的复杂度，避免纠偏破坏特征选择λδ∣δ∣1λδ∣δ∣1纠偏本质是两阶段估计的贝叶斯思想。

2025-08-18 13:46:03 555

原创期望分位数回归的迁移学习

在迁移学习框架中，源域的选择确实基于其参数与目标域参数的相似性，具体通过 L1 范数距离（∥β−β(k)∥1\left\| \beta - \beta^{(k)} \right\|_1β−β(k)1）是否小于阈值 hhh 来判定。以下是核心逻辑的详细解释：β(0)−β(k)1≤h其中 hhh 是预设的阈值。满足该条件的源域称为 hhh-可迁移源域，纳入信息集 A\mathcal{A}A。几何意义：这等价于以目标域参数 β(0)\beta^{(0)}β(0) 为中心、hhh 为半径的 L1

2025-08-18 13:35:58 454

原创 Oracle algorithm的含义

在统计学领域，“Oracle algorithm”并非指代具体的数据库产品（如Oracle公司开发的数据库系统），而是指一类，其核心特性是。该术语在理论证明和算法评估中扮演重要角色，尤其在迁移学习、高维统计和模型选择等场景下常见。

2025-08-17 22:48:26 373

原创损失函数的多元泰勒展开

多元泰勒展开的核心思想是利用多项式函数逼近多元函数在某点附近的局部行为。对于期望分位数回归损失函数 $\rho_{\tau}(y_i - x_i^{\top}\beta)$，在 $\beta=0$ 处的展开可表示为： $$ \rho_{\tau}(y_i - x_i^{\top}\beta) = \sum_{j=0}^{\infty} \sum_{\phi \in \Phi_j} \lambda_{\phi v_i} \phi(\beta) $$ 其中：基函数 $\phi(\beta)=\beta_1^{

2025-08-17 21:53:52 1343

原创期望分位数回归模型

SIC 是一个评价模型好坏的标准。它说：“一个好的模型，既要能很好地拟合数据（块(e)小），又不能太复杂（块(f)小）”。记住，模型是工具，理解每个部分的目的才能用好它。论文采用了Hu et al. (2015)和Liu et al. (2020)的思路，使用基于。今天我们深入讲解带约束的惩罚期望分位数回归模型以及如何选择它的关键参数。这些公式看起来有点复杂，但别担心，我们会一步步拆解，理解每个部分的含义和作用。受到L1惩罚项的调节（控制复杂度，选择特征），期望分位数损失（聚焦于数据分布的特定位置），

2025-08-17 17:13:36 1090

原创广义矩估计随机近似中1.2和2.1的差异

—它证明：通过精心设计的样本分割和冻结策略，流式算法也能达到离线GMM的统计效率极限。1.2节的S2SLS和2.1节的SGMM虽然公式相似，但存在。1.2和2.1的差异。

2025-08-14 22:17:29 986

原创广义矩估计随机近似中公式(2d)的推导

摘要： GMM估计中权重矩阵的最优性条件要求使用矩条件协方差矩阵的逆（Ω⁻¹）。在线性工具变量回归中，若满足同方差假设，最优权重矩阵可简化为工具变量协方差矩阵的逆（Q⁻¹）。在线算法选择Q⁻¹而非Ω⁻¹，主要基于计算可行性：Q⁻¹可直接通过Sherman-Morrison-Woodbury（SMW）公式在线高效更新（复杂度O(d²)），而Ω⁻¹需已知残差参数导致循环依赖。SGMM通过两阶段权衡实现一致性，第一阶段用Q⁻¹估计初始参数，第二阶段可周期性重构Ω⁻¹提升效率。SMW公式将矩阵求逆转化为标量运算，通

2025-08-14 15:57:42 961

原创 Polyak-Ruppert 平均

（如 SGD）设计的平均技术，由 Boris Polyak（1990）和 David Ruppert（1988）独立提出。它不仅仅是简单的算术平均，而是一种具有。：Polyak-Ruppert 平均是流数据处理的“精装修版”递归平均——它在普通平均的框架上，加装了。当你的目标是高精度在线估计时，指名调用它就是获得统计效率保证的密钥。：Polyak 平均的“特殊之处”不在计算公式，而在其。生成的序列（如 SGD 参数、MCMC 样本）。——它针对的是 SGD 的迭代序列。

2025-08-14 11:08:08 1095

原创广义矩估计的随机近似下的递归平均

流式递归平均：通用高效的在线统计算法公式 (2b) 和 (2e) 采用流式递归平均方法，是处理流数据的核心算法。其核心思想是通过加权融合新数据与历史均值，实现无需存储全部数据的高效计算。关键优势：内存高效（O(1)空间复杂度）在线更新（O(1)时间复杂度/样本）保持统计性质（无偏性、强一致性）应用场景：任何可加统计量（均值、方差、协方差等）实时系统（传感器、金融数据流等）该方法是流数据计算的通用范式，在SGMM中用于保证雅可比矩阵估计和参数估计的统计有效性。

2025-08-14 10:54:39 968

原创广义矩估计的随机近似中的一个推导

牛顿步长在广义矩估计(GMM)中的推导基于目标函数的局部二次近似。通过泰勒展开，将梯度与海森矩阵代入求解极小值点，得到更新公式：β^(k+1)=β^(k)-(G_n'W G_n)^(-1)G_n'W \bar{g}_n(β^(k))。这一方法不仅能自适应调整步长，在线性GMM中更等价于一步估计量。在在线学习场景下，通过样本替代和历史平均，实现了高效的随机牛顿步长更新，兼具优化效率与统计有效性。

2025-08-14 10:44:23 1080

原创两阶段最小二乘法（2SLS）与工具变量（IV）模型

工具变量对解释变量的投影。：工具变量对因变量的加权。

2025-08-13 19:26:26 2231

原创 IV模型（工具变量模型）

将传统IV估计扩展至大规模流数据场景，在保持渐近性质的同时显著提升计算效率。理解这一模型对掌握现代高维计量方法至关重要。，其核心是通过工具变量剥离解释变量与误差项的相关性。本文提出的SGMM算法，通过。工具变量通过“出生季度→教育年限→收入”的间接路径，剥离内生性干扰。论文针对传统GMM的瓶颈（需全样本计算），提出。），则最小二乘法（OLS）估计量。为权重矩阵（如最优权重。IV模型是解决内生性问题的。

2025-08-13 17:00:55 840

原创汉森(1982)提出的广义矩估计法

摘要：汉森(1982)提出的广义矩估计法(GMM)是计量经济学中重要的参数估计方法。该方法通过使样本矩接近理论矩来估计参数，适用于过度识别情形。GMM估计具有一致性、渐进正态性和有效性特点，广泛应用于工具变量回归、资产定价模型等领域。与传统GMM相比，随机GMM(SGMM)实现了在线流式处理、更低内存需求和更快计算速度，同时保持相同的渐进性质。模拟结果显示SGMM在保持估计精度的同时显著提升了计算效率。

2025-08-11 14:28:45 1202

原创将文件移入回收站而不是直接删除

选项被默认选中且呈灰色无法修改，可能是由于系统策略限制、权限问题或注册表被锁定。新配置的电脑，删除的文件夹，没有在回收站里面，而是错误的直接删除了，这显然不符合我的要求，如何解决？完成修改后，重启电脑并测试删除文件是否正常进入回收站。Windows 组件。

2025-07-25 19:21:33 1092

原创 Matplotlib 中调整坐标轴和刻度线粗细

Matplotlib坐标轴样式调整指南本文介绍了Matplotlib中调整坐标轴刻度和轴线样式的多种方法。对于刻度线调整，推荐使用tick_params()函数，可单独控制主次刻度的宽度、长度和颜色，支持面向对象和全局配置方式。轴线粗细可通过spines对象设置，支持单独调整各边轴线和隐藏特定轴线。两种调整都提供了全局默认设置选项(rcParams)。完整示例演示了如何组合使用这些方法，包括启用次刻度、设置网格线等注意事项。建议将刻度线和轴线宽度设为1.5-3磅，使用深色以确保打印清晰度。这些方法使科研图

2025-07-17 13:03:33 1081

原创 Matplotlib 轴标题与刻度字号调整方法

Matplotlib 轴标题与刻度字号调整方法摘要轴标题调整 xlabel()/ylabel()：直接设置字号（fontsize=14） rcParams全局设置：plt.rcParams['axes.labelsize'] = 14 面向对象方式：通过ax.set_xlabel(fontsize=14) 刻度字号调整 tick_params()：plt.tick_params(axis='both', labelsize=14) 单独设置：plt.xticks(fontsize=14) 全局设置：修改p

2025-07-17 10:36:26 499

TA关注的人

好好画词云图，完整项目数据和代码

亚马逊的评论数据集（3.6M的文本评论内容及其标签）

知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

采集到的重庆二手房重庆房地产数据.xlsx

方差分析chenyi.py

深圳二手房交易信息.csv

完全去中心化的学习(Fully Decentralized Learning)简要

RFM客户分类模型方法

with torch.no_grad()和model.eval()在干什么？

和我一起学机器学习-K近邻法

和我一起学机器学习-朴素贝叶斯法

循环神经网络RNN--文本分类--完整代码免费下载

文本卷积网络textCNN--文本分类--完整代码免费下载

和我一起学机器学习-决策树

和我一起学机器学习-逻辑斯蒂回归（Logistic Regression）

freebase的entity id到真实数据的映射 数据集

freebase的entity id到真实数据的映射数据集