心态与习惯-CSDN博客

原创深度学习中的 seq2seq 模型

本文介绍了序列到序列（seq2seq）模型的基本原理和应用。seq2seq模型通过编码器（Encoder）将输入序列转换为固定长度的上下文向量（Context Vector），再通过解码器（Decoder）生成输出序列。文章以LSTM网络为例，展示了如何使用seq2seq模型预测AirPassengers时间序列数据，包括数据预处理、模型构建、训练和评估过程。实验结果表明，该模型能有效预测时间序列，并提供了MAE、SAE和RMSE等误差指标评估预测效果。

2026-01-20 08:02:27 451

原创贝叶斯优化调参的原理

摘要：机器学习中需要确定模型超参数（如隐含层数量、学习率等），该过程称为超参数调优，数学表达式为寻找使误差函数f(x)最小的参数组合x*。贝叶斯优化通过少量f(x)评估来估计最优解，涉及复杂的高斯过程和核函数计算。目前研究尚未深入，有待继续探讨。

2026-01-19 19:05:07 196

原创使用 pytorch 进行深度学习的一般步骤

摘要：本文总结了使用PyTorch进行深度学习的标准流程，主要包括：1）数据加载与清洗；2）数据标准化处理；3）数据转换为Tensor格式；4）划分训练/验证/测试集；5）创建Dataset和DataLoader；6）构建神经网络模型类；7）选择损失函数和优化器；8）训练模型；9）预测评估。文章详细说明了每个步骤的具体实现方法，包括数据预处理技巧、模型构建方式、常用损失函数和优化器选择等，为PyTorch初学者提供了完整的深度学习实践指南。（149字）

2025-12-02 07:21:34 954

原创深度学习中的一些名词: contex vector, batch size, embedding, token, one hot

本文总结了深度学习中三个重要概念：上下文向量（context vector）：在序列模型中用于表示输入序列相关信息的向量，从最初的固定编码器状态发展为注意力机制下的动态加权求和，提升了长序列处理能力。批量大小（batch size）：训练时每次输入的样本数量，影响GPU并行效率、梯度稳定性及学习率设置，常用范围从32到8192不等，需权衡内存与计算效率。嵌入（embedding）：将分类数据转化为稠密向量的技术，通过可学习的低维表示捕捉语义信息，广泛应用于处理文本等非数值数据。这些概念构成了深度学习

2025-11-07 06:20:06 1137

原创长短记忆网络 LSTM，C++， python

本文介绍了LSTM网络的基本原理和训练方法。针对RNN存在的梯度消失问题，LSTM通过引入记忆单元和门控机制，能够有效保存长期依赖信息。文章详细阐述了LSTM的三个关键门控单元（遗忘门、输入门、输出门）的计算公式，以及记忆单元的更新方式。在训练部分，描述了多层LSTM的前向传播过程，并推导了基于时间反向传播（BPTT）的权重更新方法，包括梯度递推关系和参数更新公式。最后简要提及了使用SGD等优化算法进行参数更新的过程。这些内容为理解和实现LSTM网络提供了理论基础。

2025-11-02 05:08:19 1251

原创循环神经网络 RNN，C++

摘要：本文介绍了循环神经网络(RNN)的基本原理及其在序列数据处理中的应用。RNN通过引入循环单元(recurrent unit)实现记忆功能，能够处理序列数据中前后依赖关系。文章详细阐述了RNN的结构特点、参数共享机制和计算公式，包括隐藏状态和输出的计算方法。重点讲解了RNN的反向传播算法(BPTT)，推导了输出层和隐含层的梯度更新公式，并给出了完整的参数更新表达式。文中还通过数学公式和示意图展示了RNN的计算过程和参数更新方法，为理解RNN的工作原理提供了详细指导。

2025-10-25 05:07:23 1216

原创一年一度 1024

英国高校任教体验：学生出勤率低至40%，课程内容简单导致数理基础普遍弱于国内211/985；科研方面项目申请竞争激烈且存在"关系户"，但论文署名规则不同（不强调第一作者）导致学术合作更活跃；形式主义（如EDI）较国内少，教师整体学术水平高于国内，更多资深教授仍在一线科研。

2025-10-24 20:52:20 440

原创 webstorm 调试时不能连接网页

摘要：用户在使用WebStorm调试网页时遇到空白页问题，直接打开网页正常。尝试重装软件、更换浏览器、修改调试设置均无效。最终通过关闭Windows防火墙解决问题。推测可能是系统更新限制了WebStorm的浏览器访问权限，而VSCode不受影响。用户仍偏好WebStorm的调试功能。（149字）

2025-10-12 22:31:40 296

原创尾概率与期望的关系

这篇博客记录了一个关于尾概率与期望的重要等式关系。对于非负离散型随机变量X，其期望可表示为所有尾概率之和；连续型情形下，期望等于尾概率的积分。该公式还可推广到任意实数a的情况，在精算学中被称为"stop-loss transform"。这一结果为通过尾概率计算期望提供了一种简洁的方法。

2025-09-24 04:58:21 476

原创 0-1向量凸包的一个性质

摘要：0-1向量的凸包构成单位立方体，其关键性质是立方体内任意向量均可表示为所有0-1顶点（即立方体顶点）的凸组合。通过构造每个顶点的权重系数λ_s=∏(X_i^s_i·(1-X_i)^(1-s_i))，并证明其和为1，可验证该性质。几何上，二维/三维立方体中的点都可由其顶点的凸组合表示，这一结论可推广到n维空间。证明分为两部分：先证凸包在立方体内，再证立方体内点都属于凸包。

2025-09-11 03:55:01 563

原创两个函数的卷积

卷积是将两个函数生成第三个函数。下面的图形展示了两个函数。

2025-07-27 22:59:41 665

原创勒贝格测度、勒贝格积分

本文简要介绍了测度论中的核心概念——勒贝格积分及其相关理论。作者对比了黎曼积分与勒贝格积分的区别，指出勒贝格积分通过划分值域而非定义域来处理复杂函数的积分问题。文章重点讲解了勒贝格测度的定义、可测集合的判别条件以及可测函数的概念，并以具体例子说明了勒贝格积分的计算方法。最后，文章阐述了勒贝格积分具有的单调保持性质。全文为初学者提供了测度论基础知识的清晰概述，特别适合非数学专业背景但需要应用测度论的研究者参考。

2025-06-13 17:44:55 2519

原创计量经济学的论文范式

的流程，核心是通过统计模型验证经济理论或政策效果。检验美国各州最低工资上调是否导致青少年（16-19岁）就业率下降。让 deepseek 帮我总结了下，供以后参考。，方法选择需紧密围绕研究问题和数据特性。双向固定效应面板模型有几个参数，与。计量经济学论文的研究方法通常遵循。

2025-04-25 17:43:39 1890

原创一篇典型的市场营销论文的结构和范式

以下是一个完整的的市场营销研究案例，包含和。

2025-04-25 17:24:26 1280

原创漫漫学术路

就如同前几天和一些同事聚餐时我说的那样，感觉我这些年走一步，说一步，并没有特别长的规划目标。人生或许就是一些列的确定与不确定组成的，一眼看到头的日子并不喜欢。对于学术，目前见过太多投机的人，很多幸运儿，也有更多的躺平的人。或许对学术和学习新知识有点兴趣，但硬实力不算出类拔萃。距离第一次到重庆，已经七年了。

2025-04-19 00:24:30 378

原创 c++ 在递归运算时可能会比 java 慢

在用 c++ 编写动态规划时，使用了递归函数以及 unsorted_map 存储数据，发现有时候竟然比 java 的 ConcurrentSkipListMap 计算速度慢，尤其是在 hash 为几个浮点型数据的组合时。内存管理：unordered_map 在递归中频繁 rehash 触发内存重分配，远超 ConcurrentSkipListMap 跳跃表的动态调整开销。并发缺失：若递归涉及多线程，unordered_map 需加锁，而 ConcurrentSkipListMap 无锁设计更高效。

2025-03-26 05:24:54 413

原创 c++ 中的 transform，range::transform

在 C++ 中，std::transform 定义在头文件中。它用于对范围内的元素进行转换，并将转换结果存储到目标范围中，类似于 java 或 python 中的 map。

2025-03-23 04:24:03 764

原创 c++ 数组索引越界检查

用 c++ 编写了一些程序，发现 c++ 不会自动检查数组的索引越界问题。有时候程序运行错误，提示的错误信息莫名其妙，但很可能是某个数组越界的问题。在 C++ 中，数组不会进行边界检查，如果 arr[10] 访问了未分配的内存，就可能会得到随机的、异常大的值，甚至可能导致程序崩溃。网上查看的一些检查数组越界的方法似乎不太好用，感觉调试时只能慢慢用 try catch 语句发现到底是哪个数组越界了。

2025-03-21 20:11:31 405

原创 c++ 中的可变参数模板与折叠表达式

c++ 11 引入了可变参数模板，c++ 17 引入了折叠表达式，比 c 语言的可变参数更加简洁灵活。这篇博客总结了一些例子。

2025-03-17 23:14:54 414

原创 c 语言与 c++ 中的 struct 结构体

c++ 与 c 语言的成员都是 public 的。c++ 中的 struct 与 class 基本完全相同，唯一区别在于类可以有私有成员。在 C 和 C++ 中都可以使用 struct 定义结构体。

2025-03-12 05:18:26 271

原创 c++ 中的引用 &

引用与指针经常混淆，总结一下。

2025-03-10 21:23:16 1446

原创 c++ 中的 friend 关键字

在 C++ 中，friend 关键字用于声明友元，它允许一个类或函数访问另一个类的私有（private）和受保护（protected）成员。友元机制打破了类的封装性，但提供了更高的灵活性，适用于特定场景。Python 和 Java 中似乎没有见到类似的关键字。友元函数一个重要的应用是重载运算符。

2025-03-09 02:17:19 439

原创 c++ 调用 gurobi 库及一些使用体会，cmake，mac

python 中直接 import 第三方库，java 加载第三方库的 jar 之后也能直接使用。阶段：编译（compilation）和链接（linking），调用第三方库时，仅仅通过 #include 包含头文件是不够的，必须在链接阶段提供库文件（.a、.dylib 等），以便将代码与库的实现连接起来。Mac 上用 c++ 还有更麻烦些，不能用 VS studio，只能用 CMake 了。但是 CMake 在 mac 上很多时候不能通过 findpackage 找到库的地址，只能指定添加库的地址。

2025-03-07 22:52:30 868

原创什么是线程安全？并行计算与调试

当一个库声称自己“不是线程安全的”（not thread-safe），意思是它在多线程环境下使用时，可能会出现数据竞争（data race）、未定义行为（undefined behavior）或不一致的结果。线程安全（thread-safety）是指一个库或数据结构在多个线程同时访问时，能够保证正确性和一致性，而无需用户额外添加同步机制（如锁）。，意味着不容易对他们使用并行计算（每个线程都要独立创建环境和模型）。求解器 gurobi 与 cplex 都不是线程安全的。

2025-03-04 22:07:49 536

原创 java 与 c++在遍历 map 数据结构上的一些差异

std::map：基于红黑树，插入不会使迭代器失效，因此可以一边遍历一边添加。：基于哈希表，只要不触发 rehash，也可以一边遍历一边添加。与 Java 的区别：C++ 的迭代器设计更宽松，没有快速失败机制，开发者需自己保证正确性。Java 的 HashMap 在容量不足时也会触发类似rehash的扩容（resize），但它的快速失败机制会在遍历时检测到修改并抛出异常。C++ 的 unordered_map 没有这种保护机制，rehash后迭代器失效是程序员的责任。

2025-03-03 18:25:08 952

原创动态规划多阶段报童模型，c++ 实现， java 实现

借助 chaptgpt 和 deepseek，成功实现了c++上的多阶段报童模型的动态规划。花费了几天，将以前的 java 程序用 c++ 实现。

2025-03-02 21:46:27 1001

原创 C++ `struct`、`class` 和 `namespace` 的异同

在 C++ 中，structclass和namespace经常看到，都是，但它们的作用、访问权限和适用场景各不相同。借助 AI 总结了这篇博客。Java 与 Python 中，没有看到 struct 与 namespace 的类似类型。

2025-03-02 00:15:47 1130

原创 c++ 画数学函数图

本文总结了在C++中绘制数学函数图的3种方法：1.调用Python API使用matplotlib画图，需配置Python.h路径并初始化解释器；2.使用matplotlib-cpp库，需修改源码并正确配置路径；3.使用Qt的QPainter绘制，但功能较简单。前两种方法推荐使用TkAgg后端避免卡死，并提供了正弦函数和动画的示例代码。第三种方法因配置复杂未成功使用。文章比较了各方法的优缺点，为C++开发者提供了实用的绘图解决方案。

2025-03-01 20:40:35 695

原创 c++ 中的容器 vector 与数组 array

当初自学 c++ 与 c 语言时，一直被指针弄的云里雾里。后来 c++ 中引入了容器，避免了指针。但是，一些教材把容器的章节放在书本中后面的章节，太不合理。应该把这种方便的功能放到前面，这样一些初学者就不会遇到太多生硬难懂的知识点从而对这个语言望而却步了。让 AI 总结了相关知识点，方便自己以后查阅。

2025-02-28 23:45:49 1094

原创 C++ 17 允许在 for 循环，if 语句，switch 语句中初始化变量

看到 c++ 有这个特性，python 和 java 似乎都没有，根据 AI 的回答进行了一些整理总结。在 C++ 中，允许在for循环和if语句、switch语句中初始化变量，这是引入的一项重要特性，称为。这不仅提高了代码的可读性，还能减少变量的作用域，避免不必要的变量污染。for在for语句的第一部分，我们通常用它来int i = 0;foriijforforifC++17 允许在if语句中初始化变量，使变量的作用域if及其else块，避免污染外部作用域。

2025-02-28 22:08:15 943

原创 c++ 中的 auto 与 const 关键字

总是看到这两个关键字，根据 AI 的回复进行了一些整理总结。

2025-02-28 18:22:44 817

原创 C/C++ 指针详解

想起之前自学 c 语言时花了累计一年看谭浩强的教材，花了一年多看一本 C++ 800多页的大厚书，最终也没有学明白，尤其是指针云里雾里的。感觉借助生成式 AI ，要不了多久，我应该也可以像上手 Java 那样上手 C++ 的大型程序了。指针在 C 和 C++ 中非常重要，理解指针有助于掌握底层内存管理和数据操作！这个指针套指针，我混淆了很多年了。这篇博客基于两个 AI 的回答，整理了指针的相关知识点。，它指向这个变量在内存中的位置。的指针，即数组第一个元素的地址。并且，当 p 为有效指针时，

2025-02-27 03:12:44 744

原创 Gurobi 并行计算的一些问题

最近尝试用 gurobi 进行并行计算，即同时用多个 cpu 核计算 gurobi 的 model，但是发现了不少问题。目前看到的一些 gurobi 或 cplex 正确运行并行计算的例子，基本都是在目标函数中重新新建模型，或者将原模型的一些参数文件传递到目标函数中，仍然新建模型。真要实现规划模型的并行计算，估计要深入修改求解器模型的源代码。官方没有意愿将模型对象支持 pickle，估计是因为可能会损失模型的其他功能吧。对于求解器的并行计算，目前来看，没有看出相比串行计算有太大优势。

2025-02-26 21:00:34 919

原创详解 c++ 中的 namespage

C++ 中的命名空间很特别，其他编程语言基本都没有。命名空间介于函数与类之间，兼顾了二者的一些优点。这篇博客根据 chatgpt 的回答整理。

2025-02-26 18:06:28 927

原创对于动态规划，java, C++, Python 到底谁的运行速度快

经过实际上手测试，综合看来，还是 c++最快，尤其是在普通的循环与计算上，比 java 还快不少但是，若对于更复杂的数据结构，c++ 与 java 相比优势没那么大了，而且 c++ 还要注意开启优化或者对数据结构进行调整优化python 一些库，由于底层基于 c 语言运行，速度可以达到非常快但是，经过一天的探索，发现 c++ 真是比较繁琐的编程语言，很多类、函数或特殊变量的注释都不像 java 或 python 那么清晰易懂，而且程序、库的调用以及运行，要麻烦非常多。

2025-02-23 19:43:53 1391

原创 mac 下 java 调用 gurobi 不能加载 jar

在 mac 电脑中的 java 始终不能加载 gurobi 的 jar 包，java 的开发软件 eclipse，idea 总是显示找不到 gurobi 的 jar 包，但是 jar 包明明就在那里。gurobi 对 python 支持的最好，对于 java，而且还是 mac 的支持，就没有那么丰富与及时了。

2025-02-23 18:07:41 444

原创 [Python 数据科学] Python 的良好编程规范与 logging 的使用

字段说明时间日志级别日志内容记录日志的文件%(lineno)d行号logging。

2025-02-14 21:01:51 1086 1

原创 [Python 数据科学] Python 导入其他 py 文件， import other module

例如，在 Pycharm 中，对于目录结构2，可以直接按下面代码导入模块，而不用通过 sys.path 添加父文件夹路径。Python 编程中，每个以 .py 为后缀的文件被称作模块（module）。很多时候，我们需要导入其他模块中的函数，在 Python 中导入其他文件夹中的模块时，有几个规则和方法可供使用。，其中，“other_folder” 为文件夹在电脑硬盘中的详细地址。若具体想导入 my_module.py 模块中的某个函数或类 foo()，可以。添加导入模块的具体路径。

2025-02-14 01:25:57 919

原创花了一个月，精读了四千多行代码

我花了将近一个月的时间，基本弄懂了大部分源代码，也基本搞清楚了这个随机规划算法的大体思路，我还在源代码中添加了许多注释。但是，但这个源代码中并行计算的部分总是运行错误。总体上，这个源代码体现了开发者对 python 以及 gurobi 的应用相当娴熟与专业，不愧是美国 top 名校的博士。我查了查，作者博士毕业后去了工业界，稍微有点可惜。前段时间无意中从网上找到一个随机规划方法的源代码，这个方法我一直在学，自己也编程实现了。但是看到别人更专业的代码后，发现差距还是不小的。

2025-02-13 21:23:31 213

原创绝对值线性化

前几天在小红书刷到一个帖子，一位网友提供了另外一种巧妙的方式，记录如下。函数中的绝对值线性化有多种方法，包括我之前的。

2025-01-31 21:01:09 821 2

Cplex OPL 使用手册，OPL 编程

Cplex, Ilog, OPL 使用手册，manual

java 调用 Cplex 使用手册

空空如也