晓山清-CSDN博客

原创科目四必过手册

驾驶安全要点总结特殊路况处理：冰雪路面利用发动机制动，泥泞路避免刹车和换挡，侧滑时前后轮转向方式相反紧急情况应对：爆胎抢挂低速挡，转向失控连续点刹，暴雨时立即停车特殊车辆规则：校车同向1-2车道需停车等待，进出环岛转向灯使用安全设备要求：随车携带灭火器、安全锤，检查机油需熄火驾驶限制：连续驾驶不超过4小时，休息至少20分钟注意事项：不鸣笛驱赶牲畜，三角巾固定脊柱伤者，正确理解胎压标识（字数：150字）

2026-03-11 15:38:09 201

原创【论文阅读】Multimodal Spatiotemporal Representation for Automatic Depression Level Detection

生理学研究表明，抑郁患者与健康人在言语和面部活动方面存在一些差异。基于这一事实，我们提出了一种新颖的时空注意力（STA）网络和多模态注意力特征融合（MAFF）策略，以获取抑郁线索的多模态表示，用于预测个体抑郁水平。具体而言，我们首先将语音幅度谱/视频分割为固定长度的片段，并将这些片段输入STA网络。该网络不仅通过注意力机制整合空间和时间信息，还强调与抑郁检测相关的音频/视频帧。音频/视频片段级特征从STA网络最后一层全连接层的输出中获得。其次，本文采用特征演化池化。

2026-03-07 16:46:58 395

原创【论文阅读】Learning Personalised Human Internal Cognition from External Expressive Behaviours for RPR

自动真实人格识别（RPR）旨在通过个体的表达行为评估其真实的人格特质。然而，现有大多数解决方案通常作为外部观察者，基于目标个体的表达行为推断观察者对其的人格印象，这与其真实人格存在显著偏差，并且持续导致识别性能欠佳。受真实人格与生成表达行为背后人类内部认知之间关联的启发，我们提出了一种新颖的RPR方法，能够高效地从目标个体易于获取的外部短音频-视频表达行为中模拟人格化的内部认知。所模拟的人格化认知以一组网络权重的形式表示，这些权重促使人格化网络重现个体特定的面部反应；

2026-02-25 21:45:05 585

原创【论文阅读】Benchmark of Deep Learning Models for A-V Apparent and Self-reported Personality Recognition

人格决定了人类日常行为和工作行为的广泛多样性，对于理解人类的内在和外在状态至关重要。近年来，已开发出大量自动人格计算方法，这些方法基于非语言的视听行为来预测受试者的表观人格或自报人格。然而，其中大多数方法都存在复杂的、特定于数据集的预处理步骤和模型训练技巧。由于缺乏具有一致实验设置的标准基准，不仅无法公平比较这些人格计算模型的真实性能，也使得它们难以被复现。

2026-02-25 19:54:56 610

原创【论文阅读】Learning Person-specific Cognition from Facial Reactions for Automatic Personality Recognition

本文提出了一种基于个性化认知模拟的自动人格识别方法，通过目标对象的面部反应推断其真实人格特质。该方法创新性地利用神经架构搜索为每个个体构建独特的CNN模型，模拟其在双人互动中的认知过程。关键贡献包括：(1) 将个性化CNN的架构和权重参数化为图表示；(2) 提出基于Transformer的多维边特征学习策略；(3) 在人类-人和人-机互动场景中验证了方法的优越性。实验结果表明，该方法能有效捕捉与人格特质相关的稳定认知特征，显著优于现有基于行为观察的方法。这项研究为人格识别提供了新的认知建模视角，突破了传统依

2026-02-24 23:08:13 803

原创【论文阅读】Self-supervised Learning of Person-specific Facial Dynamics for APR

本文旨在解决现有自动人格分析系统中频繁出现的两个重要问题：1. 使用短视频片段甚至单帧，而非长期行为来推断人格特质；2. 缺乏对特定个体面部动态进行编码以用于人格识别的方法。为解决这些问题，本文提出了一种新颖的排序损失（Rank Loss）利用面部动作的自然时间演变，而非人格标签，来进行面部动态的自监督学习。我们首先训练一个通用的U-net风格模型从一组未标记的面部视频中学习到通用面部动态。然后，冻结该通用模型，并将一组中间滤波器整合到此架构中。随后，仅使用特定个体的视频继续进行自监督学习。

2026-02-24 16:40:44 850

原创【论文阅读】Spectral Representation of Behaviour Primitives for Depression Analysis

传统的抑郁症临床诊断方法具有主观性、复杂性，且需要临床医生的大量参与。近年来，自动抑郁症分析系统的发展为未来提供了可能，即通过客观、可重复且易于获取的诊断工具来弥补这些不足，从而帮助医疗专业人员开展工作。然而，这类工具的开发仍面临诸多障碍。1.现有的自动抑郁症分析算法基于非常短暂的序列片段进行预测，有时短至一帧。2.现有方法未考虑所测量行为的上下文。本文提出为基于视频的自动抑郁症分析提取多尺度视频级特征。我们提出使用自动检测到的人类行为原语作为每帧的低维描述符。我们还提出了两种新颖的频谱表示方法，即。

2026-02-20 23:45:01 882

原创【论文阅读】DepMGNN: Matrixial Graph Neural Network for Video-based Automatic Depression Assessment

抑郁症可以通过人类长期的时空面部行为表现出来。而现实世界中录制的人脸视频长度不定且普遍较长，现有的基于视频的抑郁症评估方法往往会将此类视频重新采样/降采样为较短且长度相等的视频，或者将每个视频分割成若干等长的片段。这些片段级别的时空面部行为会被压缩为向量来用于基于RNN的长期（视频级别）建模。这两种策略都会导致关键信息的丢失和失真。“矩阵式图神经网络”（MGNN），用于基于人脸视频的抑郁症评估。它能够直接且端到端。

2026-02-10 16:52:18 626

原创 Hindsight Experience Replay (HER)复现

本文记录了安装OpenAI Gym环境的踩坑过程，重点解决Python 3.5.2版本兼容、Gym 0.20.0依赖冲突等问题。针对conda环境配置、mujoco_py编译失败等常见错误，提供了添加conda-forge通道、安装GCC开发库等解决方案。同时分享了FetchPush-v1等环境的训练和演示命令，帮助开发者快速搭建强化学习实验环境。适用于Ubuntu/Windows系统，包含从基础环境配置到具体使用示例的全流程指南。

2026-01-29 21:37:01 685

原创科目一必过知识点整理

（五）驾驶机动车载运爆炸物品、易燃易爆化学物品以及剧毒、放射性等危险物品，未按指定的时间、路线、速度行驶或者未悬挂警示标志并采取必要的安全措施的；（二）驾驶校车、中型以上载客载货汽车、危险物品运输车辆以外的机动车在高速公路、城市快速路以外的道路上行驶超过规定时速。（一）驾驶校车、中型以上载客载货汽车、危险物品运输车辆在高速公路、城市快速路以外的道路上行驶超过规定时速。（二）驾驶校车、中型以上载客载货汽车、危险物品运输车辆在高速公路、城市快速路以外的道路上行驶超过规定时速。

2026-01-13 16:47:38 926 1

原创【论文解读】GraspMAS: Zero-Shot Language-driven Grasp Detection with Multi-Agent System

本文提出GraspMAS框架，通过多智能体系统解决语言驱动抓取检测的两大挑战：复杂指令理解不足和环境适应性差。系统包含三个智能体：Planner制定策略，Coder生成执行代码，Observer评估反馈，形成闭环决策。该方法无需额外训练即可实现上下文感知抓取，在模拟和真实环境中验证了有效性。创新点在于利用LLM（GPT-4）实现任务可迁移性，通过多智能体协作提升复杂场景下的决策能力。

2026-01-07 15:21:22 815

原创拉普拉斯变换详解

本文基于3Blue1Brown的视频，介绍了拉普拉斯变换的数学背景和应用。通过指数函数在复数空间的扩展，解释了复值函数积分的概念，并推导出拉普拉斯变换的定义式。当s为纯虚数时，拉普拉斯变换与傅里叶变换几乎等价。文章还展示了如何用拉普拉斯变换求解微分方程，例如对cos(t)进行变换得到s/(s²+1)的过程。拉普拉斯变换通过解析延拓将函数拓展到更大区域，为解微分方程提供了有力工具。

2025-12-31 12:02:17 1149

原创【论文解读】Learning from Failure: Improving Meeting Summarization without Good Samples

为了在缺乏优质样本（Good Samples）的情况下改进会议摘要，提出了，一种冷启动调优框架，该框架利用不同程度的坏样本逐步增强摘要生成性能，而无需初始的优质样本。利用asynchronous和numerical的人类反馈来衡量生成摘要的质量。将数据格式化为（转录文本、摘要、评分）三元组，指导预训练模型学习摘要质量与人类评分之间的关联，从而生成对应更高评分的更好摘要。实验结果表明，与现有对齐方法相比，在英语和中文语料库上均能有效提升会议摘要性能，同时需要更少的标注数据和训练资源。此外，还探索了。

2025-12-22 15:39:19 742

原创【论文解读】Building Real-World Meeting Summarization Systems using Large Language Models

本文研究了利用大型语言模型(LLMs)构建会议摘要系统的实际应用。通过比较GPT-4、GPT-3.5、PaLM-2和LLaMA-2等模型在AMI、ICSI和QMSUM数据集上的表现，发现闭源模型性能更优，但开源模型LLaMA-2在零样本场景下仍具竞争力。研究提出了两种处理长序列的方法：截断法和分章法，并分析了性能与成本、隐私的权衡。结果显示LLaMA-2-7B在工业应用中更具优势，同时指出当前评估存在数据集局限性和指标不足等问题。该研究为实际业务场景中选择合适的会议摘要模型提供了实用参考。

2025-12-06 14:04:13 672

原创【论文解读】A Comprehensive Survey on Automatic Text Summarization with Exploration of LLM-Based Methods

摘要自动文本摘要（ATS）技术经历了从统计模型、机器学习到深度学习及大型语言模型（LLM）的演进。早期方法依赖统计特征（如TF-IDF）和规则，而现代LLM通过预训练知识实现抽取式、抽象式和混合式摘要的灵活切换，显著提升了生成质量与连贯性。然而，LLM仍面临幻觉、领域适应性和可解释性等挑战。本文综述了ATS技术发展，提出基于LLM的自动检索算法，并探讨未来优化方向（如提示设计、领域微调）。ATS虽能辅助文献理解，但深度阅读仍是学术能力提升的关键。关键词：ATS、LLM、NLP、文本摘要。

2025-12-04 10:45:40 325

原创【论文解读】Meeting Summarizer Using Natural Language Processing

本文研究了基于自然语言处理的会议摘要生成技术，主要对比了抽取式(extractive)和抽象式(abstractive)两种方法。抽取式方法通过TF-IDF、TextRank等技术提取关键句子，而抽象式方法则利用语义理解生成新文本。重点介绍了TextRank算法和TF-IDF技术的实现原理，以及GloVe词嵌入在语义捕捉中的应用。研究指出，虽然抽取式方法实现简单，但可能包含冗余信息；抽象式方法能生成更简洁的摘要，但实现难度较大。未来发展方向包括多模态摘要、实时处理、情感分析等增强功能，以及多语言支持和评估体

2025-12-03 22:49:58 979 1

原创【datawhale】RAG学习笔记

RAG（检索增强生成）技术通过融合信息检索与文本生成，构建了包含索引、检索、生成三大组件的智能系统。该技术利用外部知识库动态更新信息，有效减少大模型幻觉问题，并支持领域专业化应用和本地化数据部署。实现RAG系统需要完成文档准备、索引构建、搜索优化和生成集成四个步骤，可采用LangChain、LlamaIndex等开发框架和Milvus等向量数据库。评估指标聚焦检索相关性及生成答案的准确性与忠实度。该技术为处理动态知识需求提供了高效解决方案。

2025-11-11 21:11:59 622

原创【datawhale】Agentic AI学习笔记

本质是AI，可以说是可以通过调用不同的agent来实现任务的AI辨析：AI Agent 和 Agentic AI 区别AI Agent本质是Agent，是可以利用AI的agent。FYI：Agent更多是强化学习中的概念，即与环境进行交互，执行action，得到rewards如图(Sapkota et al.)，AI Agent接收用户设定的温度值，并自主控制加热或冷却系统以维持目标温度。

2025-11-10 22:55:05 638

原创【论文解读】THEORY ON MIXTURE-OF-EXPERTS IN CONTINUAL LEARNING

本文研究了混合专家模型(MoE)在持续学习(CL)中的应用，通过理论分析和实验验证探讨MoE如何缓解灾难性遗忘问题。研究提出在线性回归任务中使用门控网络将不同任务分配给多个专家，并分析了门控网络的训练策略：1) 通过多目标损失函数平衡专家负载和任务完成；2) 在足够训练轮次后终止门控网络更新以确保系统收敛。理论贡献包括首次给出MoE在CL中的理论分析、推导预期遗忘和泛化误差的显式表达式。实验部分将线性模型的发现扩展到深度神经网络，验证了理论。结果表明增加专家数量虽能提高性能但会延长收敛时间，且并非总是有效。

2025-11-05 17:48:37 791

原创【面经】AI算法面经

等待完成。

2024-08-27 12:59:11 332

原创 PyTorch介绍

PyTorch是一个功能丰富的深度学习框架，它包含了多个模块，每个模块都有其特定的功能和用途。

2024-08-27 12:48:07 498

原创 C++面经

c++面经

2024-07-26 11:35:47 419

原创排序一次讲清（从冒泡到基数）

如果我们想要让数组从左至右从小到大排序，可以在左边比右边数字大的时候让它们进行交换，只需要重复地进行直到没有再需要交换，这样就可以保证没有左边比右边数字大，即数列已经排序完成。由于每次循环后最大的数字必然在最右边，因为如果有比它小的数字就会进行交换，所以必然在。由于数字会像泡泡一样缓缓冒到顶端，所以就叫冒泡排序。首先由于3>1，所以交换，变成[1，3，2]接着由于3>2，所以交换，变成[1，2，3]接着由于1

2024-07-18 15:49:33 699

原创 Python面经

最早的字符编码标准，使用7位二进制数表示128个字符，包括英文大小写字母、数字和一些特殊符号。由于只支持英文字符，因此不适合表示其他语言。Unicode为了解决ASCII编码的局限性，Unicode提供了一种可以表示世界上几乎所有文字的字符集。是Unicode的一种实现方式，可以根据字符的不同使用不同长度(1-4)的字节来表示一个字符。UTF-8最大的特点是它对ASCII编码是兼容的，即ASCII字符在UTF-8中用一个字节表示，与ASCII编码相同。: 将字符串编码为指定格式的字节串。

2024-07-13 10:53:19 2090

原创【Selenium配置】WebDriver安装浏览器驱动（Chrome&Edge）

【Selenium配置】WebDriver安装浏览器驱动（Chrome&Edge）

2024-07-06 15:48:40 3693 2

原创【计科毕业生】求职面经（技术&非技术）

求职面经

2024-06-28 17:47:10 955

原创加州驾照笔试准备笔记

文章目录数字错题注意事项参考文档：官方中文文档数字BAC：21岁以下0.01%；其它成人是 0.08%當有車輛向您駛來時，在距離對方車輛 500 英尺內，或，同向行駛的前方車輛距離您不超過 300 呎，將遠光燈調暗為近光燈。當巴士、有軌電車或無軌電車停在安全區或紅綠燈處時限速 10 哩，铁路/没信号灯/盲点/小巷15，商业、住宅等25加州限速65提前100 inch/在高速公路上變換行車線的至少五秒鐘之前打转向灯被尾随/上高速/摩托车的时候，就要和前车保持3秒的距离！其它情况下，只需要2秒

2023-11-07 02:54:09 1116

原创 AI夏令营笔记——任务2

可以将任务看作是一个文本二分类任务。机器需要根据对论文摘要等信息的理解，将论文划分为医学领域的文献和非医学领域的文献两个类别之一。[CLS]就是classification的意思，可以理解为用于下游的分类任务。使用预训练的大语言模型进行建模，在这里使用的是BERT。从论文标题、摘要作者等信息，判断该论文是否属于医学领域的文献。

2023-08-22 23:17:23 337

原创 AI夏令营笔记——任务1

从论文标题、摘要作者等信息，判断该论文是否属于医学领域的文献。可以将任务看作是一个文本二分类任务。机器需要根据对论文摘要等信息的理解，将论文划分为医学领域的文献和非医学领域的文献两个类别之一。

2023-08-18 00:55:29 394

原创开学趣闻之美食诱惑

小艺酱又开学了，可是在上学的路上总会又各种意想不到的美食诱惑让小艺酱迟到。假设小艺酱家到学校是一个n*n的矩阵。每个格子包含一个诱惑值p，诱惑着小艺，让她迟到。小艺位于矩阵的左上角，学校在矩阵的右下角落。小艺想知道自己到达学校所要经历的最小诱惑值是？PS：每次只能上下左右走不能斜着走。

2023-03-25 20:29:28 196

原创图解如何一步步连接远程服务器——基于VScode

图解如何一步步连接远程服务器——基于VScode

2023-03-19 20:30:05 3489

原创人民币兑换

1元5角钱人民币兑换5分、2分和1分的硬币（每一种都要有）共100枚，会有很多种兑换方案。请编写程序给出各种兑换方案。

2023-02-27 20:05:27 341

原创 L1-086 斯德哥尔摩火车上的题(15)

其中字符串的 + 操作是连接两个字符串的意思。所以这道题其实是让大家访问网站（注意：比赛中千万不要访问这个网址！！！当然，能通过上述算法得到112358的原始字符串a是不唯一的。本题就请你判断，两个给定的原始字符串，能否通过上述算法得到相同的输出？

2023-02-26 15:40:02 433 1

原创每日一题——L1-085 试试手气（15）

我们知道一个骰子有 6 个面，分别刻了 1 到 6 个点。下面给你 6 个骰子的初始状态，即它们朝上一面的点数，让你一把抓起摇出另一套结果。假设你摇骰子的手段特别精妙，每次摇出的结果都满足以下两个条件：1、每个骰子摇出的点数都跟它之前任何一次出现的点数不同；2、在满足条件 1 的前提下，每次都能让每个骰子得到可能得到的最大点数。那么你应该可以预知自己第 n 次（1≤n≤5）摇出的结果。

2023-02-25 11:38:50 1452

原创每日一题——L1-078 吉老师的回归（15）

曾经在天梯赛大杀四方的吉老师决定回归天梯赛赛场啦！。众所周知，吉老师的竞赛水平非常高超，你可以认为他每道题目都会做（事实上也是……）。因此，吉老师会按照顺序看题并做题。但吉老师水平太高了，所以签到题他就懒得做了（浪费时间），具体来说，假如题目的字符串里有qiandao或者easy（区分大小写）的话，吉老师看完题目就会跳过这道题目不做。现在给定这次天梯赛总共有几道题目以及吉老师已经做完了几道题目，请你告诉大家吉老师现在正在做哪个题，或者吉老师已经把所有他打算做的题目做完了。

2023-02-24 19:23:25 755

原创 MindSpore安装之避坑指南

我发现许多人（包括我自己）在安装过程中出现了各种各样的问题，而且这些问题在教程中都没有出现，于是我根据自己的踩坑经验总结出了一份安装避坑指南，请往下看。

2023-02-23 16:57:22 1288

原创每日一题——L1-077 大笨钟的心情(15)

有网友问：未来还会有更多大笨钟题吗？笨钟回复说：看心情……本题就请你替大笨钟写一个程序，根据心情自动输出回答。

2023-02-23 16:26:10 223

原创每日一题——L1-070 吃火锅（15）

以上图片来自微信朋友圈：这种天气你有什么破事打电话给我基本没用。但是如果你说“吃火锅”，那就厉害了，我们的故事就开始了。本题要求你实现一个程序，自动检查你朋友给你发来的信息里有没有。

2023-02-22 11:33:09 569

原创每日一题——L1-069 胎压监测(15)

小轿车中有一个系统随时监测四个车轮的胎压，如果四轮胎压不是很平衡，则可能对行车造成严重的影响。让我们把四个车轮 —— 左前轮、右前轮、右后轮、左后轮 —— 顺次编号为 1、2、3、4。本题就请你编写一个监测程序，随时监测四轮的胎压，并给出正确的报警信息。

2023-02-21 22:04:37 1171

原创每日一题——L1-062 幸运彩票（15）

彩票的号码有 6 位数字，若一张彩票的前 3 位上的数之和等于后 3 位上的数之和，则称这张彩票是幸运的。本题就请你判断给定的彩票是不是幸运的。

2023-02-16 20:03:40 630

C++实现简易ATM机

ATM模拟程序能够完成ATM的主要功能，包括： 1）显示欢迎词及提示信息； 2) 用户插卡，ATM验证用户账号及密码有效性，输入错误3次即被锁卡； 3) 余额查询：初始余额为10000元 4）取款功能：每次取款余额为100的整数倍，有单笔和单日金额限制； 5）转账功能：可将本账户中的存款转入其它账户，转入账户账号需两次输入确认； 6）修改密码：密码为6位数字，新密码需要两次输入确认； 7）退卡。设计实现命令行界面，界面应友好、方便操作。参考界面如图1所示。程序所涉及到的用户资料、银行帐户、存取款记录等信息保存在数据文件中。其中银行账户的格式如下：账号 19位数字姓名身份证 18位字符密码 6位数字余额

2025-12-04

用户态文件系统FUSE

操作课程结课论文要求我们自己实现FUSE，而本文件就是基于c++实现了一个自己的用户态文件系统FUSE，没想到在Linux课上也可以用到，希望可以帮助到有需要的人。

2023-04-24

neo4j localhost连接不上

2022-01-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人