- 博客(78)
- 问答 (1)
- 收藏
- 关注
原创 【论文阅读】DepMGNN: Matrixial Graph Neural Network for Video-based Automatic Depression Assessment
抑郁症可以通过人类长期的时空面部行为表现出来。而现实世界中录制的人脸视频长度不定且普遍较长,现有的基于视频的抑郁症评估方法往往会将此类视频重新采样/降采样为较短且长度相等的视频,或者将每个视频分割成若干等长的片段。这些片段级别的时空面部行为会被压缩为向量来用于基于RNN的长期(视频级别)建模。这两种策略都会导致关键信息的丢失和失真。“矩阵式图神经网络”(MGNN),用于基于人脸视频的抑郁症评估。它能够直接且端到端。
2026-02-10 16:52:18
587
原创 Hindsight Experience Replay (HER)复现
本文记录了安装OpenAI Gym环境的踩坑过程,重点解决Python 3.5.2版本兼容、Gym 0.20.0依赖冲突等问题。针对conda环境配置、mujoco_py编译失败等常见错误,提供了添加conda-forge通道、安装GCC开发库等解决方案。同时分享了FetchPush-v1等环境的训练和演示命令,帮助开发者快速搭建强化学习实验环境。适用于Ubuntu/Windows系统,包含从基础环境配置到具体使用示例的全流程指南。
2026-01-29 21:37:01
503
原创 科目一必过知识点整理
(二)驾驶校车、中型以上载客载货汽车、危险物品运输车辆以外的机动车在高速公路、城市快速路以外的道路上行驶超过规定时速**20%-50%**的;(一)驾驶校车、中型以上载客载货汽车、危险物品运输车辆在高速公路、城市快速路以外的道路上行驶超过规定时速**10%-20%**的;(一)驾驶校车、公路客运汽车、旅游客运汽车、7座以上载客汽车以外的其他载客汽车载人超过核定人数**20%-50%**的;(二)驾驶校车、中型以上载客载货汽车、危险物品运输车辆在高速公路、城市快速路以外的道路上行驶超过规定时速。
2026-01-13 16:47:38
777
1
原创 【论文解读】GraspMAS: Zero-Shot Language-driven Grasp Detection with Multi-Agent System
本文提出GraspMAS框架,通过多智能体系统解决语言驱动抓取检测的两大挑战:复杂指令理解不足和环境适应性差。系统包含三个智能体:Planner制定策略,Coder生成执行代码,Observer评估反馈,形成闭环决策。该方法无需额外训练即可实现上下文感知抓取,在模拟和真实环境中验证了有效性。创新点在于利用LLM(GPT-4)实现任务可迁移性,通过多智能体协作提升复杂场景下的决策能力。
2026-01-07 15:21:22
790
原创 拉普拉斯变换详解
本文基于3Blue1Brown的视频,介绍了拉普拉斯变换的数学背景和应用。通过指数函数在复数空间的扩展,解释了复值函数积分的概念,并推导出拉普拉斯变换的定义式。当s为纯虚数时,拉普拉斯变换与傅里叶变换几乎等价。文章还展示了如何用拉普拉斯变换求解微分方程,例如对cos(t)进行变换得到s/(s²+1)的过程。拉普拉斯变换通过解析延拓将函数拓展到更大区域,为解微分方程提供了有力工具。
2025-12-31 12:02:17
1011
原创 【论文解读】Learning from Failure: Improving Meeting Summarization without Good Samples
为了在缺乏优质样本(Good Samples)的情况下改进会议摘要,提出了,一种冷启动调优框架,该框架利用不同程度的坏样本逐步增强摘要生成性能,而无需初始的优质样本。利用asynchronous和numerical的人类反馈来衡量生成摘要的质量。将数据格式化为(转录文本、摘要、评分)三元组,指导预训练模型学习摘要质量与人类评分之间的关联,从而生成对应更高评分的更好摘要。实验结果表明,与现有对齐方法相比,在英语和中文语料库上均能有效提升会议摘要性能,同时需要更少的标注数据和训练资源。此外,还探索了。
2025-12-22 15:39:19
722
原创 【论文解读】Building Real-World Meeting Summarization Systems using Large Language Models
本文研究了利用大型语言模型(LLMs)构建会议摘要系统的实际应用。通过比较GPT-4、GPT-3.5、PaLM-2和LLaMA-2等模型在AMI、ICSI和QMSUM数据集上的表现,发现闭源模型性能更优,但开源模型LLaMA-2在零样本场景下仍具竞争力。研究提出了两种处理长序列的方法:截断法和分章法,并分析了性能与成本、隐私的权衡。结果显示LLaMA-2-7B在工业应用中更具优势,同时指出当前评估存在数据集局限性和指标不足等问题。该研究为实际业务场景中选择合适的会议摘要模型提供了实用参考。
2025-12-06 14:04:13
623
原创 【论文解读】A Comprehensive Survey on Automatic Text Summarization with Exploration of LLM-Based Methods
摘要 自动文本摘要(ATS)技术经历了从统计模型、机器学习到深度学习及大型语言模型(LLM)的演进。早期方法依赖统计特征(如TF-IDF)和规则,而现代LLM通过预训练知识实现抽取式、抽象式和混合式摘要的灵活切换,显著提升了生成质量与连贯性。然而,LLM仍面临幻觉、领域适应性和可解释性等挑战。本文综述了ATS技术发展,提出基于LLM的自动检索算法,并探讨未来优化方向(如提示设计、领域微调)。ATS虽能辅助文献理解,但深度阅读仍是学术能力提升的关键。关键词:ATS、LLM、NLP、文本摘要。
2025-12-04 10:45:40
157
原创 【论文解读】Meeting Summarizer Using Natural Language Processing
本文研究了基于自然语言处理的会议摘要生成技术,主要对比了抽取式(extractive)和抽象式(abstractive)两种方法。抽取式方法通过TF-IDF、TextRank等技术提取关键句子,而抽象式方法则利用语义理解生成新文本。重点介绍了TextRank算法和TF-IDF技术的实现原理,以及GloVe词嵌入在语义捕捉中的应用。研究指出,虽然抽取式方法实现简单,但可能包含冗余信息;抽象式方法能生成更简洁的摘要,但实现难度较大。未来发展方向包括多模态摘要、实时处理、情感分析等增强功能,以及多语言支持和评估体
2025-12-03 22:49:58
956
1
原创 【datawhale】RAG学习笔记
RAG(检索增强生成)技术通过融合信息检索与文本生成,构建了包含索引、检索、生成三大组件的智能系统。该技术利用外部知识库动态更新信息,有效减少大模型幻觉问题,并支持领域专业化应用和本地化数据部署。实现RAG系统需要完成文档准备、索引构建、搜索优化和生成集成四个步骤,可采用LangChain、LlamaIndex等开发框架和Milvus等向量数据库。评估指标聚焦检索相关性及生成答案的准确性与忠实度。该技术为处理动态知识需求提供了高效解决方案。
2025-11-11 21:11:59
590
原创 【datawhale】Agentic AI学习笔记
本质是AI,可以说是可以通过调用不同的agent来实现任务的AI辨析:AI Agent 和 Agentic AI 区别AI Agent本质是Agent,是可以利用AI的agent。FYI:Agent更多是强化学习中的概念,即与环境进行交互,执行action,得到rewards如图(Sapkota et al.),AI Agent接收用户设定的温度值,并自主控制加热或冷却系统以维持目标温度。
2025-11-10 22:55:05
621
原创 【论文解读】THEORY ON MIXTURE-OF-EXPERTS IN CONTINUAL LEARNING
本文研究了混合专家模型(MoE)在持续学习(CL)中的应用,通过理论分析和实验验证探讨MoE如何缓解灾难性遗忘问题。研究提出在线性回归任务中使用门控网络将不同任务分配给多个专家,并分析了门控网络的训练策略:1) 通过多目标损失函数平衡专家负载和任务完成;2) 在足够训练轮次后终止门控网络更新以确保系统收敛。理论贡献包括首次给出MoE在CL中的理论分析、推导预期遗忘和泛化误差的显式表达式。实验部分将线性模型的发现扩展到深度神经网络,验证了理论。结果表明增加专家数量虽能提高性能但会延长收敛时间,且并非总是有效。
2025-11-05 17:48:37
768
原创 排序一次讲清(从冒泡到基数)
如果我们想要让数组从左至右从小到大排序,可以在左边比右边数字大的时候让它们进行交换,只需要重复地进行直到没有再需要交换,这样就可以保证没有左边比右边数字大,即数列已经排序完成。由于每次循环后最大的数字必然在最右边,因为如果有比它小的数字就会进行交换,所以必然在。由于数字会像泡泡一样缓缓冒到顶端,所以就叫冒泡排序。首先由于3>1,所以交换,变成[1,3,2]接着由于3>2,所以交换,变成[1,2,3]接着由于1
2024-07-18 15:49:33
690
原创 Python面经
最早的字符编码标准,使用7位二进制数表示128个字符,包括英文大小写字母、数字和一些特殊符号。由于只支持英文字符,因此不适合表示其他语言。Unicode为了解决ASCII编码的局限性,Unicode提供了一种可以表示世界上几乎所有文字的字符集。是Unicode的一种实现方式,可以根据字符的不同使用不同长度(1-4)的字节来表示一个字符。UTF-8最大的特点是它对ASCII编码是兼容的,即ASCII字符在UTF-8中用一个字节表示,与ASCII编码相同。: 将字符串编码为指定格式的字节串。
2024-07-13 10:53:19
2018
原创 【Selenium配置】WebDriver安装浏览器驱动(Chrome&Edge)
【Selenium配置】WebDriver安装浏览器驱动(Chrome&Edge)
2024-07-06 15:48:40
3650
2
原创 加州驾照笔试准备笔记
文章目录数字错题注意事项参考文档:官方中文文档数字BAC:21岁以下0.01%;其它成人是 0.08%當有車輛向您駛來時,在距離對方車輛 500 英尺內,或,同向行駛的前方車輛距離您不超過 300 呎,將遠光燈調暗為近光燈。當巴士、有軌電車或無軌電車停在安全區或紅綠燈處時限速 10 哩,铁路/没信号灯/盲点/小巷15,商业、住宅等25加州限速65提前100 inch/在高速公路上變換行車線的至少五秒鐘之前打转向灯被尾随/上高速/摩托车的时候,就要和前车保持3秒的距离!其它情况下,只需要2秒
2023-11-07 02:54:09
1091
原创 AI夏令营笔记——任务2
可以将任务看作是一个文本二分类任务。机器需要根据对论文摘要等信息的理解,将论文划分为医学领域的文献和非医学领域的文献两个类别之一。[CLS]就是classification的意思,可以理解为用于下游的分类任务。使用预训练的大语言模型进行建模,在这里使用的是BERT。从论文标题、摘要作者等信息,判断该论文是否属于医学领域的文献。
2023-08-22 23:17:23
321
原创 AI夏令营笔记——任务1
从论文标题、摘要作者等信息,判断该论文是否属于医学领域的文献。可以将任务看作是一个文本二分类任务。机器需要根据对论文摘要等信息的理解,将论文划分为医学领域的文献和非医学领域的文献两个类别之一。
2023-08-18 00:55:29
378
原创 开学趣闻之美食诱惑
小艺酱又开学了,可是在上学的路上总会又各种意想不到的美食诱惑让小艺酱迟到。假设小艺酱家到学校是一个n*n的矩 阵。每个格子包含一个诱惑值p,诱惑着小艺,让她迟到。小艺位于矩阵的左上角,学校在矩阵的右下角落。小艺想知道自己到达学校所要经历的最小诱惑值是?PS:每次只能上下左右走不能斜着走。
2023-03-25 20:29:28
192
原创 L1-086 斯德哥尔摩火车上的题(15)
其中字符串的 + 操作是连接两个字符串的意思。所以这道题其实是让大家访问网站(注意:比赛中千万不要访问这个网址!!!当然,能通过上述算法得到112358的原始字符串a是不唯一的。本题就请你判断,两个给定的原始字符串,能否通过上述算法得到相同的输出?
2023-02-26 15:40:02
427
1
原创 每日一题——L1-085 试试手气(15)
我们知道一个骰子有 6 个面,分别刻了 1 到 6 个点。下面给你 6 个骰子的初始状态,即它们朝上一面的点数,让你一把抓起摇出另一套结果。假设你摇骰子的手段特别精妙,每次摇出的结果都满足以下两个条件:1、每个骰子摇出的点数都跟它之前任何一次出现的点数不同;2、在满足条件 1 的前提下,每次都能让每个骰子得到可能得到的最大点数。那么你应该可以预知自己第 n 次(1≤n≤5)摇出的结果。
2023-02-25 11:38:50
1432
原创 每日一题——L1-078 吉老师的回归(15)
曾经在天梯赛大杀四方的吉老师决定回归天梯赛赛场啦!。众所周知,吉老师的竞赛水平非常高超,你可以认为他每道题目都会做(事实上也是……)。因此,吉老师会按照顺序看题并做题。但吉老师水平太高了,所以签到题他就懒得做了(浪费时间),具体来说,假如题目的字符串里有qiandao或者easy(区分大小写)的话,吉老师看完题目就会跳过这道题目不做。现在给定这次天梯赛总共有几道题目以及吉老师已经做完了几道题目,请你告诉大家吉老师现在正在做哪个题,或者吉老师已经把所有他打算做的题目做完了。
2023-02-24 19:23:25
729
原创 MindSpore安装之避坑指南
我发现许多人(包括我自己)在安装过程中出现了各种各样的问题,而且这些问题在教程中都没有出现,于是我根据自己的踩坑经验总结出了一份安装避坑指南,请往下看。
2023-02-23 16:57:22
1269
原创 每日一题——L1-077 大笨钟的心情(15)
有网友问:未来还会有更多大笨钟题吗?笨钟回复说:看心情……本题就请你替大笨钟写一个程序,根据心情自动输出回答。
2023-02-23 16:26:10
217
原创 每日一题——L1-070 吃火锅(15)
以上图片来自微信朋友圈:这种天气你有什么破事打电话给我基本没用。但是如果你说“吃火锅”,那就厉害了,我们的故事就开始了。本题要求你实现一个程序,自动检查你朋友给你发来的信息里有没有。
2023-02-22 11:33:09
563
原创 每日一题——L1-069 胎压监测(15)
小轿车中有一个系统随时监测四个车轮的胎压,如果四轮胎压不是很平衡,则可能对行车造成严重的影响。让我们把四个车轮 —— 左前轮、右前轮、右后轮、左后轮 —— 顺次编号为 1、2、3、4。本题就请你编写一个监测程序,随时监测四轮的胎压,并给出正确的报警信息。
2023-02-21 22:04:37
1164
原创 每日一题——L1-062 幸运彩票(15)
彩票的号码有 6 位数字,若一张彩票的前 3 位上的数之和等于后 3 位上的数之和,则称这张彩票是幸运的。本题就请你判断给定的彩票是不是幸运的。
2023-02-16 20:03:40
617
原创 每日一题——L1-058 6翻了(15)
“666”是一种网络用语,大概是表示某人很厉害、我们很佩服的意思。最近又衍生出另一个数字“9”,意思是“6翻了”,实在太厉害的意思。如果你以为这就是厉害的最高境界,那就错啦 —— 目前的最高境界是数字“27”,因为这是 3 个 “9”!本题就请你编写程序,将那些过时的、只会用一连串“6666……6”表达仰慕的句子,翻译成最新的高级表达。
2023-02-15 16:07:13
364
原创 每日一题——L1-048 矩阵A乘以B(15)
给定两个矩阵A和B,要求你计算它们的乘积矩阵AB。需要注意的是,只有规模匹配的矩阵才可以相乘。即若A有Ra行、Ca列,B有Rb行、Cb列,则只有Ca与Rb相等时,两个矩阵才能相乘。
2023-02-10 17:08:23
149
原创 每日一题——L1-044 稳赢(15)
大家应该都会玩“锤子剪刀布”的游戏:两人同时给出手势,胜负规则如图所示:现要求你编写一个稳赢不输的程序,根据对方的出招,给出对应的赢招。但是!为了不让对方输得太惨,你需要每隔K次就让一个平局。
2023-02-09 13:18:45
420
原创 每日一题——L1-035 情人节(15)
L1-035 情人节以上是朋友圈中一奇葩贴:“2月14情人节了,我决定造福大家。第2个赞和第14个赞的,我介绍你俩认识…………咱三吃饭…你俩请…”。现给出此贴下点赞的朋友名单,请你找出那两位要请客的倒霉蛋。输入按照点赞的先后顺序给出不知道多少个点赞的人名,每个人名占一行,为不超过10个英文字母的非空单词,以回车结束。一个英文句点.标志输入的结束,这个符号不算在点赞名单里。根据点赞情况在一行中输出结论。
2023-02-08 17:46:02
316
原创 5分钟LaTex快速入门(超简洁全面)
本文摘要介绍了LaTeX常用语法,包括字体样式设置(加粗、斜体等)、文档结构、图片与子图插入方法、表格制作技巧、有序/无序列表创建、数学公式编写(行内/行间公式)、特殊符号输入(空格、数学符号、矩阵等)、超链接添加以及参考文献管理。重点讲解了浮动体环境(figure/table)的参数设置、子图排版、表格对齐方式和矩阵的六种表现形式,并提供了参考文献的引用格式示例。
2023-02-05 23:11:05
1631
1
原创 每日一题——L1-030 一帮一(15)
一帮一学习小组”是中小学中常见的学习组织方式,老师把学习成绩靠前的学生跟学习成绩靠后的学生排在一组。本题就请你编写程序帮助老师自动完成这个分配工作,即在得到全班学生的排名后,在当前尚未分组的学生中,将名次最靠前的学生与名次最靠后的异性学生分为一组。
2023-01-17 18:02:58
177
原创 glove词向量解读
相信小伙伴们在刚开始学习nlp,需要下载glove包的时候总是会疑惑它的命名——glove.nB.XXXd.txt到底是什么意思呢?根据上面的图可以看出每一行是一个词及其词向量表示。第一个为词语,后面为词向量,不过是以离散数字表示。在使用时我们首先需要将后面的数字给转化成向量。
2022-12-07 15:24:44
431
C++实现简易ATM机
2025-12-04
用户态文件系统FUSE
2023-04-24
neo4j localhost连接不上
2022-01-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅