- 博客(57)
- 收藏
- 关注

原创 Deep Reinforcement Learning DRL深度强化学习入门知识笔记
我记录了自己在学习强化学习的过程中的学习进展、相关知识点的笔记以及个人的理解。这些内容可能不完全是专业的解释,但我相信它们对大家掌握深度强化学习会有所帮助。另外,我手写了一些证明过程,虽然字迹不太美观,还请大家多多包涵。学习视频详情见王树森老师:也可参照赵世钰老师:【一张图讲完强化学习原理】 30分钟了解强化学习名词脉络 (youtube.com)这两位老师的讲解都非常出色。记得使用目录来查阅内容。这些资料非常详细、全面,不仅适合预习,还可以作为今后的参考。
2024-08-02 23:40:51
2064
原创 【项目实训项目博客】用户使用手册
PPT生成完毕后,用户在“导出”菜单中选择“导出PPTX”按钮,即可在本地浏览器默认下载路径中导出刚刚生成的PPT。Step3中对话完毕后,用户点击“生成建议案和投放书”,系统响应生成“广告拍摄建议案”和“广告投放建议书”若用户认为生成的大纲需要修改,可以告诉系统希望如何修改,若不需要修改,可直接点击“下一步”按钮。用户点击“开始生成方案”按钮,系统根据用户在Step2中填写的参数,开始对话生成交付物。用户可挑选自己满意的PPT的主题格式,并点击“开始创作”按钮,系统即开始生成PPT。
2025-06-08 23:06:47
305
转载 AP隔离的设备(校园网)相互访问
本校校园网开启了AP隔离,同一个网段,不同楼栋的设备无法互相访问,但是他们都可以访问相同的网关。所以通过设置路由规则让他们可以互相访问。这样,所有的子网设备互相访问都走默认路由,通过网关实现互相访问。
2025-06-07 19:07:09
8
原创 python的numpy的MKL加速
MKL(Math Kernel Library)是由Intel提供的一套高性能数学运算库,它包含了广泛的数学函数和算法,如矩阵乘法、矩阵分解、线性代数运算等。MKL可以充分利用现代处理器的多核和SIMD指令集,从而提高计算速度和效率。通过配置和使用MKL库,你可以显著提升Python中NumPy和SciPy等科学计算库的性能。本文介绍了如何在Python中配置MKL库,并提供了加速计算的一些技巧。通过这些方法,你可以更好地利用你的计算资源,提高工作效率。
2025-06-07 18:59:43
338
原创 git经验
"You have not concluded your merge (MERGE_HEAD exists)"是一个常见的Git错误,表明合并操作尚未完成。根据实际情况,可以选择解决冲突并完成合并、放弃合并操作或继续已部分完成的合并来解决问题。通过遵循最佳实践和预防措施,可以减少此类问题的发生,提高开发效率。无论您是Git新手还是经验丰富的开发者,了解如何处理合并冲突都是必备技能,希望本文能帮助您更好地应对Git合并过程中可能遇到的问题。
2025-05-13 10:59:29
944
原创 后端项目进度汇报
完整的端到端功能流程已成功实现:项目目前已经成功完成了从用户通过便捷提交任务,到后端核心引擎高效处理任务,等待可视化。强大的自动化任务处理能力:基于先进的大型语言模型(LLM)技术和精心设计的多代理协同工作机制,系统具备了处理各种复杂、开放式任务的巨大潜力。综上所述,该后端项目目前已经取得了非常显著的阶段性进展。其核心功能框架和便捷的Web交互层均已成功搭建完成,并且能够良好地协同工作。当前系统已具备较高的基础可用性。
2025-05-07 11:53:07
825
原创 【创新实训项目博客】软件需求规格说明书(SRS)
通过市场调研和不断尝试,优化Prompt设计,明确团队角色分工,让各个agent来扮演团队中的角色,在leader的统筹下进行链式交流,提高协作效率和任务完成质量,最终得到成品。开发一个Web应用。根据用户提供的推广对象、预算金额等信息,智能生成一份满足用户需求的的广告投放建议书,包含对用户投放平台及各平台投放金额比例的建议,为用户的广告投放决策提供有力支持。开发用户前端渲染功能,一个可视化的沙盘模拟系统,展示构建过程的完整日志,包括在广告投放方案制定过程中每个阶段的执行情况、智能体的协作思考过程等。
2025-05-07 10:40:27
784
原创 【创新实训项目博客】prompt设计文档
将市场营销业务流程拆解为6个阶段,遵循“需求分析→数据爬取→广告建议→市场分析→投放策略→PPT生成),形成从需求输入到方案输出的完整数字孪生。通过“用户角色(user_role)”与“助理角色(assistant_role)”的对话机制,模拟真实工作场景中的上下级协作。设计8个精细化分工的角色(如CEO、数据工程师、广告策划师等),每个角色仅处理与其专业强相关的子任务,避免职能重叠。数据流传递:通过变量(如{task}, {ideas})跨阶段传递上下文信息。
2025-05-06 20:30:38
525
原创 【创新实训个人博客】数据库搭建
为了降低模型使用以前训练的数据或者幻觉知识,我们在对话时需要提供相关内容的数据,同时由于需要最新的广告实时数据,实时爬取和版权问题。数据由团队在网上爬取,为了广告内容的有效性,如果长期使用,数据库需要定期几个月更新一次。
2025-04-27 23:27:51
226
原创 【创新实训项目博客】数据库搭建
为了降低模型使用以前训练的数据或者幻觉知识,我们在对话时需要提供相关内容的数据,同时由于需要最新的广告实时数据,实时爬取和版权问题。数据由团队在网上爬取,为了广告内容的有效性,如果长期使用,数据库需要定期几个月更新一次。
2025-04-27 23:26:49
266
原创 【创新实训项目博客】前端实现
调整了头像 (`.avatar`) 和角色名 (`.role`) 的定位。视觉调整: 根据反馈多次增加了聊天容器 (`.container#chat-box`) 及单个消息气泡 (`.message-container`) 的最大宽度 (`max-width`),优化了页面宽度观感。冲突排查: 定位并移除了 `index.html` 内联 `<style>` 中与外部 CSS 冲突的 `margin-right` 规则,最终通过结合 Flexbox 和 `margin: auto` 实现了核心内容的居中。
2025-04-27 23:15:31
309
原创 【创新实训个人博客】multi-agent调研(2)
multi-agent框架的核心还是在agent之间的交互与状态的转移。而LLM对工具的调用往往只是作为其中一个子模块,且大部分agent都只调用单个tool。因此,在multi-agent的场景中,使用多个单tool的agent还是一个多tool的agent,也是一个值得考虑的问题。下面的部分我们将简单介绍现有的三个multi-agent框架,并对它们进行简单的比较。联合浙大和苏黎世联邦理工大学,提供了另外一种支持mutli-agent的设计方案。
2025-04-27 23:07:40
312
原创 【项目实训个人博客】multi-agent调研(1)
LLM通过理解用户的任务,推理出需要调用的工具,并基于调用结果给用户反馈。的涌现,以LLM为中枢构建的Agent系统在近期受到了广泛的关注。Agent系统旨在利用LLM的归纳推理能力,通过为不同的Agent分配。与此同时,也有越来越多的Agent框架开始聚焦于multi-agent场景。为了构建一个multi-agent框架,我们需要思考相比于single-agent,框架中多了哪些组件。目前更常见的框架大多聚焦于single-agent的场景。而在完成任务的过程中,相比于single-agent来说,
2025-04-27 22:25:23
471
原创 【创新实训个人博客】前端实现
核心目标: 对 `visualizer` 的前端界面 (`index.html`, `style.css`) 进行现代化改造。基础样式: 初始化页面整体风格,为 `body` 添加了动态渐变背景;初步调整了页面顶部导航按钮、信息提示块 (`Log Visualizer`) 及底部任务输入区域 (`chat-form`) 的基础样式(颜色、圆角、阴影等)。居中难题: 重点解决了 "Log Visualizer" 文本块和任务输入栏的水平居中问题。期间尝试了 `margin: auto`、调整父容器 `.c
2025-04-17 23:53:23
318
原创 【创新实训个人博客】prompt嵌入
目前的输出,虽然效果还不是很好,但是我们继续设计一下应该会好一些。通过对camel技术的理解,修改了项目内容。修改了typing.py中的定义。能够初步实现广告内容相关的文本。
2025-04-09 23:05:33
836
原创 【项目实训项目博客】prompt初版实践
"作为{assistant_role},为了满足新用户的需求,基于用户的品牌形象和产品特点,使广告拍摄具有创新性,并且具有较高的可实施性,你应该给出一份合理的广告拍摄建议案","作为{assistant_role},为了满足新用户的需求,你应该对市场数据进行仔细的分析,给出可靠的行业趋势分析、评估品牌广告投放的效果,分析不同渠道平台上的品牌表现 "现在,我们都在ChatDev工作,我们有着共同的兴趣,希望通过合作成功完成新客户分配的任务.",我们有着共同的兴趣,即合作成功完成新客户分配的任务.",
2025-04-09 22:58:10
739
1
原创 【创新项目实训个人博客】apifox使用
(老师那边的api不支持并行,有人其他人在用就会卡住,而且一次对话装不下我们这么多的prompt和回复,我们还是用官方api,老师的不能满足我们项目的大prompt需求)可以看到,我使用默认的api网址成功了,本地测试项目是否存在bug可以使用本地api减少开发费用。往其中填入localhost网址,model,prompt。是否启用stream流式输出。apifox提供api接口的测试和使用。是对上次本地deepseekapi的补充。参考ollamaapi文档测试是否可用。
2025-04-07 14:45:00
503
原创 【创新项目实训个人博客】camel学习笔记(2)
1、: 使用连续发送多条用户消息,模拟多轮对话。比如,先询问 CAMEL 的用途,然后再根据回复提出后续问题,看看ChatAgent是否能保持上下文连贯根据结果可以看出,Agent是能够理解之前的对话,并根据之前的聊天内容给出建议。2、: 尝试传入不同图片或使用等参数,观察ChatAgent的回答变化。可以试试让ChatAgent对比两张不同的图片,并描述区别通过实验,设置不同的角色,Agent给出的回答是不一样的,例如:这两种角色定位,给出的答案是不一样的。
2025-04-04 17:45:00
182
原创 【创新项目实训个人博客】deepseek api接入
经历:由于创新实训提供的api太过卡顿,并且技术支持不回消息我们选择使用官方deepseekapi,高并发,无卡顿,比学校提供的好用多了(但是收费。。。
2025-03-30 23:46:24
991
2
原创 powershell7.5.0不支持conda的问题
经历:这周手欠使用vscode的powershell时提示我更新,我就更新了,更新完激活不了conda环境了,查询了半天是powershell最新版7.5.0与目前conda25.1.1以前的版本不支持的问题。问题环境:powershell版本>=7.5.0,conda版本<25.1.1。解决方案:更新conda到25.1.1或更高版本。在cmd命令行以管理员模式启动。
2025-03-29 22:48:26
585
原创 【创新项目实训个人博客】创新实训项目初始化——gitee的使用
Gitee 是一个基于 Git 的代码托管平台,与 GitHub 类似,Gitee 提供了丰富的功能,比如代码仓库的创建、分支管理、代码审查等。
2025-03-17 13:00:00
1114
原创 吐槽强化学习环境稳定性
吐槽一下强化学习环境,调试两三天了,一直以为环境搭错了,哪里没弄好,训练时或者测试时的agent的reward大概只有0-100,保存了训练或者测试的视频发现agent只会刚开始动一下,然后就装死,跑了其他方法又可以用。偶然间修改了一个新的seed就跑起来了,原来一些seed是崩溃的不可用,但是另一种方法在相同seed又是可以的,真玄学。希望有遇到这种问题的人注意一下。
2025-02-17 15:06:22
103
原创 cpu、gpu查看
跟深度学习相关的肯定想查看gpu有关的情况,下面是三种gpu查看方法,非常全面了注意:想要定时刷新以下方法搭配watch方法,例如watch -n 3 nvidia-smi,每隔三秒刷新一次nvidia-smi命令。
2025-02-15 17:41:13
286
原创 Ubuntu服务器设置X11服务
它允许你通过网络将一个图形应用的窗口从远程主机显示到本地。为了实现这一目标,SSH 提供了 X11 转发功能。我们可以通过 ssh -X 或 ssh -Y 命令启用这一功能。当我们在远程服务器上运行需要图形界面的程序时,通常需要使用 SSH 来连接服务器并通过 X11 转发将远程的图形界面显示到本地机器。-Y:启用 X11 转发,并允许不受信的 X11 转发(适用于一些复杂的图形应用)-X:启用 X11 转发,但不允许不受信的 X11 转发。ssh -X -p 端口号 用户名@网址,启用X11转发。
2025-02-14 16:50:10
718
山东大学编译原理实验java版
2025-01-30
山东大学软件学院2022级操作系统课设
2025-03-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人