sduwcgg-CSDN博客

原创 Deep Reinforcement Learning DRL深度强化学习入门知识笔记

我记录了自己在学习强化学习的过程中的学习进展、相关知识点的笔记以及个人的理解。这些内容可能不完全是专业的解释，但我相信它们对大家掌握深度强化学习会有所帮助。另外，我手写了一些证明过程，虽然字迹不太美观，还请大家多多包涵。学习视频详情见王树森老师：也可参照赵世钰老师：【一张图讲完强化学习原理】 30分钟了解强化学习名词脉络 (youtube.com)这两位老师的讲解都非常出色。记得使用目录来查阅内容。这些资料非常详细、全面，不仅适合预习，还可以作为今后的参考。

2024-08-02 23:40:51 2064

原创【项目实训项目博客】项目进度基本完成

恭喜，通过不懈努力，我们的项目按照任务书圆满完成，以下是项目总体介绍。

2025-06-09 01:19:53 396

原创【项目实训项目博客】用户使用手册

PPT生成完毕后，用户在“导出”菜单中选择“导出PPTX”按钮，即可在本地浏览器默认下载路径中导出刚刚生成的PPT。Step3中对话完毕后，用户点击“生成建议案和投放书”，系统响应生成“广告拍摄建议案”和“广告投放建议书”若用户认为生成的大纲需要修改，可以告诉系统希望如何修改，若不需要修改，可直接点击“下一步”按钮。用户点击“开始生成方案”按钮，系统根据用户在Step2中填写的参数，开始对话生成交付物。用户可挑选自己满意的PPT的主题格式，并点击“开始创作”按钮，系统即开始生成PPT。

2025-06-08 23:06:47 305

转载 AP隔离的设备（校园网）相互访问

本校校园网开启了AP隔离，同一个网段，不同楼栋的设备无法互相访问，但是他们都可以访问相同的网关。所以通过设置路由规则让他们可以互相访问。这样，所有的子网设备互相访问都走默认路由，通过网关实现互相访问。

2025-06-07 19:07:09 8

原创 python的numpy的MKL加速

MKL（Math Kernel Library）是由Intel提供的一套高性能数学运算库，它包含了广泛的数学函数和算法，如矩阵乘法、矩阵分解、线性代数运算等。MKL可以充分利用现代处理器的多核和SIMD指令集，从而提高计算速度和效率。通过配置和使用MKL库，你可以显著提升Python中NumPy和SciPy等科学计算库的性能。本文介绍了如何在Python中配置MKL库，并提供了加速计算的一些技巧。通过这些方法，你可以更好地利用你的计算资源，提高工作效率。

2025-06-07 18:59:43 338

原创占坑占坑占坑占坑

占坑占坑占坑占坑。

2025-06-05 21:58:45 78

原创【创新实训个人博客】实现了新的前端界面

我们的项目还需要ppt展示和文案展示。实现了新的html页面。

2025-06-01 13:12:38 183

原创 CARLA0.9.6环境复现

上半部分用conda的还是conda，下面pip自己手动安装，实现来自cnsn的安装包。要下载carla包并替换。

2025-05-28 00:20:03 689

原创【项目实训个人博客】ppt接口集成

111。

2025-05-19 00:11:05 72

原创网页加载缺少静态文件

如果你的静态文件反复对比没有缺失，并且代码完全相同，但是网页有些部分没法运行，在运行网页后，按住。强制刷新后会有奇效，

2025-05-13 23:38:14 72

原创 git经验

"You have not concluded your merge (MERGE_HEAD exists)"是一个常见的Git错误，表明合并操作尚未完成。根据实际情况，可以选择解决冲突并完成合并、放弃合并操作或继续已部分完成的合并来解决问题。通过遵循最佳实践和预防措施，可以减少此类问题的发生，提高开发效率。无论您是Git新手还是经验丰富的开发者，了解如何处理合并冲突都是必备技能，希望本文能帮助您更好地应对Git合并过程中可能遇到的问题。

2025-05-13 10:59:29 944

原创【项目实训个人博客】数据库解决幻觉问题完成

数据库占坑。

2025-05-10 20:56:55 96

原创后端项目进度汇报

完整的端到端功能流程已成功实现：项目目前已经成功完成了从用户通过便捷提交任务，到后端核心引擎高效处理任务，等待可视化。强大的自动化任务处理能力：基于先进的大型语言模型（LLM）技术和精心设计的多代理协同工作机制，系统具备了处理各种复杂、开放式任务的巨大潜力。综上所述，该后端项目目前已经取得了非常显著的阶段性进展。其核心功能框架和便捷的Web交互层均已成功搭建完成，并且能够良好地协同工作。当前系统已具备较高的基础可用性。

2025-05-07 11:53:07 825

原创 AI程序员认证

进入datawhale官网。

2025-05-07 11:22:15 123

原创【创新实训项目博客】软件需求规格说明书（SRS）

通过市场调研和不断尝试，优化Prompt设计，明确团队角色分工，让各个agent来扮演团队中的角色，在leader的统筹下进行链式交流，提高协作效率和任务完成质量，最终得到成品。开发一个Web应用。根据用户提供的推广对象、预算金额等信息，智能生成一份满足用户需求的的广告投放建议书，包含对用户投放平台及各平台投放金额比例的建议，为用户的广告投放决策提供有力支持。开发用户前端渲染功能，一个可视化的沙盘模拟系统，展示构建过程的完整日志，包括在广告投放方案制定过程中每个阶段的执行情况、智能体的协作思考过程等。

2025-05-07 10:40:27 784

原创【创新实训项目博客】prompt设计文档

将市场营销业务流程拆解为6个阶段，遵循“需求分析→数据爬取→广告建议→市场分析→投放策略→PPT生成），形成从需求输入到方案输出的完整数字孪生。通过“用户角色（user_role）”与“助理角色（assistant_role）”的对话机制，模拟真实工作场景中的上下级协作。设计8个精细化分工的角色（如CEO、数据工程师、广告策划师等），每个角色仅处理与其专业强相关的子任务，避免职能重叠。数据流传递：通过变量（如{task}, {ideas}）跨阶段传递上下文信息。

2025-05-06 20:30:38 525

原创【创新实训个人博客】数据库搭建

为了降低模型使用以前训练的数据或者幻觉知识，我们在对话时需要提供相关内容的数据，同时由于需要最新的广告实时数据，实时爬取和版权问题。数据由团队在网上爬取，为了广告内容的有效性，如果长期使用，数据库需要定期几个月更新一次。

2025-04-27 23:27:51 226

原创【创新实训项目博客】数据库搭建

2025-04-27 23:26:49 266

原创【创新实训项目博客】前端实现

调整了头像 (`.avatar`) 和角色名 (`.role`) 的定位。视觉调整: 根据反馈多次增加了聊天容器 (`.container#chat-box`) 及单个消息气泡 (`.message-container`) 的最大宽度 (`max-width`)，优化了页面宽度观感。冲突排查: 定位并移除了 `index.html` 内联 `<style>` 中与外部 CSS 冲突的 `margin-right` 规则，最终通过结合 Flexbox 和 `margin: auto` 实现了核心内容的居中。

2025-04-27 23:15:31 309

原创【创新实训个人博客】multi-agent调研（2）

multi-agent框架的核心还是在agent之间的交互与状态的转移。而LLM对工具的调用往往只是作为其中一个子模块，且大部分agent都只调用单个tool。因此，在multi-agent的场景中，使用多个单tool的agent还是一个多tool的agent，也是一个值得考虑的问题。下面的部分我们将简单介绍现有的三个multi-agent框架，并对它们进行简单的比较。联合浙大和苏黎世联邦理工大学，提供了另外一种支持mutli-agent的设计方案。

2025-04-27 23:07:40 312

原创【项目实训个人博客】multi-agent调研（1）

LLM通过理解用户的任务，推理出需要调用的工具，并基于调用结果给用户反馈。的涌现，以LLM为中枢构建的Agent系统在近期受到了广泛的关注。Agent系统旨在利用LLM的归纳推理能力，通过为不同的Agent分配。与此同时，也有越来越多的Agent框架开始聚焦于multi-agent场景。为了构建一个multi-agent框架，我们需要思考相比于single-agent，框架中多了哪些组件。目前更常见的框架大多聚焦于single-agent的场景。而在完成任务的过程中，相比于single-agent来说，

2025-04-27 22:25:23 471

原创 kaggle配置

kaggle数据集下载

2025-04-25 16:17:22 268

原创【项目实训个人博客】数据集搜集

这一版方案存在数据加载量过大导致网页崩溃的问题，还得优化。

2025-04-20 17:09:49 916

原创【创新实训个人博客】前端实现

核心目标: 对 `visualizer` 的前端界面 (`index.html`, `style.css`) 进行现代化改造。基础样式：初始化页面整体风格，为 `body` 添加了动态渐变背景；初步调整了页面顶部导航按钮、信息提示块 (`Log Visualizer`) 及底部任务输入区域 (`chat-form`) 的基础样式（颜色、圆角、阴影等）。居中难题: 重点解决了 "Log Visualizer" 文本块和任务输入栏的水平居中问题。期间尝试了 `margin: auto`、调整父容器 `.c

2025-04-17 23:53:23 318

原创【创新实训个人博客】prompt嵌入

目前的输出，虽然效果还不是很好，但是我们继续设计一下应该会好一些。通过对camel技术的理解，修改了项目内容。修改了typing.py中的定义。能够初步实现广告内容相关的文本。

2025-04-09 23:05:33 836

原创【项目实训项目博客】prompt初版实践

"作为{assistant_role},为了满足新用户的需求,基于用户的品牌形象和产品特点,使广告拍摄具有创新性,并且具有较高的可实施性,你应该给出一份合理的广告拍摄建议案","作为{assistant_role},为了满足新用户的需求,你应该对市场数据进行仔细的分析,给出可靠的行业趋势分析、评估品牌广告投放的效果,分析不同渠道平台上的品牌表现 "现在,我们都在ChatDev工作,我们有着共同的兴趣,希望通过合作成功完成新客户分配的任务.",我们有着共同的兴趣,即合作成功完成新客户分配的任务.",

2025-04-09 22:58:10 739 1

原创【创新项目实训个人博客】apifox使用

（老师那边的api不支持并行，有人其他人在用就会卡住，而且一次对话装不下我们这么多的prompt和回复，我们还是用官方api，老师的不能满足我们项目的大prompt需求）可以看到，我使用默认的api网址成功了，本地测试项目是否存在bug可以使用本地api减少开发费用。往其中填入localhost网址，model，prompt。是否启用stream流式输出。apifox提供api接口的测试和使用。是对上次本地deepseekapi的补充。参考ollamaapi文档测试是否可用。

2025-04-07 14:45:00 503

原创【创新项目实训个人博客】camel学习笔记（2）

1、：使用连续发送多条用户消息，模拟多轮对话。比如，先询问 CAMEL 的用途，然后再根据回复提出后续问题，看看ChatAgent是否能保持上下文连贯根据结果可以看出，Agent是能够理解之前的对话，并根据之前的聊天内容给出建议。2、：尝试传入不同图片或使用等参数，观察ChatAgent的回答变化。可以试试让ChatAgent对比两张不同的图片，并描述区别通过实验，设置不同的角色，Agent给出的回答是不一样的，例如：这两种角色定位，给出的答案是不一样的。

2025-04-04 17:45:00 182

原创山东大学《多核平台下的并行计算》实验笔记

每年的题目都不一样，2022级实验随手笔记。

2025-04-03 00:05:21 1011

原创【创新实训项目博客】后端进度

后端

2025-04-02 14:42:10 350

原创【创新项目实训个人博客】camel学习笔记（1）camel介绍

我们的项目基于camel开源框架，以下是对camel的笔记camel介绍。

2025-04-01 18:06:26 408

原创【创新项目实训个人博客】deepseek api接入

经历：由于创新实训提供的api太过卡顿，并且技术支持不回消息我们选择使用官方deepseekapi，高并发，无卡顿，比学校提供的好用多了（但是收费。。。

2025-03-30 23:46:24 991 2

原创 powershell7.5.0不支持conda的问题

经历：这周手欠使用vscode的powershell时提示我更新，我就更新了，更新完激活不了conda环境了，查询了半天是powershell最新版7.5.0与目前conda25.1.1以前的版本不支持的问题。问题环境：powershell版本>=7.5.0，conda版本<25.1.1。解决方案：更新conda到25.1.1或更高版本。在cmd命令行以管理员模式启动。

2025-03-29 22:48:26 585

原创【创新项目实训个人博客】创新实训项目初始化——gitee的使用

Gitee 是一个基于 Git 的代码托管平台，与 GitHub 类似，Gitee 提供了丰富的功能，比如代码仓库的创建、分支管理、代码审查等。

2025-03-17 13:00:00 1114

原创【创新实训】个人博客

test。

2025-03-06 22:42:56 110

原创【创新实训项目博客】项目总览暨创新实训任务书

项目总览暨创新实训任务书

2025-03-06 22:34:50 199

原创吐槽强化学习环境稳定性

吐槽一下强化学习环境，调试两三天了，一直以为环境搭错了，哪里没弄好，训练时或者测试时的agent的reward大概只有0-100，保存了训练或者测试的视频发现agent只会刚开始动一下，然后就装死，跑了其他方法又可以用。偶然间修改了一个新的seed就跑起来了，原来一些seed是崩溃的不可用，但是另一种方法在相同seed又是可以的，真玄学。希望有遇到这种问题的人注意一下。

2025-02-17 15:06:22 103

原创 cpu、gpu查看

跟深度学习相关的肯定想查看gpu有关的情况，下面是三种gpu查看方法，非常全面了注意：想要定时刷新以下方法搭配watch方法，例如watch -n 3 nvidia-smi，每隔三秒刷新一次nvidia-smi命令。

2025-02-15 17:41:13 286

原创 Ubuntu服务器设置X11服务

它允许你通过网络将一个图形应用的窗口从远程主机显示到本地。为了实现这一目标，SSH 提供了 X11 转发功能。我们可以通过 ssh -X 或 ssh -Y 命令启用这一功能。当我们在远程服务器上运行需要图形界面的程序时，通常需要使用 SSH 来连接服务器并通过 X11 转发将远程的图形界面显示到本地机器。-Y：启用 X11 转发，并允许不受信的 X11 转发（适用于一些复杂的图形应用）-X：启用 X11 转发，但不允许不受信的 X11 转发。ssh -X -p 端口号用户名@网址，启用X11转发。

2025-02-14 16:50:10 718

原创 latex管理

导入论文标准格式后，上面的就不需要了。老师推荐的论文网站，真香。什么也没有时用上面这种。

2025-02-13 22:26:38 167

山东大学软件学院2022级数据库实验

参考参考，满分实验，实验每年变化不大

2025-03-24

山东大学软件学院2022级数据库课设-二手交易系统

仅供参考

2025-03-24

山东大学软件学院数据结构往年题

13-20年，不全，整理资料看到的

2025-03-24

山东省物理竞赛往年题目

2025-03-24

山东大学软件学院2022级软件工程课设

山东大学软件工程22级课设，一个火车票售票系统

2025-03-24

山东大学软件学院22级近代史存档

2025-03-24

山东大学暑期课程齐鲁交通学院数字图像处理

数字图像处理的大作业，存个档

2025-03-16

山东大学软件学院众智实验

山东大学软件学院众智实验，个人实现。

2025-03-16

山东大学软件学院思想道德与法治报告

存个档

2025-03-16

山东大学软件学院中华优秀传统文化英文解读小组作业

存个档

2025-03-16

山东大学软件学院2022级认识实习报告

每年应该都不一样仅供参考，最终成绩为A。记得一定要在ddl之前交。

2025-03-16

山东大学软件学院新生研讨水课报告

借鉴借鉴，水课抄抄改改就过去了

2025-03-16

山东大学编译原理实验java版

今年yzk老师班级的题目是把python编译器（linux下）改成其他语言的，和别的班级题目不一样，我提供一下我写的java版本（windows下），存在一些bug，只能跑一些示例。这个实验分应该是拉满了的需要完善的地方有： 1.语法分析的可以在上面附加一些判断条件 2.中间代码生成部分存在某些问题，你run了之后就知道了，我记得有注释掉那句话让他暂时能跑通一些代码，想要达到完美肯定是还要改的其他学长学姐应该是提供的c++版本，可以去参考下

2025-01-30