技术宅学长-CSDN博客

原创使用PyTorch进行图像风格迁移：基于VGG19实现

本文展示了如何使用PyTorch和VGG19模型实现图像风格迁移。通过合理设置内容和风格损失的权重，我们可以生成既保留内容图像结构又具有风格图像艺术风格的全新图像。

2024-09-14 17:54:33 4257 6

原创硕士该去算法岗还是开发岗？

最近很多学弟问我这个问题，他是某985硕士，想去算法，但是又没有很好的论文和实习。走开发又不甘心自己堂堂985硕士去做开发，那岂不是就是和本科大专一样了。这里我说一下我对算法岗和开发岗的理解。

2024-09-13 13:06:34 2367

原创深度学习中常见的损失函数

不同的损失函数适用于不同的任务，回归任务中通常使用均方误差（MSE）和绝对误差（MAE），分类任务中使用交叉熵损失，物体检测和分割中使用IoU和Dice损失，而生成模型中使用对抗损失和重构损失。根据具体任务的特点选择合适的损失函数对于模型的性能有很大影响。

2024-09-12 11:12:51 1534

原创 Pycharm Remote Development 报错解决

实测解决方法，1更新本地ide到最新的专业版本，2删除所有远程服务器上安装的历史版本的client，重新安装最新版本，3 使用 ps aux | grep pycharm命令检查后台运行的pycharm程序，kill掉所有pycharm程序后，重新打开项目即可解决报错问题。如果依然有问题，建议检查网络连接是否稳定，远程主机的资源（如 CPU、内存）是否充足。这个错误通常与 PyCharm 在使用 Remote Development 功能时，远程主机上的 IDE 后端进程进入了无效状态有关。

2024-09-10 10:05:26 2176

原创基于PyTorch分布式训练的实现与优化（以CIFAR-10为例）

本文展示了如何在PyTorch框架下使用模块进行分布式训练。通过此技术，可以有效地利用多个GPU资源，加速大规模数据集上的模型训练。希望本文能帮助读者更好地理解和应用PyTorch的分布式训练技术。

2024-09-05 15:58:19 991 1

原创三子棋、井字棋 -python版本代码-C语言版本代码

三子棋是一种民间传统游戏，又叫九宫棋、圈圈叉叉棋、一条龙、井字棋等。游戏分为双方对战，双方依次在9宫格棋盘上摆放棋子，率先将自己的三个棋子走成一条线就视为胜利，而对方就算输了，但是三子棋在很多时候会出现和棋的局面。开始游戏后，我们需要将棋盘打印出来。（2）设置先落子玩家或者电脑。一、三子棋的大体思路。

2024-07-29 14:21:32 2367

原创 MLU370配置环境以及算子转换流程

在MLU370上运行程序，需要把项目代码算子转化一下，算子转换的代码如下。

2024-04-18 20:13:19 926 7

原创 LLM大模型可视化-以nano-gpt为例

nano-gpt欢迎来到 GPT 大型语言模型的演练！在这里，我们将探索只有 85,000 个参数的 nano-gpt 模型。它的目标很简单：取六个字母的序列：CBABBC并按字母顺序排序，即“ABBBCC”。tokenvocabulary我们将这些字母中的每一个称为标记，模型的不同标记集构成了它的词汇表：token 令牌ABCindex 索引012在此表中，每个令牌都分配了一个数字，即其令牌索引。现在我们可以将这个数字序列输入到模型中：210。

2024-03-31 17:28:19 3347 2

原创 Forecast-MAE: Self-supervised Pre-training for Motion Forecasting with Masked Autoencoders 论文翻译

*摘要：**本研究探索了自监督学习（SSL）应用于运动预测任务的可能性，尽管SSL在计算机视觉和自然语言处理领域已取得广泛成功，但其在运动预测领域的探索仍相对有限。为填补这一空白，我们引入了Forecast-MAE，这是一个针对运动预测任务特别设计的掩码自动编码器框架的扩展。我们的方法包括一种新颖的遮蔽策略，利用代理轨迹与道路网络之间的强联系，通过互补遮蔽代理的未来或历史轨迹以及随机遮蔽车道段来实现。

2024-03-25 14:36:31 1079

原创文生视频模型调研

文生视频只有OpenAI的Sora，其他的（）都是动图。OpenAI发布了可以生成60s视频的Sora模型。刚刚发布的google的就一下子变得无人问津了，太尴尬了。

2024-02-21 18:22:10 1233

原创 forecast-mae调试代码报错记录2个：

微调命令python3 train.py data_root=/path/to/data_root model=model_forecast gpus=4 batch_size=32 monitor=val_minFDE 'pretrained_weights="/path/to/pretrain_ckpt"'中的两个错误。

2024-02-07 15:54:13 857

原创 python从excel中读取数据，并将文字标签转换为数字

【代码】python从excel中读取数据，并将文字标签转换为数字。

2024-01-30 11:44:30 831

原创在MLU370上保存模型、读取模型时候报错

原因是保存时候，model在mlu或者cuda上，需要先将模型移动到cpu设备上。报错代码在torch.load(函数中)检查了mlu的device正常。

2024-01-29 17:47:15 385

原创基于BERT的文本分类——附-简单的示例代码

*BERT（Bidirectional Encoder Representations from Transformers）**是一种预训练的自然语言处理模型，由Google于2018年提出。BERT通过在大规模文本语料上进行预训练，学习了深层次的语言表示，然后可以通过微调用于各种下游任务，包括文本分类。文本分类是一个常见的自然语言处理任务，它涉及将文本分为不同的类别或标签。

2024-01-29 17:14:50 4657 5

原创 Intel NUC x15电池独立显卡功耗异常解决办法

作为一个强迫症用户，随便禁用未知的服务怎么能忍，于是乎继续查找资料，终于在Intel官方社区找到了比较完美的解决办法，参考 Solved: X15 Battery life extremely impacted by GeForce/Nvidia Experience - Intel Communities。使用内置电池，内置屏幕，不开启使用独立显卡的软件时，开启Windows节电模式，系统预测的续航时间一直在3小时左右，且C面出风口发热明显，而且设备管理器中禁用独立显卡也没有任何效果。

2024-01-24 01:49:41 1623

原创在PyCharm中安装GitHub Copilot插件，login之后报出如下错误：

设置网址：https://github.com/settings/copilot，已设置为允许或者：在https://plugins.jetbrains.com/plugin/17718-github-copilot/versions/stable安装对应版本本文重点介绍挂了tz开全局代理后依然遇到该问题的解决方法。

2024-01-23 11:58:52 3492

原创 pycharm学生认证免费使用专业版

最后申请，等待大概一到两周，正常情况下，你的邮箱就会收到认证通过的邮件。如果失败，请检查一下是不是填写有问题。再试一试，或者去学院开一份英文的在读证明（这个网上找模板），盖上学院公章。按照要求填写，但是如果遇到这个提示，恭喜你，你的学校获得了美国商务部认证。按照要求填写，上传学生证照片，以及学信网在线报告验证码。遇到这个不要慌，我们点官方文件，进入pycharm官网。

2024-01-16 23:20:54 2511

原创 mathglm代码调试记录

mpu.broadcast_data(keys, data, datatype) 是一个函数调用，它来自于 SwissArmyTransformer 库中的 mpu 模块。模型需要的是一种数值表示，通常是词向量，这样才能进行数学运算。因此，原始的字符串数据需要被转换为词向量。中的数据是字符串，因为这是原始的输入数据。然后，这些数据被转换为词向量，以便可以被模型处理。模型接收的输入是词向量，而不是原始的字符串。函数，这个函数用于处理每一行数据，将其转换为词向量。列表中，最后返回一个包含词向量的字典。

2024-01-11 12:02:15 635

原创如何在pycharm中调试deepspeed

deepspeed的程序都需要使用deepspeed来启动训练。直接运行.py文件会报错，这个时候要是pycharm能直接debug deepspeed 就好了。

2024-01-10 10:57:13 2988 13

原创 AssertionError: DeepSpeed backend not set, please initialize it using init_process_group()

百度google无解决办法，遂问GPT，gpt回答的也不行，会报错：看起来你的脚本在初始化DeepSpeed后端时出现了问题。DeepSpeed是一个用于在分布式系统上优化大型模型训练的库。错误消息表明DeepSpeed后端未设置，并建议使用进行初始化。：确保你在脚本中正确地初始化了DeepSpeed。查找函数，并确保在任何其他DeepSpeed相关函数之前调用它。看起来脚本缺少这个初始化步骤。例如： ```python import deepspeed。

2024-01-10 10:09:02 2299

原创 ModuleNotFoundError: No module named ‘SwissArmyTransformer‘

这是因为新版的SwissArmyTransformer中，目录改为了sat，在引用时候需要对应改为sat。但是，安装之后却还是提示，屏幕上依然标红。小问题，直接pip install。

2024-01-09 16:33:56 735

原创 RuntimeError: DataLoader worker (pid 29911) is killed by signal: Terminated.

t这个错误通常是由于在使用 PyTorch 的 DataLoader 时，数据加载的工作进程（worker）被系统终止而引起的。请注意，上述方法中的每一步都可能是解决问题的一部分，具体取决于你的系统和数据集的特定情况。：查看系统日志以获取更多关于进程终止的信息，这可能有助于确定问题的根本原因。：如果可能的话，增加系统内存，这可以通过更换更强大的硬件或者在云平台上使用更大的实例来实现。参数，即减少并行加载的工作进程数量。：确保你使用的是最新版本的 PyTorch，因为某些问题可能已经在后续版本中修复。

2024-01-08 17:20:38 1613

原创 pycharm远程开发调试（remote development）踩坑记录2

pycharm 3.0之后，无法remote development的解决办法。

2024-01-04 18:06:43 7003 11

原创 The Annotated Transformer的中文教程

在过去的五年里，Transformer 一直是很多人关注的焦点。这篇文章以逐行实现的形式呈现了论文的带注释版本。它重新排序并删除了原始论文中的一些部分，并在全文中添加了评论。本文档本身是一个notebook ，并且应该是一个完全可用的实现。代码可以在这里找到。

2023-12-14 17:04:42 970

原创 Argoverse2数据集的导入

模型的任务是预测每个场景中scored actors的未来运动，并提供跟踪历史，捕捉目标的位置、航向、速度和类别。在所有三个数据集中，每个场景都包含自己的高精地图，带有3D车道和人行横道几何形状--来自六个不同城市的数据。本文相信这些数据集将以现有数据集无法支持的方式支持新的和现有的机器学习研究问题。序列包含26个目标类别的三维长方体标注，所有这些标注都是充分采样的，以支持训练和三维感知模型的评估。该数据集是有史以来最大的激光雷达传感器数据集合，支持自监督学习和新兴的点云预测任务。

2023-12-07 13:42:21 2772

原创踩坑记录 ValueError: You selected an invalid strategy name: `strategy=None`.

在使用PyTorch Lightning时，你需要选择一个有效的分布式训练策略。你遇到的错误与PyTorch Lightning的分布式训练策略有关。你可以在PyTorch Lightning文档中找到完整的选项列表。错误消息建议一些示例，如。

2023-12-06 09:25:36 2658 2

原创【踩坑记录】apex包的安装

相关问题：上GitHub进入https://github.com/NVIDIA/apex/issues/1679看别人如何解决试出来，亲测有效，常见问题上面都有！比如你调试的代码的torch版本1.13，cuda版本11.7，就可以选择22.05-dev，下载解压到你的文件目录下。(可以一次多下几个版本，多尝试不同版本)nvidia的apex更新很频繁，所以在调试老代码的时候就会存在版本问题或者兼容问题或者压根安装不上的问题。执行即可，安装过程较慢，耐心等待，如果失败，建议从最新版本往早期版本尝试。

2023-12-05 17:36:20 3334 3

原创【踩坑记录】from natten import NeighborhoodAttention1D

/forecast-mae/src/model/layers/agent_embedding.py文件中。Natten是对PyTorch的扩展，它通过高效的CUDA内核提供了第一个快速滑动窗口关注。解决办法，默认安装的是__version__ = "0.14.2"版本的。解决办法：可以重新安装，可以由低到高版本尝试，重装natten。它提供邻里关注(局部关注)和扩展邻里关注(稀疏全局关注，也称为。扩大了本地关注度)作为一维和二维数据的PyTorch模块。在配置forecast-mae环境的时候。

2023-12-05 17:15:45 4311 8

原创 2023.8-(ICCV)Forecast-MAE- Self-supervised Pre-training for Motion Forecasting with Masked Autoencod

研究聚焦于应用于运动预测的自监督学习（SSL），尽管SSL在其他领域取得了成功，但在运动预测方面尚未得到广泛探索。介绍了Forecast-MAE，这是一种适用于运动预测SSL的蒙版自编码器的改进。该方法包括一种新颖的掩码策略，将代理的轨迹与道路网络联系起来，显著提高了在Argoverse 2运动预测基准测试上的性能。

2023-11-17 00:05:48 342

原创 [GPT读论文]LANGUAGEMPC: LARGE LANGUAGE MODELS AS DECISION MAKERS FOR AUTONOMOUS DRIVING

这篇论文的标题是《LanguageMPC: 使用大型语言模型作为自动驾驶决策制定者》，它提出了一种新的方法，使用大型语言模型（LLMs）作为自动驾驶（AD）系统中的决策制定组件，特别是在需要人类常识理解的复杂驾驶场景中【63†source】。

2023-11-16 23:51:17 443 1

原创 SurrealDriver: Designing Generative Driver Agent Simulation Framework in Urban Contexts based on Lar

框架概述：SurrealDriver 是一个仿真框架，利用 LLMs 模拟复杂的交通场景和真实的驾驶操作。独特特点：包括一个由 24 名驾驶员的访谈信息指导的 ‘教练代理’ 模块，帮助开发类人的驾驶风格。结果：完整框架显著降低了 81.04% 的碰撞率，并将人类相似度提高了 50%，标志着使用 LLMs 在城市环境中进行驾驶员代理仿真的先驱努力【36†source】。

2023-11-16 23:34:06 282

原创 Talk2BEV: Language-enhanced Bird’s-eye View Maps for Autonomous Driving

主题：Talk2BEV是一种结合了最新的大型语言模型（LLMs）和大型视觉-语言模型（LVLMs）的系统，用于增强自动驾驶（AD）系统中的鸟瞰图（BEV）。目标：通过语言增强的BEV地图，Talk2BEV旨在提供全面的场景理解和推理，以应对各种道路情境。特点：系统不需要针对BEV的特定训练或微调，能够处理多种用户查询，包括自由形式文本查询、多项选择题和空间推理查询。

2023-11-16 23:19:56 510

原创 TrafficGPT: Viewing, Processing, and Interacting with Traffic Foundation Models

为了弥补这一差距，论文介绍了TrafficGPT，这是一个将ChatGPT与交通基础模型融合的系统。该系统的主要改进包括：使ChatGPT能够查看、分析、处理交通数据，并为城市交通系统管理提供有见地的决策支持；促进对广泛而复杂任务的智能分解，以及通过逐步利用交通基础模型逐步完成这些任务；通过自然语言对话辅助交通控制中的人类决策；以及实现互动反馈和修改结果的请求。

2023-11-16 23:14:04 1161

原创【论文阅读】LANGUAGEMPC: LARGE LANGUAGE MODELS AS DECISION MAKERS FOR AUTONOMOUS DRIVING

现有的基于学习的自动驾驶(AD)系统在理解高级信息、泛化到罕见事件以及提供可解释性方面面临挑战。为了解决这些问题，这项工作采用大型语言模型(llm)作为需要人类常识理解的复杂AD场景的决策组件。我们设计了认知途径来实现LLM的综合推理，并开发了将LLM决策转化为可操作的驾驶命令的算法。通过这种方法，LLM决策通过引导参数矩阵自适应与底层控制器无缝集成。大量的实验表明，由于LLM的常识推理能力，我们提出的方法不仅在单车辆任务中始终优于基线方法，而且还有助于处理复杂的驾驶行为，甚至多车辆协调。

2023-11-13 17:42:45 717

原创【论文阅读】Drive Like a Human: Rethinking Autonomous Driving with Large Language Models

在本文中，我们探索了使用大语言模型(LLM)来以类似于人类的方式理解驾驶环境的潜力，并分析了它在面对复杂场景时的推理、解释和记忆能力。我们认为，传统的基于优化和模块化的自动驾驶(AD)系统在处理长尾角情况时面临固有的性能限制。为了解决这个问题，我们提出一个理想的AD系统应该像人一样开车，通过不断的驾驶积累经验，用常识解决问题。为了实现这一目标，我们确定了AD系统所必需的三种关键能力：推理、解释和记忆。我们通过构建一个闭环系统来展示它的理解能力和环境交互能力，从而证明了在驾驶场景中使用LLM的可行性。

2023-11-13 16:40:16 1222

原创 Drive as You Speak: Enabling Human-Like Interaction with Large Language Models in Autonomous Vehicle

自动驾驶汽车的未来在于以人为本的设计和先进的人工智能能力的融合。未来的自动驾驶汽车不仅可以运送乘客，还可以与乘客互动并适应他们的需求，使旅程舒适、高效、愉快。在本文中，我们提出了一个新的框架，利用大语言模型(llm)来增强自动驾驶汽车的决策过程。通过整合LLMs的自然语言能力和上下文理解、专业工具使用、协同推理以及与自动驾驶汽车上的各种模块的操作，该框架旨在将LLMs的高级语言和推理能力无缝集成到自动驾驶汽车中。

2023-11-13 10:27:51 331

原创 GLM开发笔记

GLM 是一种采用自回归填空目标进行预训练的通用语言模型，可以针对各种自然语言理解和生成任务进行微调。(ACL 2022)

2023-11-09 09:31:30 405

原创 SwissArmyTransformer瑞士军刀工具箱使用手册

Introduction sat（SwissArmyTransformer）是一个灵活而强大的库，用于开发您自己的Transformer变体。sat是以“瑞士军刀”命名的，这意味着所有型号（例如BERT、GPT、T5、GLM、CogView、ViT…）共享相同的backone代码，并通过一些超轻量级的mixin满足多种用途。sat由deepspeed ZeRO和模型并行性提供支持，旨在为大模型（100M\~20B参数）的预训练和微调提供最佳实践。

2023-11-06 15:52:14 2559

原创【论文阅读】DRIVEGPT4: INTERPRETABLE END-TO-END AUTONOMOUS DRIVING VIA LARGE LANGUAGE MODEL

在过去的十年里，自动驾驶在学术界和工业界都得到了快速发展。然而，其有限的可解释性仍然是一个重要的未解决问题，严重阻碍了自动驾驶汽车的商业化和进一步发展。以前使用小型语言模型的方法由于缺乏灵活性、泛化能力和鲁棒性而未能解决这个问题。最近，多模态大语言模型(llm)因其通过文本处理和推理非文本数据(如图像和视频)的能力而受到了研究界的广泛关注。在本文中，我们提出了DriveGPT4，一个利用llm的可解释的端到端自动驾驶系统。

2023-11-02 12:00:38 1740

MLU370 所需要的deepspeed安装包

2024-04-18

forecast-mae运行环境yaml

2024-02-03

Argoverse2数据集的导入

2023-12-07

【论文阅读笔记】GLM-130B: AN OPEN BILINGUAL PRE-TRAINEDMODEL

2023-11-01

win10最新2004版多用户同时远程桌面登陆Termsrv.dll(允许多个RDP会话)

适用2004专业版、教育版、企业版系统。家庭版请自行升级到专业版、教育版、企业版系统。第一步：请下载我的发布的termsrv.dll替换c:\Windows\System32\termsrv.dll。替换操作请自行进入PE操作。（注意备份原文件，万一有问题可以恢复原始文件。）第二步：组策略设置打开：gpedit.msc>计算机配置>管理模板>Windows组件>远程桌面服务>远程桌面会话主机>连接然后： 1.将“远程桌面服务用户限制到单独的远程桌面服务会话”设置为“已禁用” 2.将“限制连接的数量”设置为“已启用”，同时在选项里面“允许的RD最大连接数”设置为你想要的数量，这里我设置为3个最大连接数。若要使用此设置，请输入希望为服务器指定的最大连接数量。若要指定不受限制的连接数量，请键入 999999。如果将状态设置为“启用”，则最大连接数量限制为与服务器上运行的 Windows 版本和远程桌面服务的模式相一致的指定数量。如果将状态设置为“禁用”或“未配置”，则在“组策略”级别上不强制限制连接的数量。第三步：重启电脑即可实现多用户同时登录。

2020-07-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

MLU370 所需要的deepspeed安装包

forecast-mae运行环境yaml

Argoverse2数据集的导入

【论文阅读笔记】GLM-130B: AN OPEN BILINGUAL PRE-TRAINEDMODEL

win10最新2004版多用户同时远程桌面登陆Termsrv.dll(允许多个RDP会话)

南京邮电大学校园网windows登录助手.zip

RFID-STM32

RFID-F103资料

空空如也