endNone-CSDN博客

原创【论文精读】BIOREASON: Incentivizing Multimodal Biological Reasoning within a DNA-LLM Model

**BIOREASON** 成功将 DNA 基础模型与大型语言模型融合，构建了一个**统一的多模态框架**，既克服了以往模型**无法原生处理 DNA 序列**、又**缺乏可解释性**的痛点，又通过上下文化的 DNA 嵌入实现了**分步推理与准确预测**的能力——这一思路正是借鉴了视觉–语言模型提取视觉编码器高层嵌入并注入 Prompt 的**VLM 范式**；然而，该方案仍依赖于 KEGG 等**策划数据集**而易引入偏见，对超长序列分析需付出高昂的**计算代价**，且缺少稳健的**不确定性量化**，在临床

2025-07-16 10:07:58 872

原创【论文详解】AlphaGenome——Sequence-to-Multimodal-Genome-Track

**AlphaGenome** 是由 **Google DeepMind** 于 2025 年 6 月发布的突破性 AI 模型，专门用于预测非编码区遗传变异的功能效应。该模型采用受 **U-Net** 启发的卷积架构结合 **Transformer** 模块，创新性地解决了传统模型在输入序列长度与预测分辨率之间的核心矛盾——能够在 **1M 碱基对的超长上下文** 下实现 **单核苷酸分辨率** 的精准预测。

2025-07-08 01:03:49 822

原创【机器学习】SAE(Sparse Autoencoders)稀疏自编码器

SAE(Sparse Autoencoders)稀疏自编码器概念讲解

2025-06-13 01:03:55 1814

原创【生物信息学】摇摆配对(Wobble Hypothesis)

【生物信息学】摇摆配对(Wobble Hypothesis)

2025-06-10 12:06:08 819

原创【生物信息学】k-mer的基本概念及应用

【生物信息学】k-mer的概念及应用

2025-05-26 23:05:51 1405 3

原创【大语言模型的漏洞与“越狱”】GPT、Llama等模型全部中招！

本文主要讨论了ChatGPT和其他AI模型的一些漏洞和越狱技巧。首先提到了一些常见的提示词漏洞，比如通过“奶奶”提示词绕过内容限制，获取敏感信息或危险指令。接着介绍了开发者模式和DAN模式（Do Anything Now），这些模式通过特定的提示词绕过AI的内容过滤系统，生成未经审查的回复。最后，文章讨论了重复词攻击，这是一种通过不断重复单词来让AI模型泄露敏感信息的技术。实验表明，这种攻击对多个模型有效，尤其是大型模型，如ChatGPT。

2025-01-22 22:12:23 2587

原创 10进制数的压缩

10进数的1比1压缩转换

2025-01-22 21:19:38 1148

原创文生图FLUX系列模型介绍

文生图FLUX系列模型介绍

2025-01-19 16:35:33 1618

原创【zig】0.zig的下载安装

zig的下载安装

2025-01-05 21:23:10 920

原创 undefined symbol: __nvJitLinkComplete_12_4, version libnvJitLink.so.12 问题解决

ImportError: /data/conda/envs/opencompass/lib/python3.10/site-packages/torch/lib/../../nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4, version libnvJitLink.so.12问题解决

2024-11-22 20:05:07 3511

原创【生物信息学算法】图算法1：概念和算法

本文介绍了图论的基本概念和图的不同分类，包括有向图、无向图和加权图。图的表示方式主要有邻接矩阵和邻接列表，适用于不同的图结构。文中详细讲解了图的基本操作和属性，如添加节点和边、计算节点的度、查找相邻节点等，并通过 Python 代码实现这些操作。此外，还介绍了图的路径、距离的计算方法以及广度优先搜索（BFS）和深度优先搜索（DFS）算法的实现。最后，讨论了环的检测和图论中的欧拉定理，为图的应用提供了理论基础。

2024-09-07 21:08:40 1721

原创 TypeError: GenerationMixin got an unexpected keyword argument ‘standardize_cache_format‘ 报错解决

TypeError: GenerationMixin got an unexpected keyword argument 'standardize_cache_format' 报错解决

2024-09-02 11:38:59 1515 1

原创【R语言速通】2.循环和条件判断

本文简要介绍了R语言中的循环和条件判断结构。包括for、while、repeat循环及其控制语句next和break；条件判断的if、if...else、if...else if...else语句，以及矢量化条件判断函数ifelse()和选择结构switch的使用方法。

2024-09-01 18:40:18 1585

原创【R语言速通】1.数据类型

这篇博客介绍了R语言中的基本和复合数据类型，包括变量命名规则和各种数据结构的定义及操作

2024-09-01 16:56:36 2150

原创 Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing 问题解决

使用FastChat框架中的vllm_work部署DeepSeek-Coder-V2时遇到Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing 问题解决

2024-08-12 23:18:14 3090 3

原创 Failed to import from vllm._C with ImportError问题解决

Failed to import from vllm._C with ImportError('/ssdwork/.local/lib/python3.10/site-packages/vllm/_C.abi3.so: undefined symbol: _ZN5torch3jit11parseSchemaERKSs')问题解决

2024-08-12 22:47:02 9367

原创部署llama3时出现RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘报错

部署llama3时出现RuntimeError: "triu_tril_cuda_template" not implemented for 'BFloat16'报错

2024-07-28 03:39:50 3669

原创 AttributeError: ‘FieldInfo‘ object has no attribute ‘required‘. Did you mean: ‘is_required‘?问题解决

AttributeError: 'FieldInfo' object has no attribute 'required'. Did you mean: 'is_required'?问题解决

2024-07-26 14:59:35 2627

原创部署llama3.1时出现ValueError: `rope_scaling` must be a dictionary with two fields的解决方案

部署llama3.1时出现ValueError: `rope_scaling` must be a dictionary with two fields的解决方案

2024-07-25 09:44:52 7420 1

原创 TypeError: `dumps_kwargs` keyword arguments are no longer supported.问题解决

TypeError: `dumps_kwargs` keyword arguments are no longer supported.问题解决

2024-06-30 13:39:58 739

原创 RuntimeError: Unexpected error from cudaGetDeviceCount(). Error 802: system not yet initialized问题解决

RuntimeError: Unexpected error from cudaGetDeviceCount(). Error 802: system not yet initialized问题解决

2024-06-21 15:03:56 2862

原创 No module named ‘torch.distributed.checkpoint.format_utils问题解决

No module named 'torch.distributed.checkpoint.format_utils'问题解决

2024-06-16 06:15:41 795

原创 ModuleNotFoundError: No module named ‘torch._six‘问题解决

ModuleNotFoundError: No module named 'torch._six'问题解决

2024-05-21 10:48:44 1363

原创 github分支相关操作

github分支相关操作

2024-05-15 15:28:22 1557

原创 [hf space api]ModuleNotFoundError: No module named ‘websockets.legacy‘和TypeError: Client.predict问题解决

在调用huggingface space上api时遇到了ModuleNotFoundError: No module named ‘websockets.legacy‘和TypeError: Client.predict问题解决

2024-05-15 14:12:07 940

原创【空间转录组|SpatialDE2】AttributeError: module ‘SpatialDE‘ has no attribute ‘test‘问题解决

【空间转录组|SpatialDE2】AttributeError: module 'SpatialDE' has no attribute 'test'问题解决

2024-05-07 22:37:51 452

原创 llama3-70b部署 RuntimeError问题解决

部署llama3时，RuntimeError: Expected one of cpu, cuda, ipu, xpu, mkldnn, opengl, opencl, ideep, hip, ve, fpga, ort, xla, lazy, vulkan, mps, meta, hpu, mtia, privateuseone device type at start of device string: auto问题解决

2024-05-06 02:56:05 1255

原创大模型精度

这篇博客详细介绍了浮点数在计算机中的存储方式、不同类型的浮点精度（如FP16、FP32、FP64等）及其用途，以及在深度学习和大模型训练中采用的混合精度训练方法。文章通过理论解释和实例展示，阐述了如何在提高计算效率和节约内存使用的同时，保持数值计算的精度和稳定性。

2024-05-01 21:39:50 1732 1

原创 Hugging Face space 快速部署 Argilla

在部署AutoPrompt项目时我发现需要配置一个名为Argilla的注释方法项目，提供用户界面让人类注释者可以审查和修改模型的输出。Argilla是一个开源的、以数据为中心的 NLP 平台，可以用于数据标注、机器学习运维和反馈循环，旨在增强小型和大型语言模型（LLM）的开发。使用Argilla，每个人都可以使用人工和机器反馈，通过更快的数据管理来构建强大的语言模型，为 MLOps 周期中的每个步骤提供支持，从数据标记到模型监控。

2024-04-25 15:38:10 880 3

原创 json 学习笔记

这个函数用于将 Python 对象序列化为 JSON 格式，并直接写入到一个文件中。适用于需要将对象转化为字符串以便在网络上传输或其他需要字符串形式的场合。通过这些函数，你可以方便地在 Python 对象和 JSON 格式之间进行转换，无论是处理文件还是处理网络传输的数据。在 json 标准中，对于数组和对象的长度以及它们可以嵌套的深度没有做出具体的限制。需要注意的是在程序中使用json数据，需要特定方法转化为对象变量才能使用。，没有多余的标记，因此在网络中传输时可以减少数据量，提高效率。

2024-04-24 22:12:38 1337 3

原创最新qwen2_moe模型加载，出现KeyError: ‘qwen2_moe‘报错解决

原因：pip中的最新版的transformers还没有更新，因此用github上的版本更新。

2024-04-08 01:21:34 4741

原创 huggingface下载模型总是下载到~/.cache/huggingface的问题解决

其实是软链接，这样做的好处是为了统一管理，即第一次过后假设自己忘记过下载这个文件，再次运行下载命令即可直接获取这个完整的文件，不必从头下载。但这样做的缺陷是如果/home路径所在的磁盘空间紧张，很容易导致磁盘空间爆了，网络上的解决方法是在命令中设置参数。,经过实测，这个参数可以更改下载的临时路径，问题得到解决。，但实测下来这个参数没有任何效果，估计版本升级的原因。为了统一存储管理，默认将文件的下载地址设置在了。在最新版本的help中我找到了这个参数。

2024-03-16 16:00:04 3615 6

原创 Docker学习笔记

不依赖于操作系统的运行层（layer）：添加安装包、依赖、配置等，每一次操作都形成新的一层基础镜像（BaseImage）：应用依赖的系统函数库、环境、配置、文件等入口（Entrypoint）：镜像运行入口，一般是程序启动的脚本和参数Dockerfile其中包含一个个指令，用指令来说明要执行什么操作来构建镜像。将来Docker可以根据Dockerfile帮我们构建镜像。指令说明示例FROM指定基础镜像ENV设置环境，可在后面指令使用COPY拷贝本地文件到镜像的指定目录RUN。

2024-03-13 10:42:40 1300 1

原创 huaggingface模型国内网络下载

hf-mirror](https://hf-mirror.com/）是huggingface的镜像网站，在国内可以直接使用，对于新出的模型魔方社区不一定有人第一时间搬运到社区里，所以使用hf-mirror更保险一点。上的大模型时，需要连接外网，但由于出于对服务器的安全性考虑，一般服务器是不会允许连接外网的。操作上和huggingface完全一致，复制命令下载即可。找到你想要的模型，在模型文件里找到对应命令运行即可。当我们在GPU服务器上要下载。

2024-03-13 10:33:31 1492 1

原创 AttributeError: ‘Qwen2ForCausalLM‘ object has no attribute ‘chat‘解决方案

AttributeError: 'Qwen2ForCausalLM' object has no attribute 'chat'解决方案

2024-03-10 14:57:47 6462 4

原创 ValueError: Tokenizer class Qwen2Tokenizer does not exist or is not currently imported.解决方法

ValueError: Tokenizer class Qwen2Tokenizer does not exist or is not currently imported.解决方法

2024-03-09 14:31:13 3265 3

原创在国内网络内却无法访问部分内网（例如知网）的问题解决

在国内网络内却无法访问部分内网（例如知网）的问题解决

2023-09-22 10:20:37 4484 2

原创 Linux学习日志-1-基础命令

linux学习笔记-常用命令篇，本文章详细罗列了Linux的常用命令和用法

2023-09-22 00:51:37 242

原创如何在共享服务器里建立自己工作目录的“马奇诺防线”

在共享服务器里通过GPG和openssl加密自己的工作目录，同时在需要时随时解密解压，既安全又高效

2023-09-03 04:26:59 220

原创 Easyconnect 状态异常及连接上校园网无法访问校内网站的问题

Easyconnect 状态异常及连接上校园网无法访问校内网站的问题

2023-05-26 13:27:24 8375 4

(中英文)停用词表( 3076)

内容概要本资源包含一套综合性的中英文停用词表，总计包含2313个词汇。这些停用词来源于多个权威来源，包括但不限于中文停用词表、哈工大停用词表、百度停用词表以及四川大学机器智能实验室停用词库。这些词表经过精心整合和去重，旨在为中英文文本处理提供一个高效、准确的基础词库。适用人群数据科学家和文本分析专家，需要清洗和预处理大规模文本数据。自然语言处理（NLP）研究人员和学生，寻求优化算法性能和提升数据处理效率。机器学习工程师和开发者，涉及到文本挖掘、情感分析、主题建模等应用。任何需要进行高效中英文文本分析和处理的专业人士和爱好者。使用场景及目标文本预处理：在文本分析和自然语言处理（NLP）任务中，停用词通常被视为噪声，需要从数据集中去除以提高算法效率和准确性。搜索引擎优化：通过过滤无意义的停用词，改进搜索算法的相关性和效率。情感分析：净化文本，保留更有情感色彩的词汇，提高情感分析的准确度。文本摘要和关键词提取：去除常见但无关紧要的词汇，突出文本的关键信息和主题。其他说明该停用词表不仅包含了单个字词，也涵盖了一些常见短语和标点符号，适用于更广泛的文本处理场景。

2024-04-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人