Caroline S-CSDN博客

原创 PyTorch - 高效快速配置 Conda + PyTorch 环境 (解决 segment fault )

在配置算法项目时，因网络下载速度的原因，导致默认的 conda 与 pytorch 包安装缓慢，需要配置新的 conda 与 pip 源，以及下载安装 pytorch 环境。

2023-11-17 14:51:37 829

原创什么是热爱编程

看到下文, 感觉自己弱爆了, 要重新好好的”热爱编程”.95年的时候，我高中同学郭军买了一本Borland C++手册，我们两个人此后两年没机会碰真的电脑，没见过Tubro C更没见过Borland C++，生看这本书，看了两年，百看不厌。做不到，别轻易说，我热爱编程，热爱学习。97年，父母在高考前三天给我买了一台电脑，整个假期，全部在电脑面前度过，把VB的全部文档看完，自己学会VB，啃Delphi

2015-08-11 18:20:46 3181 7

原创 LLM - 理解大模型 Batch 推理的 Padding Side (左填充或右填充)

使用 Left Padding (左填充) 或者 Right Padding (右填充)，HuggingFace 的 transformer 库使用的 Left Padding，而 Llama 源码使用的是 Right Padding，两者各有不同，各有优势。做大模型 Batch 推理时，当请求的语句不等长时，需要使用 Padding，即填充一个无意义的 token，一般推荐 eos_token。

2024-07-26 17:40:13 18

原创 LLM - 理解 Transformer 的位置编码 sin & cos 的作用与原理

Transformer 模型中的位置编码是关键技术，通过为每个词嵌入向量添加位置信息来保留序列的顺序性，增强模型对长距离依赖关系的捕捉能力，使得模型能够理解单词在句子中的位置，从而更好地处理语言的语法和语义结构，提高模型的表达能力和泛化能力，同时减少训练时间并增强模型的自适应性。位置编码通常通过正弦和余弦函数的组合实现，为每个位置生成唯一的编码，使得模型能够在并行处理序列数据的同时保留顺序信息。

2024-07-25 19:19:08 125

原创 Python - 开源库 ReportLab 库合并 CVS 和图像生成 PDF 文档

ReportLab 是一个非常流行的 Python 库，专门用于生成 PDF 文档，提供了丰富的功能，可以创建复杂的文档，包括文本、图像、表格、图表等。

2024-07-25 13:55:57 466

原创 Server - 配置 Kubernetes 多任务流程 KubeFlow Pipeline 的开发教程

Kubernetes 的 KFP（Kubeflow Pipelines）是一个平台，用于构建和部署可扩展和可移植的机器学习（ML）工作流。允许用户以简单、可复用和可组合的方式定义机器学习任务，并支持各种 ML 框架。KFP 包括一个用于构建 ML 管道的 SDK，以及用于运行这些管道的运行时环境。通过 KFP，用户可以轻松地将机器学习模型从实验转移到生产环境，同时保持模型的可追溯性和版本控制。

2024-07-24 15:26:06 347

原创 LLM - 绝对与相对位置编码与 RoPE 旋转位置编码源码

Transformer 是基于 MHSA (多头自注意力)，然而，MHSA 对于位置是不敏感的，需要添加位置编码 (PE)，PE即类别变量，索引，也是基于索引的 Embedding，包括两种，一种是绝对位置编码 (Transformer默认的位置编码)，一种是相对位置编码，最新的是旋转位置编码 (Rotary Position Embedding)。

2024-07-10 23:11:48 621

原创 LLM - Transformer 的多头自注意力(MHSA) 理解与源码

在 Transformer 中，多头自注意力机制 (MHSA, Multi-Head Self-Attention) 是核心创新之一，极大地提升模型处理序列数据的能力。多头自注意力机制是自注意力机制的扩展，将输入分割成多个头(Head)，每个头学习输入的不同部分表示，然后，将这些表示合并起来，以捕获信息的不同方面。

2024-07-08 23:56:48 610

原创 Python - 递归函数(Recursive Function)的速度优化 (Python实现)

递归函数是特殊的编程技术，通过调用自身来解决问题。递归函数通常包含两个关键部分：基线条件(Base Case) 和递归步骤(Recursive Step)。

2024-07-02 22:12:51 498

原创 LLM - 大语言模型(LLM) 的应用技术

大语言模型(LLM)的应用技术范围非常广泛，包括LangChain开发框架，专为大型语言模型设计，以提高开发人工智能应用的效率，允许开发者将语言模型、向量数据库、交互层Prompt、外部知识和工具整合到一起，从而构建多样化的 LLM 应用程序；推理优化，在大型语言模型的推理过程中，优化技术可以显著提升效率和性能，通过分布式计算框架、知识图谱集成以及模型内部的优化技术，加速模型的推理过程，使其更适合实际应用；多模态大模型结合文本、图像和声音等多种数据类型，能够处理和理解跨多个模态的信息。

2024-06-04 19:54:05 60

原创 AI4Science - 《人工智能与药物设计》药物设计相关数据库的概述

药物设计是指使用化学、生物学、分子生物学等方法，对于已知的药物或天然产物进行改造或创新，以提高其药理活性、安全性和生物利用度的过程。药物设计是新药开发的重要环节，也是医药行业的核心竞争力之一。在药物发现与药物设计领域中，包括三类的数据库资源。

2024-06-04 15:17:16 96

原创 LeetCode - 二分查找(Binary Search)算法集合(Python)[左右边界|旋转数组|双列表]

二分查找，也称为折半查找，是一种在有序数组中查找特定元素的高效算法。其基本原理是将待搜索的区间分成两半，然后根据中间元素与目标值的比较结果来确定下一步搜索的区间。这个过程会一直重复，直到找到目标元素或者搜索区间为空。二分查找，重要的是如何划分区间范围，移动左右指针。

2024-06-03 17:05:12 504

原创 AI4Science - 开源工具 FreeSASA 计算蛋白质复合物链间接触面积教程

在蛋白质复合物中，通过链间距离，可以计算出在接触面的残基与接触面的面积，使用 BioPython 库与 SASA (Solvent Accessible Surface Area，溶剂可及表面积) 库。SASA 计算主要以水分子是否通过为基础，水分子的半径是1.4 A，直径是 2.8 A，所以以 2.8 A 的距离，判断链间是否连接。

2024-06-03 16:36:23 91

原创 LeetCode - 双指针(Two Pointers)算法集合(Python)[对撞指针|快慢指针|滑动窗口|双链遍历]

双指针算法是一种常见且灵活的技巧，通过使用两个指针协同完成任务。这些指针可以指向不同的元素，具体应用取决于问题的性质。

2024-05-28 16:36:06 920

原创 LeetCode - 贪心(Greedy)算法集合(Python)[分配问题|区间问题]

贪心算法，是在每一步选择中，都采取当前状态下，最好或最优（即最有利）的选择，从而希望导致结果是最好或最优的算法，在解决各种问题时被广泛应用，包括数组操作、字符串处理、图论等，贪心算法包括，分配问题和区间问题。

2024-05-27 21:50:04 555

原创 AI4Science - 开源网站 MolProbity 评估蛋白质结构的原子冲突(Clash) 教程

MolProbity 是由杜克大学生物化学系开发的在线工具，主要用于蛋白质结构分析。可以帮助研究人员评估和改进蛋白质晶体结构的质量，也可以用于评估蛋白质结构冲突。

2024-05-27 16:48:23 341

原创 AI4Science - 开源工具 Amber 松弛(Relax) 蛋白质三维结构 (Python) 教程

Amber 工具在蛋白质松弛(Relax)过程中起着重要的作用。在分子动力学模拟中，蛋白质松弛是指模拟过程中蛋白质结构达到一个较为稳定的状态。这个过程通常涉及能量最小化和温度平衡，以确保蛋白质的结构和动态行为接近其在生物体内的自然状态。

2024-05-27 15:21:53 86

药物设计相关数据库.xmind

MMseqs2最新版本可执行文件

DrugChat测试模型

冷冻电镜的低通滤波算法

resnet50_ram-a26f946b.pth

XML解析数据.zip

craft_models.zip

ICDAR_2015.zip

Solidity Programming Essentials

LabelImg for Mac

boost_1_64_0和libevent-2.1.8

IOS空应用模板

yambaclientlib - (Learning Android依赖库）

程序员面试金典 代码 全

外观模式 - 代码(Java)

命令模式(撤销) - 代码(Java)

命令模式(多命令) - 代码(Java)

抽象工厂模式 - 代码(Java)

Download - Android

Earthquake - Android Studio 代码

ContactPicker(选择联系人) - Android

ToDoList-ArrayAdapter

Compass-Android

ToDoList - Customization - Android

ToDoList - Fragment - 代码

gradle-1.11-bin

"stdlib" - jar和ppt

空空如也

程序员面试金典代码全