自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Mystra

知及之,仁不能守之,虽得之,必失之。

  • 博客(1022)
  • 资源 (27)
  • 收藏
  • 关注

原创 PyTorch - 高效快速配置 Conda + PyTorch 环境 (解决 segment fault )

在配置算法项目时,因网络下载速度的原因,导致默认的 conda 与 pytorch 包安装缓慢,需要配置新的 conda 与 pip 源,以及下载安装 pytorch 环境。

2023-11-17 14:51:37 827

原创 什么是热爱编程

看到下文, 感觉自己弱爆了, 要重新好好的”热爱编程”.95年的时候,我高中同学郭军买了一本Borland C++手册,我们两个人此后两年没机会碰真的电脑,没见过Tubro C更没见过Borland C++,生看这本书,看了两年,百看不厌。做不到,别轻易说,我热爱编程,热爱学习。97年,父母在高考前三天给我买了一台电脑,整个假期,全部在电脑面前度过,把VB的全部文档看完,自己学会VB,啃Delphi

2015-08-11 18:20:46 3176 7

原创 LLM - 绝对与相对位置编码 与 RoPE 旋转位置编码 源码

Transformer 是基于 MHSA (多头自注意力),然而,MHSA 对于位置是不敏感的,需要添加位置编码 (PE),PE即类别变量,索引,也是基于索引的 Embedding,包括两种,一种是绝对位置编码 (Transformer默认的位置编码),一种是相对位置编码,最新的是旋转位置编码 (Rotary Position Embedding)。

2024-07-10 23:11:48 556

原创 LLM - Transformer 的 多头自注意力(MHSA) 理解与源码

在 Transformer 中,多头自注意力机制 (MHSA, Multi-Head Self-Attention) 是核心创新之一,极大地提升模型处理序列数据的能力。多头自注意力机制是自注意力机制的扩展,将输入分割成多个 头(Head),每个头学习输入的不同部分表示,然后,将这些表示合并起来,以捕获信息的不同方面。

2024-07-08 23:56:48 553

原创 Python - 递归函数(Recursive Function)的速度优化 (Python实现)

递归函数是特殊的编程技术,通过调用自身来解决问题。递归函数通常包含两个关键部分:基线条件(Base Case) 和 递归步骤(Recursive Step)。

2024-07-02 22:12:51 497

原创 LLM - 大语言模型(LLM) 的 应用技术

大语言模型(LLM)的应用技术范围非常广泛,包括LangChain开发框架,专为大型语言模型设计,以提高开发人工智能应用的效率,允许开发者将语言模型、向量数据库、交互层Prompt、外部知识和工具整合到一起,从而构建多样化的 LLM 应用程序;推理优化,在大型语言模型的推理过程中,优化技术可以显著提升效率和性能,通过分布式计算框架、知识图谱集成以及模型内部的优化技术,加速模型的推理过程,使其更适合实际应用;多模态大模型结合文本、图像和声音等多种数据类型,能够处理和理解跨多个模态的信息。

2024-06-04 19:54:05 59

原创 AI4Science - 《人工智能与药物设计》药物设计相关数据库的概述

药物设计是指使用化学、生物学、分子生物学等方法,对于已知的药物或天然产物进行改造或创新,以提高其药理活性、安全性和生物利用度的过程。药物设计是新药开发的重要环节,也是医药行业的核心竞争力之一。在药物发现与药物设计领域中,包括三类的数据库资源。

2024-06-04 15:17:16 94

原创 LeetCode - 二分查找(Binary Search)算法集合(Python)[左右边界|旋转数组|双列表]

二分查找,也称为折半查找,是一种在有序数组中查找特定元素的高效算法。其基本原理是将待搜索的区间分成两半,然后根据中间元素与目标值的比较结果来确定下一步搜索的区间。这个过程会一直重复,直到找到目标元素或者搜索区间为空。二分查找,重要的是如何划分区间范围,移动左右指针。

2024-06-03 17:05:12 504

原创 AI4Science - 开源工具 FreeSASA 计算 蛋白质复合物 链间接触的残基与面积

在蛋白质复合物中,通过链间距离,可以计算出在接触面的残基与接触面的面积,使用 BioPython 库 与 SASA (Solvent Accessible Surface Area,溶剂可及表面积) 库。SASA 计算主要以 水分子 是否通过为基础,水分子的半径是1.4 A,直径是 2.8 A,所以以 2.8 A 的距离,判断链间是否连接。

2024-06-03 16:36:23 89

原创 LeetCode - 双指针(Two Pointers)算法集合(Python)[对撞指针|快慢指针|滑动窗口|双链遍历]

双指针算法是一种常见且灵活的技巧,通过使用两个指针协同完成任务。这些指针可以指向不同的元素,具体应用取决于问题的性质。

2024-05-28 16:36:06 916

原创 LeetCode - 贪心(Greedy)算法集合(Python)[分配问题|区间问题]

贪心算法,是在每一步选择中,都采取当前状态下,最好或最优(即最有利)的选择,从而希望导致结果是最好或最优的算法,在解决各种问题时被广泛应用,包括数组操作、字符串处理、图论等,贪心算法包括,分配问题和区间问题。

2024-05-27 21:50:04 550

原创 Nothing

2024-05-27 16:48:23 331

原创 Nothing

2024-05-27 15:21:53 79

原创 Nothing

2024-05-27 14:40:09 69

原创 Nothing

2024-05-27 11:52:08 159

原创 Nothing

2024-05-24 14:58:05 98

原创 LLM - 大语言模型(LLM) 的 评估体系

大语言模型(LLM)的评估是复杂且多维的过程,涉及多个方面,包括评估体系、评估方法、评估实践。评估体系包括评估数据集、模型输出、样本/输出变换、真值(Ground Truth)、评估媒介、性能报告。评估方法包括直接评估指标、基于辅助模型的评估、基于模型的评估。评估实践主要包括,避免数据泄漏、测试样本的覆盖率、测试评估样本与任务无关、数据集划分和表述改写、随机数种子、准确率与召回率的权衡。

2024-04-24 15:50:42 419

原创 Nothing

2024-04-17 21:26:17 185

原创 Nothing

2024-04-16 18:42:13 199

原创 Nothing

2024-04-16 14:48:48 89

原创 Nothing

2024-04-08 12:49:47 222

原创 Nothing

2024-04-03 15:56:26 304

原创 LLM - 大语言模型 基于人类反馈的强化学习(RLHF)

基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback),结合 强化学习(RL) 和 人类反馈 来优化模型的性能。这种方法主要包括:多种策略产生样本并收集人类反馈:使用不同的策略来生成文本样本,然后,由人类评估这些样本的质量,以收集反馈数据。训练奖励模型:基于收集到的人类反馈,训练奖励模型(Reward Model, RM),该模型的目标是评估模型输出的文本质量。训练强化学习策略,微调语言模型:在这一步中,将初始语言模型的微调任务建模为强化学习

2024-04-02 23:12:56 579

原创 Nothing

2024-04-02 15:48:41 104

原创 Nothing

2024-03-28 11:21:24 365

原创 Nothing

2024-03-27 15:22:36 350

原创 Nothing

2024-03-25 18:27:40 674

原创 LLM - 大语言模型的指令微调(Instruction Tuning) 概述

大语言模型的指令微调(Instruction Tuning)是一种优化技术,通过在特定的数据集上进一步训练大型语言模型(LLMs),使其能够更好地理解和遵循人类的指令。这个数据集通常由一系列的指令和相应的期望输出组成。指令微调的目的是提高模型的能力和可控性,使其在执行任务时能够更准确地响应用户的需求。

2024-03-25 12:38:48 1906

原创 LLM - 大语言模型的分布式训练 概述

大语言模型的分布式训练是一个复杂的过程,涉及到将大规模的计算任务分散到多个计算节点上。这样做的目的是为了处理巨大的模型和数据集,同时,提高训练效率和缩短训练时间。

2024-03-22 00:18:50 1291

原创 LLM - 大语言模型的预训练数据(Dataset) 概述

BPE(Byte Pair Encoding)字节对编码模型,是用于NLP中的词元切分(Tokenization)的方法,核心思想是将常见的字符对(byte pairs)合并为一个单独的词元,从而减少整体的词元数量,同时保留了文本的重要信息。这种方法特别适用于处理词汇量非常大的语言模型,可以有效地减少词汇表的大小,同时保持语言的丰富性和表达能力。此外,BPE模型也支持多语言模型的训练,不依赖于特定语言的词汇结构。大语言模型的预训练数据通常涵盖了广泛的文本类型,以确保模型能够理解和生成多样化的语言内容。

2024-03-11 21:55:57 685

原创 LLM - 大语言模型的自注意力(Self-Attention)机制基础 概述

注意力(Attention)机制是大型语言模型中的一个重要组成部分,帮助模型决定在处理信息时,所应该关注的部分。在自然语言处理中,一个序列由一系列的元素组成。注意力机制通过为序列中的每个元素分配一个权重来工作,这个权重反映了每个元素对于任务的重要性。模型会更加关注权重高的元素。自注意力(Self-Attention)是一种特殊的注意力机制,不是将输入序列与输出序列关联起来,而是关注序列内部元素之间的关系。

2024-03-11 15:38:31 1977 1

原创 LLM - 大语言模型(LLM)发展 概述

大语言模型(LLM, Large Language Model)的发展和应用是一个非常广泛的领域,涉及从早期的统计模型到现代基于深度学习的模型。在自然语言处理领域的应用非常广泛,包括但不限于聊天机器人、内容生成、情感分析、自动摘要、问答系统等。强大的文本生成能力,使其在内容创作领域具有巨大潜力,可以用于撰写文章、创作诗歌、生成新闻报道等。也可以为教育提供丰富的资源和工具,如自动评分、个性化学习辅导等,还可以用于构建智能客服系统,提高客户服务的响应速度和准确性。

2024-03-11 11:15:47 1156

原创 Nothing

2024-03-06 10:59:45 448

原创 Nothing

2024-03-04 00:07:12 447

原创 Nothing

2024-03-03 21:42:13 1087

原创 Nothing

2024-03-01 11:35:13 867

原创 Nothing

2024-03-01 01:04:48 1423

原创 Nothing

2024-02-27 11:53:09 1057

原创 Nothing

2024-02-26 16:30:11 1030

原创 Nothing

2024-02-20 15:08:52 620

药物设计相关数据库.xmind

药物设计相关数据库是专门收集、整理和提供药物候选分子、生物靶标信息、药物化学结构、生物活性数据以及药物设计工具的电子资源。

2024-07-02

MMseqs2最新版本可执行文件

官网源码:https://github.com/soedinglab/MMseqs2 MMseqs2 可执行文件,根据源码编译,需要安装插件运行,支持 MPI 功能。 apt-get install libatomic1 性能测试,参考文章:https://spike.blog.csdn.net/article/details/131966061 MMseq2 是非常强大和高效的生物信息学软件,可以在极短的时间内对大规模的核苷酸和蛋白质序列进行搜索和聚类。主要特点有: - 使用一种新颖的序列比对算法,可以在保持高灵敏度的同时,大幅提高搜索速度。它可以比 BLAST 快 10000 倍,比 PSI-BLAST 快 400 倍。 - 可以处理多种序列格式,包括 FASTA, FASTQ, A3M, Stockholm 等,还可以直接从 NCBI 下载序列数据,或者从 UniProt, Pfam, InterPro 等数据库中获取预构建的序列集。

2023-07-27

DrugChat测试模型

使用开源数据,未训练充分,仅用于测试。

2023-06-26

冷冻电镜的低通滤波算法

优化版本的冷冻电镜的低通滤波算法v1.1,目标,将冷冻电镜图像,通过低通滤波算法降噪,输入冷冻电镜图像,输出信息集中的降噪图像。 参考文章:https://blog.csdn.net/caroline_wendy/article/details/126127817?spm=1001.2014.3001.5502

2022-08-02

resnet50_ram-a26f946b.pth

网络resnet50默认的模型

2021-09-14

XML解析数据.zip

用于测试XML解析逻辑

2021-06-24

craft_models.zip

CRAFT算法依赖的模型,参考https://blog.csdn.net/caroline_wendy/article/details/117226123

2021-05-27

ICDAR_2015.zip

ICDAR:International Conference on Document Analysis and Recognition,ICDAR于2015年举办的场景文本检测竞赛中使用的官方数据集,包含了1000张训练图和500张测试图。

2021-05-27

Solidity Programming Essentials

Solidity Programming Essentials: A beginner’s guide to build smart contracts for Ethereum and blockchain,仅用于学习与交流。

2018-06-09

LabelImg for Mac

LabelImg的Mac版,里面含有安装说明,用于图片标记等算法。

2018-05-24

boost_1_64_0和libevent-2.1.8

boost_1_64_0和libevent-2.1.8,用于Thrift的安装支持。

2017-08-06

IOS空应用模板

IOS的空应用模板,可以导入直接使用,则系统就可以自动生成模板。

2015-05-15

yambaclientlib - (Learning Android依赖库)

Learning Android 中文版 第2版 Yamba的jar包,项目依赖必须使用。

2014-12-02

程序员面试金典 代码 全

程序员面试金典的完整代码,github上下载,仅供学术交流。

2014-07-25

外观模式 - 代码(Java)

外观模式的代码(java), 详细描述了外观模式的代码架构.

2014-06-17

命令模式(撤销) - 代码(Java)

命令模式(撤销)的代码(Java), 详细描述了命令模式(撤销)的代码架构.

2014-06-16

命令模式(多命令) - 代码(Java)

命令模式(多命令)的代码(Java), 详细描述了命令模式(多命令)的代码架构.

2014-06-16

抽象工厂模式 - 代码(Java)

抽象工厂模式的代码(java), 详细描述了抽象工厂模式的代码架构.

2014-05-26

Download - Android

Android Studio 0.5.2 + gradle 1.11 开发, 下载图片功能.

2014-03-27

Earthquake - Android Studio 代码

Android Studio 0.5.1, Gradle 1.11开发的Earthquake程序, 可以运行, 里面包含apk程序.

2014-03-24

ContactPicker(选择联系人) - Android

ContactPicker 选择联系人, 代码, 使用Android Studio 0.5.1开发, 与Eclipse可能不兼容. 代码讲解: http://blog.csdn.net/caroline_wendy/article/details/21629357

2014-03-20

ToDoList-ArrayAdapter

ToDoList, 使用定制的ArrayAdapter, Android Studio 0.5.1开发.

2014-03-17

Compass-Android

Compass(罗盘)的实现, 使用Android Studio 0.5.1开发, 注意Eclipse无法解析Android Studio的项目.

2014-03-17

ToDoList - Customization - Android

ToDoList的自定义控件版本, 使用Android Studio 0.5.1开发.

2014-03-16

ToDoList - Fragment - 代码

ToDoList经典练习的Fragment实现方法, 环境Android Studio 0.5.1, 日期2014.3.14

2014-03-14

gradle-1.11-bin

gradle的bin文件, Android Studio需要使用, 上传;

2014-03-09

"stdlib" - jar和ppt

stdlib的jar和讲解ppt. Java编程使用的输入输出函数库,包含In, Out, StdIn, StdOut等.

2013-12-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除