自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(333)
  • 资源 (15)
  • 收藏
  • 关注

原创 知识图谱(6)基于KG构建问答系统

知识图谱(6)基于KG的QA

2023-09-26 14:42:22 47

原创 知识图谱(5)知识表示

知识图谱(5)知识表示

2023-09-25 22:11:59 45

原创 知识图谱(4)图算法

知识图谱(4)图算法

2023-09-20 16:56:17 393

原创 基于scRNA-seq的GRN分析三阴性乳腺癌的肿瘤异质性

基于GRN解释TNBC的一些机制

2023-09-14 12:51:20 67

原创 知识图谱(3)关系抽取

知识图谱(3)关系抽取

2023-09-13 19:53:26 50

原创 预测多基因扰动的转录结果

细胞对基因扰动的转录反应揭示了细胞如何运作的基本见解。转录反应可以描述多种功能,从基因调控机制如何帮助维持细胞身份到调节基因表达如何逆转疾病表型。这对生物医学研究,特别是在开发个性化治疗方面具有重要意义。例如,通过基因扰动研究来验证药物靶点,增加了临床试验成功的可能性。此外,确定协同基因对可以提高联合治疗的有效性。由于已知复杂的细胞表型是由小组基因之间的遗传相互作用产生的,确定这种相互作用可以促进精确的细胞工程。

2023-09-13 19:08:21 49

原创 多模态图像合成与编辑

文本生成图像,文本生成3D模型

2023-09-13 18:48:38 67

原创 知识图谱(2)词汇挖掘与实体识别

知识图谱(2)词汇挖掘与实体识别

2023-09-06 16:15:52 202

原创 知识图谱(1)知识存储与检索

知识图谱(1)知识存储与检索

2023-08-30 11:09:01 145

原创 Langchain+LLM

Langchain+LLM简述

2023-08-23 23:42:19 246

原创 ChatGLM-Med,HuaTuo,ChatDoctor

医学LLM

2023-08-23 17:26:23 127

原创 ChatGLM-6B微调记录

ChatGLM-6B微调记录

2023-08-21 20:09:55 138

原创 LLM低成本微调方法

LLM低成本微调方法

2023-08-20 22:25:00 138

原创 LLaMA-7B微调记录

LLaMA-7B微调:Alpaca-LoRA

2023-08-19 23:45:27 864

原创 深度学习在MRI运动校正中的应用综述

MRI运动校正综述

2023-08-15 11:43:00 393

原创 基于子口袋的分子生成

可泛化的基于口袋生成配体

2023-08-10 21:32:00 227

原创 LLM中的微调演变与LLM架构类型

prompt技术的发展,InstructGPT的训练,LLM架构分类

2023-08-05 15:55:11 153

原创 AI驱动的靶点发现综述

AI驱动靶点识别

2023-08-05 11:20:10 400

原创 多组学背景下的基因调控网络推断

GRN推断综述

2023-07-31 13:09:49 431

原创 使用预训练的2D扩散模型改进3D成像

CT和MRI重建

2023-07-25 18:57:24 1166

原创 基础语言模型LLaMA

LLaMA

2023-07-19 18:13:58 958

原创 基于GPT构建单细胞多组学基础模型

scGPT

2023-07-08 16:12:28 1291 1

原创 JointVAE用于单细胞多模态插补和embedding

单细胞多模态数据能够测量细胞的各种特征,从而深入了解细胞和分子机制。然而,多模态数据的生成仍然昂贵且具有挑战性,同时缺失模态也经常发生。最近,机器学习方法已经被开发用于数据补全,但通常需要完全匹配的多模态数据才能学习共同的潜在特征,可能缺乏模态特异性。为了解决这些问题,作者开发了一个机器学习模型,名为JAMIE。JAMIE接受单细胞多模态数据,这些数据可以在模态之间部分匹配样本。变分自编码器学习每个模态的潜在特征。然后,跨模态匹配样本的特征被聚合以识别联合的跨模态潜在特征,然后进行重构。

2023-07-05 17:16:01 247

原创 区块链的简单认识

法定货币的发行依靠中央银行的财务决策,可能导致通货膨胀,比特币的发行依靠区块链上新区块的生成,矿工将区块验证,并加入区块链后,可以获得出块奖励,因此很形象地称为挖矿。现在系统中的算力总量越来越大,对于单个矿工来说,挖矿成功的概率越来越小,后续发展出矿池,通过为矿池的主人提供算力,矿池作为一个节点,提高了挖矿成功的概率,并且将出块奖励分配到参与矿池的矿工手中。有人认为,比特币系统由于挖矿现象,扭曲了本意,因此,以太坊改变了工作量证明的方式,目的是ASIC-resistance。

2023-06-25 01:15:18 177

原创 scDesign3:多模态单细胞和空间组学数据生成

scDesign3生成模拟单细胞数据

2023-06-14 16:00:02 293

原创 多任务学习用于多模态生物数据分析

UnitedNet:用于联合测量数据的可解释技术

2023-06-14 13:47:12 2216

原创 像医生一样的大规模AI模型

医学LLM

2023-06-13 16:25:02 528

原创 原型part学习NeurIPS2019

原型组件学习

2023-05-15 15:51:09 503 2

原创 用于OOD预测的稳定学习

StableNet实现OOD预测

2023-05-14 23:50:38 240

原创 泛化深度学习综述

领域泛化综述

2023-05-14 21:02:50 679

原创 利用结构相似性做单细胞多模态分析

以ATAC任务为主的单细胞多模态分析

2023-05-11 18:00:58 371

原创 单细胞跨模态分析综述

单细胞多模态分析综述

2023-05-10 19:41:18 617

原创 类别无关的姿态估计ECCV2022

类别无关的姿态估计

2023-05-09 18:15:49 822

原创 带稀缺注释的动物姿态估计CVPR2023

半监督动物姿态估计

2023-05-09 14:11:46 608

原创 GNN与MLP:GNN是一种泛化器

消息传递机制可以引入泛化性

2023-05-08 22:53:56 528

原创 通用医学图像分割模型UniverSeg

通用医学图像分割

2023-05-05 00:09:45 2012

原创 用于scATAC-seq有监督分类的Cellcano

scATAC-seq有监督分类

2023-05-01 19:08:17 833

原创 评价基于GPT和Bert的方法并用于生信文本识别PPI

微调和提示范式用于文本PPI提取

2023-04-30 16:02:42 1470 2

原创 ProteinGAN扩展蛋白质序列空间

蛋白质的3D结构、物理化学性质和分子功能由其氨基酸序列决定。从20种常见的氨基酸中,一个包含100个氨基酸的小尺寸蛋白质可以用1013010^{130}10130种不同的方法制成。在这个巨大的多维空间中,估计只有110771/10^{77}1/1077可以折叠成3D结构来执行特定功能。这给旨在筛选具有增强特性的新序列方法带来了很大的负担,因为随机的氨基酸替换都可能会导致蛋白质活性下降。而另一方面,机器学习可以直接从氨基酸序列推断蛋白质特性和功能。

2023-04-25 16:28:31 389

原创 几何感知Transformer用于3D原子系统建模

分子系统能量力场的基本形式可以分解为基于键、键角、扭转角和非键相互作用等因素的函数。为了包含上述因素并进行能量估计,神经网络需要学习原子-原子(键和非键原子对)、原子-键(键角)和键-键(扭角)之间的相互作用。而过去基于Transformer的模型只学习原子-原子之间的相互作用。为了扩展信息并利用Transformer,作者提出Moleformer,它显式模拟原子-原子对之间的相互作用。Moleformer将原子、键和非键原子对作为输入,并应用平移旋转不变几何感知空间编码来捕获这些输入之间的几何关系。

2023-04-24 22:16:45 392

红楼梦人物图谱csv文件

红楼梦人物图谱csv文件

2023-08-30

mackey_glass_t17.npy

Mackey-Glass (MG)序列的部分内容,shape为(10000,),这个时间序列是混乱的,没有明确的周期。 级数不收敛也不发散,轨迹对初始条件高度敏感。 这个基准问题用于神经网络和模糊建模研究。

2021-07-12

Kaggle交易预测.rar

基于 Kaggle 竞赛数据,原始数据文件较大,故本数据集只选用了 train.csv 中的 5 万条样本作为模型训练集(train.csv.gzip),1 万条样本作为模型测试集(test.csv.gzip)

2021-02-17

olivetti_py3.pkz

人脸图像数据集 olivetti_py3.pkz,该数据集一共有 400 张人脸图片,每张图片的大小是:64x64,每张图片作为一个样本,一共有 400 个样本,每个样本的特征维度是:64x64 = 4096;400 张图片一共包含 40 个不同的人,每个人有 10 张人脸图片

2021-02-13

随机森林评估特征重要性wine.rar

基于 UCI 葡萄酒数据,使用随机森林进行特征重要性分析,这些数据是对意大利同一地区种植的三种不同品种葡萄酒的化学分析结果,分析确定了三种葡萄酒中13种成分的含量,数据的第一列是葡萄酒的类别

2021-02-02

决策树预测用户流失data.csv

基于某信息公司的用户数据,使用决策树预测用户是否会流失,字段Churn代表客户是否流失,取值:['Yes', 'No'],其余字段为特征

2021-02-01

基于朴素贝叶斯的垃圾邮件过滤data.rar

邮件数据包括训练集train(正常邮件normal,垃圾邮件spam),测试集test,中文停用词文件cn_stopwords.txt

2021-01-31

LR预测CTR数据集data.zip

数据集是电商领域数据集,共计200万的样本记录。原始特征均为ID类特征; 字段说明: userid 用户ID itemid 商品ID categoryid 商品类目ID action 用户行为类型 timestamp 时间戳

2021-01-25

机器翻译nmt.zip

轻量级机器翻译数据集,en-cn为英文与中文,en-fr为英文与法文

2021-01-22

nltk_data.rar

nltk的分词工具,将其解压,放置到当前虚拟环境(假设环境名为TORCH),则目录结构为"TORCH/nltk_data/tokenizers/punkt"

2021-01-22

google.csv

机器学习第六课,使用线性回归预测未来30天 Google 股票的收盘价走势,表格中的列代表每天的股票指数,如:Open 开盘价、High 最高价、Low 最低价、Volume 成交量。Adj. Open、Adj. High、Adj. Low、Adj. Close、Adj. Volume 代表调整后的数据

2021-01-15

hymenoptera_data.zip

hymenoptera_data数据集,这个数据集包括两类图片, bees 和 ants, 这些数据都被处理成了可以使用"torchvision.datasets.ImageFolder"来读取的格式。

2020-12-02

glove.6B.100d.txt.zip

glove.6B是斯坦福大学训练的词向量包(862MB),glove.6B.100d是100维词向量,TEXT.build_vocab可以根据我自己的词汇表内的词匹配到glove内的词,组建成为需要的词向量;后面如果想使用这个新词向量,可以通过TEXT.vocab.vectors返回

2020-11-29

MNIST与FashionMNIST数据集

数据集包括了MNIST和FashionMNIST,有原始数据集raw和经过torchvision.datasets处理过的processed目录

2020-11-29

TextSet.zip

该文件用于词向量训练,Skip-Gram训练,主要是texttrain.txt文件,训练细节见白景屹的Pytorch笔记本-第四课.词向量:https://blog.csdn.net/qq_40943760/category_10532835.html

2020-11-09

fasterRCNN口罩检测

使用fasterrcnn实现口罩检测,fasterrcnn基于keras搭建,训练需要口罩数据集,数据集必须是VOC格式,预测需要权重文件,权重文件已经存在

2020-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除