自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(468)
  • 资源 (15)
  • 收藏
  • 关注

原创 Biomni:通用生物医学AI Agent

Biomni:生物医学AI Agent

2025-06-11 16:51:04 577

原创 Cell-o1:强化学习训练LLM解决单细胞推理问题

Cell-o1

2025-06-07 17:27:26 1025

原创 GEARS以及与基础模型结合

GEARS预测扰动响应

2025-05-30 16:21:21 1058

原创 C2S-Scale方法解读

C2S-Scale方法解读

2025-05-18 15:19:01 730

原创 C2S-Scale:Cell2Sentence v2

C2S-Scale

2025-05-14 21:20:10 1088

原创 scGPT-spatial:持续预训练scGPT用于空间转录组

scGPT-spatial

2025-04-30 16:10:03 1026

原创 scGPT方法解读

scGPT方法解读

2025-04-30 14:40:18 1413

原创 DeepSeek-R1技术报告(中文版)

DeepSeek技术报告(中文版)

2025-04-28 13:00:18 1223

原创 ICLR2025 | CAX:基于JAX加速的元胞自动机

JAX加速元胞自动机

2025-04-26 14:09:49 875

原创 联邦元学习实现个性化物联网的框架

联邦元学习Cedar

2025-04-22 19:33:06 912

原创 TABULA:联邦学习和表格建模构建scRNA-seq上的隐私保护基础模型

单细胞联邦学习

2025-04-17 20:58:44 983

原创 AAAI2025Oral | DUSTED-简洁高效的空间组学数据去噪

AAAI2025Oral | DUSTED-简洁高效的空间组学数据去噪

2025-04-12 13:43:56 772

原创 SCimilarity:对人类相似细胞进行可扩展搜索的细胞图谱基础模型

细胞搜索

2025-04-08 16:39:34 1013

原创 CellHint:人类细胞图谱自动细胞类型协调与整合

cellhint:细胞类型协调与数据整合

2025-04-08 13:23:11 992

原创 Aliee,Bengio and Theis:细胞数据上的因果机器学习

因果学习与单细胞

2025-04-02 22:11:32 967

原创 TextGrad:案例

TextGrad案例

2025-03-28 21:39:47 740

原创 TextGrad:文本梯度优化生成式AI

TextGrad

2025-03-28 14:04:29 882

原创 未来基于参考映射的单细胞数据分析

参考映射的展望

2025-03-26 19:22:01 970

原创 scNET:整合scRNA-seq和PPI用于学习基因和细胞的embedding

scNET

2025-03-24 23:05:27 1059

原创 Evo2:跨所有生命领域的基因组建模与设计

Evo 2

2025-03-20 22:12:53 1225

原创 Nature | TabPFN:表格基础模型用于小规模数据分析

TabPFN

2025-03-14 20:41:50 1870

原创 DrBioRight2.0:用于癌症蛋白组分析的生物学聊天机器人

DrBioRight

2025-03-13 20:56:22 778

原创 推理LLMs发展综述:从GPT到DeepSeek

推理LLMs发展综述:从GPT到DeepSeek

2025-03-10 18:54:53 1215 4

原创 ProteinTalks:蛋白组学上的扰动基础模型

蛋白组的扰动模型

2025-03-06 15:23:14 1109

原创 scBaseCamp:一个AI代理的可持续扩充的单细胞数据存储库

scBaseCamp:一个AI代理的可持续扩充的单细胞数据存储库

2025-03-05 21:36:59 1455

原创 Tahoe-100M:最大规模的单细胞扰动数据集

Tahoe-100M-最大规模单细胞扰动数据集

2025-03-05 17:00:03 1387 3

原创 IJCV2025综述-在线测试时适应(2):基于数据的OTTA和基于模型的OTTA

在线测试时适应综述(2)-基于数据的OTTA和基于模型的OTTA

2025-03-04 17:35:06 670

原创 IJCV2025综述-在线测试时适应(1):基于优化的OTTA

在线测试时适应综述(1)-基于优化的OTTA

2025-03-03 17:34:49 897

原创 综述概览:生物信息中的基础模型

综述:生物信息中的FMs

2025-02-17 21:41:53 596

原创 IntegrAO整合不完整数据以实现患者分层

IntegrAO整合不完整多组学数据

2025-02-13 15:57:45 1059

原创 ESM3(1)-介绍:用语言模型模拟5亿年的进化历程

ESM3(1)-介绍

2025-02-12 20:27:40 875

原创 ESM2和ESM fold:语言模型进行原子级结构预测

ESM2和ESMFold

2025-02-11 19:10:36 1720

原创 ESM-IF1:从AF2的预测结构中学习逆折叠

ESM-IF:逆折叠

2025-02-07 23:32:26 2177

原创 ESM-1v:突变对蛋白质功能影响的零样本预测

ESM-1v预测突变效应

2025-02-05 00:16:23 1693

原创 人工智能构建虚拟细胞

AIVC

2025-02-04 16:35:52 909

原创 MSA Transformer

ESM-MSA-1b

2025-01-31 22:01:30 934

原创 ESM-1b无监督学习 2.5 亿条蛋白质序列并揭示生物结构和功能

ESM-1b

2025-01-31 15:58:20 1355

原创 ProGen生成功能蛋白序列

ProGen生成功能特定的蛋白质序列

2025-01-28 01:32:03 1092

原创 PTMD2.0-疾病相关的翻译后修饰数据库

PTM-D

2025-01-25 17:25:55 1469

原创 GET-跨人体细胞类型的转录调控基础模型

GET:转录调控基础模型

2025-01-22 19:38:55 866

红楼梦人物图谱csv文件

红楼梦人物图谱csv文件

2023-08-30

nltk_data.rar

nltk的分词工具,将其解压,放置到当前虚拟环境(假设环境名为TORCH),则目录结构为"TORCH/nltk_data/tokenizers/punkt"

2021-01-22

随机森林评估特征重要性wine.rar

基于 UCI 葡萄酒数据,使用随机森林进行特征重要性分析,这些数据是对意大利同一地区种植的三种不同品种葡萄酒的化学分析结果,分析确定了三种葡萄酒中13种成分的含量,数据的第一列是葡萄酒的类别

2021-02-02

fasterRCNN口罩检测

使用fasterrcnn实现口罩检测,fasterrcnn基于keras搭建,训练需要口罩数据集,数据集必须是VOC格式,预测需要权重文件,权重文件已经存在

2020-05-26

基于朴素贝叶斯的垃圾邮件过滤data.rar

邮件数据包括训练集train(正常邮件normal,垃圾邮件spam),测试集test,中文停用词文件cn_stopwords.txt

2021-01-31

机器翻译nmt.zip

轻量级机器翻译数据集,en-cn为英文与中文,en-fr为英文与法文

2021-01-22

LR预测CTR数据集data.zip

数据集是电商领域数据集,共计200万的样本记录。原始特征均为ID类特征; 字段说明: userid 用户ID itemid 商品ID categoryid 商品类目ID action 用户行为类型 timestamp 时间戳

2021-01-25

glove.6B.100d.txt.zip

glove.6B是斯坦福大学训练的词向量包(862MB),glove.6B.100d是100维词向量,TEXT.build_vocab可以根据我自己的词汇表内的词匹配到glove内的词,组建成为需要的词向量;后面如果想使用这个新词向量,可以通过TEXT.vocab.vectors返回

2020-11-29

决策树预测用户流失data.csv

基于某信息公司的用户数据,使用决策树预测用户是否会流失,字段Churn代表客户是否流失,取值:['Yes', 'No'],其余字段为特征

2021-02-01

MNIST与FashionMNIST数据集

数据集包括了MNIST和FashionMNIST,有原始数据集raw和经过torchvision.datasets处理过的processed目录

2020-11-29

hymenoptera_data.zip

hymenoptera_data数据集,这个数据集包括两类图片, bees 和 ants, 这些数据都被处理成了可以使用"torchvision.datasets.ImageFolder"来读取的格式。

2020-12-02

google.csv

机器学习第六课,使用线性回归预测未来30天 Google 股票的收盘价走势,表格中的列代表每天的股票指数,如:Open 开盘价、High 最高价、Low 最低价、Volume 成交量。Adj. Open、Adj. High、Adj. Low、Adj. Close、Adj. Volume 代表调整后的数据

2021-01-15

mackey_glass_t17.npy

Mackey-Glass (MG)序列的部分内容,shape为(10000,),这个时间序列是混乱的,没有明确的周期。 级数不收敛也不发散,轨迹对初始条件高度敏感。 这个基准问题用于神经网络和模糊建模研究。

2021-07-12

olivetti_py3.pkz

人脸图像数据集 olivetti_py3.pkz,该数据集一共有 400 张人脸图片,每张图片的大小是:64x64,每张图片作为一个样本,一共有 400 个样本,每个样本的特征维度是:64x64 = 4096;400 张图片一共包含 40 个不同的人,每个人有 10 张人脸图片

2021-02-13

Kaggle交易预测.rar

基于 Kaggle 竞赛数据,原始数据文件较大,故本数据集只选用了 train.csv 中的 5 万条样本作为模型训练集(train.csv.gzip),1 万条样本作为模型测试集(test.csv.gzip)

2021-02-17

TextSet.zip

该文件用于词向量训练,Skip-Gram训练,主要是texttrain.txt文件,训练细节见白景屹的Pytorch笔记本-第四课.词向量:https://blog.csdn.net/qq_40943760/category_10532835.html

2020-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除