自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

白景屹的博客

原创深度学习与线性模型在扰动预测上的比较

深度学习与线性模型在扰动预测上的比较

2025-08-18 21:26:43 577

原创 MatterGen：用于无机材料设计的生成模型

mattergen生成材料

2025-08-12 15:07:17 1164

原创能力显著性向量：验证损失与下游能力的缩放定律

验证损失与下游能力的缩放定律

2025-08-02 22:59:35 886

原创 Re-TASK：从能力、技能和知识视角重新审视LLM任务

Re-Task：延续CoT的分解任务，进一步生成能力项以加强回应

2025-07-31 17:25:58 893

原创 OriGene：一种可自进化的虚拟疾病生物学家，实现治疗靶点发现自动化

OriGene：自进化Agent用于靶点发现

2025-07-30 17:04:47 1234

原创人类语言驱动物理机制建模的AIVC

基于规则建模虚拟细胞

2025-07-30 14:44:01 917

原创构建特定领域的大模型

构建领域特定大模型的概述

2025-07-29 17:30:10 968

原创 CellFlow：Flow matching建模cell状态变化

流匹配建模细胞扰动响应

2025-07-24 17:57:55 820

原创 DPO详解

DPO详解

2025-07-20 17:00:20 662

原创 MiniMind（3）训练

MiniMind（3）训练

2025-07-20 15:46:43 768

原创 Arc虚拟细胞挑战入门指南

Arc虚拟细胞挑战入门指南

2025-07-19 10:49:25 1033

原创 SymAgent（神经符号自学习Agent）

神经符号自学习Agent

2025-07-18 21:49:41 796

原创 Agent AI（3）：Agent分类

Agent AI（3）

2025-07-18 17:07:27 721

原创 Agent AI（2）：Agent范式

Agent AI（2）

2025-07-11 00:21:24 845

原创 Agent AI（1）：多模态交互智能中的背景和动机

Agent AI（1）

2025-07-09 17:46:30 853

原创 MiniMind（2）模型架构

MiniMind（2）模型架构

2025-07-02 16:38:06 850

原创 KV Cache

KV Cache

2025-06-30 20:11:14 428

原创 State：SE编码单个细胞，ST学习细胞集合上的扰动

STATE：预测扰动响应

2025-06-30 16:28:35 841

原创三种强化学习方法：PPO，DPO，GRPO

PPO，DPO，GRPO

2025-06-25 15:48:32 1061

原创 MiniMind（1）Tokenizer与训练数据

minimind part1：tokenizer与训练数据

2025-06-13 14:13:09 890

原创 Biomni：通用生物医学AI Agent

Biomni：生物医学AI Agent

2025-06-11 16:51:04 1351

原创 Cell-o1：强化学习训练LLM解决单细胞推理问题

Cell-o1

2025-06-07 17:27:26 1132

原创 GEARS以及与基础模型结合

GEARS预测扰动响应

2025-05-30 16:21:21 1207

原创 C2S-Scale方法解读

C2S-Scale方法解读

2025-05-18 15:19:01 804

原创 C2S-Scale：Cell2Sentence v2

C2S-Scale

2025-05-14 21:20:10 1153

原创 scGPT-spatial：持续预训练scGPT用于空间转录组

scGPT-spatial

2025-04-30 16:10:03 1159

原创 scGPT方法解读

scGPT方法解读

2025-04-30 14:40:18 1612

原创 DeepSeek-R1技术报告（中文版）

DeepSeek技术报告（中文版）

2025-04-28 13:00:18 1515

原创 ICLR2025 | CAX：基于JAX加速的元胞自动机

JAX加速元胞自动机

2025-04-26 14:09:49 951

原创联邦元学习实现个性化物联网的框架

联邦元学习Cedar

2025-04-22 19:33:06 975

原创 TABULA：联邦学习和表格建模构建scRNA-seq上的隐私保护基础模型

单细胞联邦学习

2025-04-17 20:58:44 1049

原创 AAAI2025Oral | DUSTED-简洁高效的空间组学数据去噪

AAAI2025Oral | DUSTED-简洁高效的空间组学数据去噪

2025-04-12 13:43:56 859

原创 SCimilarity：对人类相似细胞进行可扩展搜索的细胞图谱基础模型

细胞搜索

2025-04-08 16:39:34 1129

原创 CellHint：人类细胞图谱自动细胞类型协调与整合

cellhint：细胞类型协调与数据整合

2025-04-08 13:23:11 1047

原创 Aliee，Bengio and Theis：细胞数据上的因果机器学习

因果学习与单细胞

2025-04-02 22:11:32 1024

原创 TextGrad：案例

TextGrad案例

2025-03-28 21:39:47 809

原创 TextGrad：文本梯度优化生成式AI

TextGrad

2025-03-28 14:04:29 1047

原创未来基于参考映射的单细胞数据分析

参考映射的展望

2025-03-26 19:22:01 1054

原创 scNET：整合scRNA-seq和PPI用于学习基因和细胞的embedding

scNET

2025-03-24 23:05:27 1181

原创 Evo2：跨所有生命领域的基因组建模与设计

Evo 2

2025-03-20 22:12:53 1472

红楼梦人物图谱csv文件

红楼梦人物图谱csv文件

2023-08-30

nltk_data.rar

nltk的分词工具，将其解压，放置到当前虚拟环境（假设环境名为TORCH），则目录结构为"TORCH/nltk_data/tokenizers/punkt"

2021-01-22

随机森林评估特征重要性wine.rar

基于 UCI 葡萄酒数据，使用随机森林进行特征重要性分析，这些数据是对意大利同一地区种植的三种不同品种葡萄酒的化学分析结果，分析确定了三种葡萄酒中13种成分的含量，数据的第一列是葡萄酒的类别

2021-02-02

fasterRCNN口罩检测

使用fasterrcnn实现口罩检测，fasterrcnn基于keras搭建，训练需要口罩数据集，数据集必须是VOC格式，预测需要权重文件，权重文件已经存在

2020-05-26

基于朴素贝叶斯的垃圾邮件过滤data.rar

邮件数据包括训练集train（正常邮件normal，垃圾邮件spam），测试集test，中文停用词文件cn_stopwords.txt

2021-01-31

机器翻译nmt.zip

轻量级机器翻译数据集，en-cn为英文与中文，en-fr为英文与法文

2021-01-22

LR预测CTR数据集data.zip

数据集是电商领域数据集，共计200万的样本记录。原始特征均为ID类特征；字段说明： userid 用户ID itemid 商品ID categoryid 商品类目ID action 用户行为类型 timestamp 时间戳

2021-01-25

glove.6B.100d.txt.zip

glove.6B是斯坦福大学训练的词向量包(862MB)，glove.6B.100d是100维词向量，TEXT.build_vocab可以根据我自己的词汇表内的词匹配到glove内的词，组建成为需要的词向量；后面如果想使用这个新词向量，可以通过TEXT.vocab.vectors返回

2020-11-29

决策树预测用户流失data.csv

基于某信息公司的用户数据，使用决策树预测用户是否会流失，字段Churn代表客户是否流失，取值：['Yes', 'No']，其余字段为特征

2021-02-01

MNIST与FashionMNIST数据集

数据集包括了MNIST和FashionMNIST，有原始数据集raw和经过torchvision.datasets处理过的processed目录

2020-11-29

hymenoptera_data.zip

hymenoptera_data数据集，这个数据集包括两类图片, bees 和 ants, 这些数据都被处理成了可以使用"torchvision.datasets.ImageFolder"来读取的格式。

2020-12-02

google.csv

机器学习第六课，使用线性回归预测未来30天 Google 股票的收盘价走势，表格中的列代表每天的股票指数，如：Open 开盘价、High 最高价、Low 最低价、Volume 成交量。Adj. Open、Adj. High、Adj. Low、Adj. Close、Adj. Volume 代表调整后的数据

2021-01-15

mackey_glass_t17.npy

Mackey-Glass (MG)序列的部分内容，shape为(10000,)，这个时间序列是混乱的，没有明确的周期。级数不收敛也不发散，轨迹对初始条件高度敏感。这个基准问题用于神经网络和模糊建模研究。

2021-07-12

olivetti_py3.pkz

人脸图像数据集 olivetti_py3.pkz，该数据集一共有 400 张人脸图片，每张图片的大小是：64x64，每张图片作为一个样本，一共有 400 个样本，每个样本的特征维度是：64x64 = 4096；400 张图片一共包含 40 个不同的人，每个人有 10 张人脸图片

2021-02-13

Kaggle交易预测.rar

基于 Kaggle 竞赛数据，原始数据文件较大，故本数据集只选用了 train.csv 中的 5 万条样本作为模型训练集（train.csv.gzip），1 万条样本作为模型测试集（test.csv.gzip）

2021-02-17

TextSet.zip

该文件用于词向量训练，Skip-Gram训练，主要是texttrain.txt文件，训练细节见白景屹的Pytorch笔记本-第四课.词向量：https://blog.csdn.net/qq_40943760/category_10532835.html

2020-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除