愿航-CSDN博客

研究19 种代谢相关生活方式和临床危险因素与 DSC （食管癌、胃癌、结直肠癌、肝细胞癌、胆道癌和胰腺癌）之间的关联。结果发现喝酒是胃癌 (odds ratio (OR) = 0.95;95% confidence interval (CI): 0.93–0.98)与肝癌 (OR = 1.11;95% CI: 1.05–1.18)的危险因素，咖啡消耗是肝癌的保护因素。甘油三酯与胆道癌风险降低相关（OR=0.53;95%CI：0.34-0.81），尿酸与胰腺癌风险相关（OR=0.59;

2024-07-09 13:06:01 382

原创孟德尔随机化--痛风与多组学

这篇文章做的话感觉还是较简单的，可能就是有自己的数据。从代谢组入手，再到孟德尔随机化分析。

2024-07-07 22:33:27 360

原创孟德尔随机化中介-痛风与受教育程度

昨天看到文献，称饮酒与痛风无关联，甚是疑惑，今天刚好看了一篇新文献，虽然不是主要讲饮酒与痛风的，但也有牵扯到这方面内容，而且是相反的内容，特记录一下。

2024-07-07 14:08:03 321

原创孟德尔随机化 --痛风与酒精消耗量

最近看了微信公众号，jimmy谈到生信与基础之间，个人觉得生信与基础技术是无高低之分的，本质上都是科研中为了证实结果的一个工具。生信的实质是用计算机分析数据，接触基础比较好，感觉是实验操作。分析上游为实验（数据来源），实验下游为分析，二者并无高低之分。要做好科研，技术是必备的，但科研思路更为重要。没有思路，没有立意，没有生物学故事，光有技术只是个各个PI的工具人。如何培养科研思路？无他，从文献中学，从文献中总结。综述是你了解一个领域的快速方法，帮你塑造框架。具体的研究文章，则往里添加血肉。

2024-07-06 23:05:44 777

原创 TCGAbiolinks包学习

由于别人提醒我TCGA的数据可以利用TCGAbiolinks下载并处理，所以我决定阅读该包手册，主要是该包应该是有更新的，我看手册进行更新了，所以也许这是一个值得学习的包。

2024-06-15 11:04:56 343

原创 TCGA临床及肿瘤信息解读

地址：https://docs.gdc.cancer.gov/Data_Dictionary/viewer/#?

2024-02-29 09:42:26 974

原创肺癌相关文献7

IF:4.4 中科院分区:2区生物学WOS 分区:Q1。

2024-01-29 11:08:28 405

原创肺癌相关文献6

IF：6.0 中科院分区:2区生物学WOS分区：Q1被引次数： 4背景：癌细胞具有无限期自我更新和增殖的能力[2]。在一部分癌细胞中获得干细胞样特征可促进细胞的持续增殖和去分化。此外，消除非干细胞但不消除干细胞可赋予癌症抗性和复发性。干细胞样和非干细胞样癌细胞的混合赋予肿瘤内异质性（ITH）。此外，对免疫消除的抵抗已被证明是干细胞样癌细胞的一种特性[3]。

2024-01-23 11:44:46 1031

原创肺癌相关文献5

IF:4.6 中科院分区:2区综合性期刊。

2024-01-23 10:15:18 364

原创肺癌相关文献4

癌症干细胞是肿瘤组织中极少数的肿瘤细胞，具有无限增殖、自我更新和多向分化等生物学特性，可以在该肿瘤中形成一系列异质的细胞群[6,7]。研究发现，癌症干细胞表面表达多种ABC转运蛋白[8]，可有效将化疗药物转运至细胞外，从而减少化疗药物对细胞的损伤;此外，癌症干细胞强大的修复能力可以最大程度地修复损伤[9]。因此，肺癌干细胞的存在是肺癌患者存活率低、对常规放化疗抵抗力强、手术或放疗后易复发的主要原因之一[10]。

2024-01-18 19:49:49 368

原创肺癌相关文献3（内有一篇铜死亡干性文章）

通过整合LUAD患者的单细胞和bulk-RNA测序数据来鉴定铜死亡相关的干性基因（CRSGs）。随后，采用一致聚类分析对铜死亡相关干性亚型进行分类，并采用LASSO-Cox回归构建预后标志。还研究了预后标志与免疫浸润、免疫治疗和干性标志之间的关联。

2024-01-18 09:04:58 952

原创肺癌单细胞文献阅读2

文章数据：11 LUAD primary tumor (PT) ，10 BM samples (GSE131907)采用拷贝数变异（CNV）和克隆性分析来说明BM肿瘤的细胞起源。通过伪时间轨迹分析鉴定脑转移相关上皮细胞（BMAEC）。通过使用机器学习算法，开发了BM指数，该指数代表了bulk - RNA-seq数据中BMAECs的相对丰度，揭示BM高风险。基于癌细胞系药物敏感性数据来预测BMAEC的靶向药物。

2024-01-16 21:19:34 871

原创肺癌单细胞文献阅读1

看点肺癌生信文献吧，只写点不了解的部分和觉得我认为有必要的部分，其余略过。

2024-01-15 14:43:54 940

原创阅读文献-胃癌

今天先不阅读肺癌的了，先读一篇胃癌的文章。

2024-01-13 22:12:55 1015

原创肺癌文献阅读2

IF:6.2 中科院分区:2区医学WOS 分区:Q1之前有了解到新辅助治疗与辅助治疗都是在术前为增加疗效而进行的，这篇文章讲到I-III期的NSCLC更倾向于切除，这个时间点可分为早期与晚期。这个III期应该不包括B登记，因为后面讨论还有一句“ IIIB NSCLC patients who were often deemed unresectable”。文章提出有文献称在 IIIA 、IIB 阶段术前进行新辅助化疗更有益，但在更低阶段时就不明确了。

2024-01-11 22:05:08 428

原创肺癌文献阅读

该篇文章研究的是小细胞肺癌，与前两篇不一致，本文是由4个要点，METTL3 、线粒体自噬、m6A、化疗耐药。

2024-01-10 22:24:02 390

原创中国肺癌情形

风险因子：吸烟史、家族史、放射暴露、空气污染、慢性肺病晚期PD-1/PD-L1抑制剂单药使用或联合化疗药物作为标准治疗。局部肺癌晚期，建议化疗后免疫治疗。可切除的建议辅助免疫治疗和新辅助化疗。

2023-12-24 15:42:21 421

原创肺癌相关知识+免疫细胞知识

大概想了解下肺癌相关的知识，开此贴做记录，看看后续有没有相关的生信文章思路。

2023-12-21 22:32:54 974

原创空间转录组

尝试尝试理解空转参考：1.Seurat空间转录组分析（一）数据读入：https://mp.weixin.qq.com/s/06qiP4_yE8UOvXt4eP6org很全2.

2023-08-21 12:44:05 279

原创 Error in x$terms : $ operator is invalid for atomic vectors

后面发现模型具体参数需要显示出来，像下面这样子就可以了，但是又会出现新问题，应该是无法拟合或拟合不精确。在做nomo图的时候报的错。

2023-05-20 16:58:09 365

原创孟德尔随机化--研究

看了一些孟德尔随机化内容，大概整理一下步骤参考博文：https://mp.weixin.qq.com/s?

2023-03-31 00:03:33 6469 1

原创 endnote自己使用心得

毕业季，大概会遇到插入文献的问题，基本就是中文的etal改成等号，以及各种期刊格式修改，开此贴暂做记录，给自己做的，其他人请移步，因为我写的会比较粗糙。

2023-03-21 10:20:25 581

原创 EXCEL之我在数据处理常用的函数

单纯自己工作处理的记录

2023-01-31 12:11:23 123

原创关于机器学习样本不均衡的思考

文章目录1.写在前面2.参考资料3.正题3.1 什么是样本不均衡3.2 样本不均衡会带来什么问题3.3 对于样本不均衡有哪些处理方法1.上采样法2.下采样法3.修改损失权重新问题1.样本不均衡不会导致模型只学习到类别比较的数据，从而也实现较好的分类效能2.我对样本进行上采样，怎么就容易过拟合了3.1.写在前面写作目的：主要是昨天在汇报时，听同门讲样本不均衡的问题，忽然意识到在机器学习中这应该是个问题，所以特地查资料，记录一下，并以此作为自己的心得2.参考资料样本不均衡处理方法 https://mp.

2022-12-15 17:02:16 457

原创处理tcga突变数据一点思考

生物信息学tcga数据处理的一些思考

2022-08-22 16:54:42 1970

原创 WGCNA

写在前面前前后后大概折腾了三次WGCNA了，每次都是写完代码就丢，结果每次都要重新再搜，重新再写，这次学聪明了，直接把代码贴这么吧结果自己大概基本整个流程#########基本设置options(stringsAsFactors = F)rm(list = ls()) if (TRUE){ library(data.table) library(tidyr) library(dplyr) library(tibble) library(caret) library(l

2021-10-01 09:41:38 509

原创关于cox单因素与多因素分析

#写在前面说来惭愧，跟师姐聊天的时候，我按照传统的生信思路把临床特征做风险打分，然后定义高低风险打分，接着就是标准的生存图、森林图了。在做到森林图的时候，忽然被问到，单因素与多因素的区别。我按照原有的知识体系说是单因素就单个变量与生存的cox回归，而多因素则是将单因素显著的部分提取出来作为自变量做cox，也就是说多因素的cox是有多个自变量的。当被问到为什么要做多因素时，我想了一下说是为了去除共线性的问题，也就是a再做单因素分析时可能为显著，但是是其他变量带来的协同效应，所以再进入多因素cox回归后，如果

2021-07-14 14:38:04 11363 2

原创生物信息学常用数据库

写在前面说来惭愧，感觉读到研究生，说来说去张口闭口也就是TCGA、GEO、ARRAYEXPRESS、GTEX数据库，感觉还不如一些临床医生自学生物信息学的，平常都没去探索一些新的数据库，这边做个记录.黑色部分代表我查到的简介，而红色部分则表示我的个人看法GEO数据库GEO数据库全称GENE EXPRESSION OMNIBUS，是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它收录了世界各国研究机构提交的高通量基因表达数据，目前已经发表的论文中涉及到的基因表达检测的数据可以通过这个数据

2021-07-08 16:41:27 14946

原创代码-备份（检验数据）

# 载入包if (TRUE){ library(survival) library(survminer) library(randomForestSRC) library(timeROC) library(data.table) library(tidyr) library(dplyr) library(tibble) library(caret)}# 开始使用临床血液数据吧# load dataoptions(stringsAsFactors = F)r

2021-07-07 18:58:44 194

原创 ggsurvplot的p值到底是如何计算的

写在前面如题，大概就是为了探索这个ggsurvplot函数的p值是如何计算的，首先调用命令 fit <- survfit(Surv(DFS,status)~Group,score_v) ggsurvplot(fit, palette = 'jco', size=1.3, pval=TRUE, pval.method = TRUE, legend.labs=c("Hi

2021-07-05 16:03:45 3882

原创 autoGluon-教程3-在kaggle竞赛中的应用

文章目录写在前面安装必要的模块和文件1.模块2.文件下载数据读取数据训练模型训练过程评估模型效果测试集准备提交材料提交结果写在最后写在前面这篇接上一篇教程2，终于要看到autogluon在竞赛中的应用了。安装必要的模块和文件1.模块pip install kaggle 2.文件下载API文件，通过在kaggle个人账号，点击头像然后会得到一个kaggle.json文件，如果你是用kaggle cli 工具时，且你的电脑是Linux,OSX或其他基于UNIX系统时，把这个文件放置在~/.

2021-06-26 10:23:56 1423

原创 AutoGluon-教程2-提升更高精度

AutoGluon-教程2-提升更高精度写在前面订正训练模型（加入验证集）选定特定分类器如何获取指定分类器的参数额外部分输出预测概率在测试集上定义其他输出标准拟合过程中发生了什么更高的输出精度定义搜索空间训练结果模型的解释性（特征的重要性）减少时间操作删除模型中部分分类器将交叉验证的模型整合到一块去参数部分碰到内存不够怎么办硬盘空间不够怎么办写在后面写在前面接上一节喽，链接：订正关于predict.显示的模型一般是最优模型，而最优模型可由predictor.get_model_best()获得训练

2021-06-26 10:23:21 4990 1

原创 AutoGluon-教程1-简单的入门模型

写在前面因为本人实在是懒，而且有关于机器学习和深度学习的基础知识不是很牢固，但又想着借着人工智能高大上的旗号整出一些好玩的模型，这边听说有一个模块能简简单单的就构建出深度学习模型，而且调参出的效果还比较好,碍于网上没啥教程，那我能怎么办，自己边看边写喽。参考链接：github源码地址：https://github.com/awslabs/autogluon官网教程：https://auto.gluon.ai/stable/index.html安装目前该模块只适用于Linux与Mac系统,wind

2021-06-26 10:23:00 9879 3

原创装包seurat、singR

写在前面最近想写下关于单细胞的，但第一步就是安装seurat，我现在的R版本是3.6.1，我看了一下官网seurat4.0的版本是需要4.0以上的R的，所以我在试下怎么能成功参考文献安装RTools https://mp.weixin.qq.com/s?src=11&timestamp=1623218781&ver=3119&signature=L-7QyvFkRtJebmjY7wHKfBA4RKdKcziBMlhDe2JzkfwylqaR5DHHAP72EA57LthJML1

2021-06-09 21:21:05 1623

原创生信-单细胞数据处理

文章目录写在前面写作来源开始为什么要用单细胞测序原始数据产出形式单细胞基本流程一些背景知识点为什么不使用RPKM等类似的统计量CV（标准差/均值）单细胞的样本配置质控部分标化问题tsne与pca为什么要去除核糖体和线粒体UMI，indrops`, `SEQC`, `zUMIs原理与流程应用方向R包需求等环境的设置R包的安装代码实操第一步：过滤(基因过滤，阈值：5%（**非硬性**）)+提取批次信息+聚类的分组模式第二步：观察批次效应(PCA)导入数据（seurat包）质量控制（样本与基因，严格点的需要线粒体

2021-06-08 18:14:47 6634

原创代码（2）：聚类图以及PCA图

写在前面帮忙处理数据时，拿到数据第一件事就是看下所谓之前的分组是不是合理的有效，如果不合理有效又应该如何呢？这是一个非常重要的问题。聚类图d <- dist(t(logCPM), method = "euclidean")# 聚类,类之间还是没有分开，这个说明了什么问题，这个说明的是个体的差异比加药后的差异大# for 循环批量计算聚类并绘图for (i in c("complete","average","ward.D")) { hc1 <- hclust(d, method

2021-05-31 15:30:26 1221

原创代码（1）：热图

写在前面大概就是找差异基因，这部分差异基因随着不同组别值表达上升，然后这部分差异基因还得是免疫相关基因。最后用热图展示出来免疫基因免疫基因可以在immport数据库中下载通路可以在kegg上寻找代码# load dataoptions(stringsAsFactors = F)rm(list = ls())pwd = "E:\\process\\"setwd(pwd)library(readr)library(dplyr)data = read.csv("exp.txt",head

2021-05-27 15:55:28 1322 2

原创警醒

1做数据分析的也一样，各种各样的算法层出不穷，软件也五花八门，各说各有理，也没有一个统一的方法和标准，不也就是一小搓程序猿们的狂欢么。还有现在超火的单细胞测序，各种CNS满天飞，好多作者连基本的免疫学背景都没有，就单靠数据本身就给细胞分成那么多乱七八糟的群，不同的文章数据甚至不能互通，根据的标准和算法都不一致，最后也没有什么实际结论，简直是笑话，在我们传统做免疫的人看来都是一堆堆的垃圾擦腚纸而已！也就是其实做生信分析需要有一定的免疫知识，一定的生物学背景以及一定的医学背景。2唉，作为一个从实验科学转

2021-05-24 10:40:52 108

原创 win10下的RNA测序（二）

写在前面这部分讲的是根据上游得到的counts数做差异分析以及通路富集读入文件options(stringsAsFactors = F)rm(list = ls())pwd = "E:\\process\\"setwd(pwd)library(readr)library(dplyr)data = read.csv("exp.txt",header = T,sep = "\t", fill=T,stringsAsFactors=F,skip = 1)data

2021-05-24 09:45:35 518 1

空空如也

空空如也