桓峰基因
码龄7年
关注
提问 私信
  • 博客:715,887
    视频:36
    715,923
    总访问量
  • 339
    原创
  • 7,197
    排名
  • 2,155
    粉丝
  • 93
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:黑龙江省
  • 加入CSDN时间: 2017-12-12
博客简介:

weixin_41368414的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    7
    当前总分
    3,018
    当月
    8
个人成就
  • 获得1,601次点赞
  • 内容获得116次评论
  • 获得5,961次收藏
  • 代码片获得17,640次分享
创作历程
  • 69篇
    2024年
  • 83篇
    2023年
  • 181篇
    2022年
  • 1篇
    2019年
  • 7篇
    2018年
成就勋章
TA的专栏
  • 肿瘤克隆进化生信分析
    15篇
  • 软件下载
  • SCI文章撰写技巧
    2篇
  • SCI 文章绘图
    27篇
  • 临床预测模型构建统计学分析方法
    23篇
  • 基因组分析
    16篇
  • RNA数据分析
    31篇
  • 单细胞系列
    17篇
  • scATAC-seq
    1篇
  • 机器学习
    13篇
  • 科研神器推荐
    2篇
  • 文章思路推荐
    14篇
  • LaTex写文章
    1篇
  • 甲基化分析
    3篇
兴趣领域 设置
  • Python
    python
  • 数据结构与算法
    最小二乘法
  • 大数据
    spark
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

ML 46. 机器学习之利用SHAP解释模型特征变量的重要性

简 介在许多应用中,理解一个模型为什么会做出某种预测是至关重要的。然而,对于大型现代数据集,最好的准确性通常是通过复杂的模型来实现的,即使专家也很难解释,比如集成或深度学习模型。这造成了准确性和可解释性之间的紧张关系。作为回应,最近提出了各种方法来帮助用户解释复杂模型的预测。在这里,我们提出了一个统一的框架来解释预测,即SHAP (SHapley Additive exPlanations),它...
原创
发布博客 2024.10.25 ·
856 阅读 ·
20 点赞 ·
2 评论 ·
9 收藏

IF 14+ 系统性解剖30种癌症的1000个肿瘤的肿瘤-正常单细胞生态系统

这期分享一篇2024年5月发表于 Nat Commun (IF 14+)的文章,作者基于系统解剖肿瘤-正常单细胞生态系统横跨30种癌症类型的1000个肿瘤。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要肿瘤微环境的复杂性对肿瘤治疗提出了重大挑战。在这里,为了全面研究肿瘤-正常生态系统,我们对来自 1070 个肿瘤和 493 个正常样本的 490 万...
原创
发布博客 2024.10.17 ·
762 阅读 ·
16 点赞 ·
0 评论 ·
22 收藏

IF 25+ 单细胞测序揭示胆囊癌发病机制中的微环境动力学和免疫调节因子

这期分享一篇2024年8月发表于 Gut (IF 25+) 的文章,作者基于单细胞测序揭示胆囊癌发病机制中的微环境动力学和免疫调节因子。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要**目的:**了解胆囊癌及胆囊良性疾病的复杂生态系统和分子特征,是开展前瞻性癌症预防和优化治疗干预的关键。**设计:**我们对来自 15 例 GBCs、4 例胆囊炎、...
原创
发布博客 2024.10.15 ·
598 阅读 ·
27 点赞 ·
0 评论 ·
12 收藏

IF 10+ 泛癌症单细胞转录图谱上癌症相关成纤维细胞的分子分类

这期分享一篇2023年10月发表于 Clin Transl Med (IF 10+) 的文章,泛癌症单细胞转录图谱上癌症相关成纤维细胞的分子分类。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要背景:肿瘤相关成纤维细胞 (CAFs) 是肿瘤微环境不可或缺的一部分,在癌症进展中起着关键作用,表现出促肿瘤或抗肿瘤的功能。其固有的表型和功能多样性允许将 ...
原创
发布博客 2024.10.14 ·
851 阅读 ·
7 点赞 ·
0 评论 ·
9 收藏

IF 10+ 11种ML识别和验证危重儿童急性肾损伤可解释预测模型。

这期分享一篇2024年2月发表于 eClinicalMedicine (IF 10+) 的文章,基于11种机器学习方法识别和验证危重儿童急性肾损伤可解释预测模型。摘 要背景:急性肾损伤 (Acute kidney injury, AKI) 是危重儿童常见的严重器官功能障碍。AKI 的早期识别和预测具有重要意义。然而,目前的 AKI 标准不够敏感和特异性,而且 AKI 的异质性限制了 AKI ...
原创
发布博客 2024.10.12 ·
728 阅读 ·
16 点赞 ·
0 评论 ·
24 收藏

IF 14+ 单细胞测序揭示类风湿关节炎滑膜淋巴细胞亚群与功能状态的克隆关系

这期分享一篇2024年5月发表于 Nat Commun (IF 14+) 的文章,作者基于单细胞测序研究类风湿关节炎滑膜淋巴细胞亚群与功能状态的克隆关系。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要类风湿性关节炎 (RA) 是一种涉及抗原特异性 T 细胞和 B 细胞的自身免疫性疾病。在这里,我们对 12 名血清阳性 RA 患者的成对滑膜组织和血液...
原创
发布博客 2024.10.09 ·
1051 阅读 ·
25 点赞 ·
0 评论 ·
23 收藏

IF: 27+多组学分析显示TRAP1/CAMSAP3的细胞在早期子宫内膜癌中的预后

这期分享一篇2024年6月发表于 Molecular cancer (IF 27+)的文章,作者基于多组学分析显示,具有新型致癌簇TRAP1low/CAMSAP3low的细胞在早期子宫内膜癌中表现出更强的侵袭性行为和更差的预后。该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!摘 要早期子宫内膜癌(EC)的临床异质性值得进一步研究,以确定高质量的预后标志物及其...
原创
发布博客 2024.10.01 ·
890 阅读 ·
22 点赞 ·
0 评论 ·
9 收藏

RNA 46. 基于转录组识别可变剪切和异构体开关(IsoformSwitchAnalyzeR)①

简 介可变剪接 (Alternative splicing) 是参与健康和疾病的重要机制。最近的工作强调了研究剪接模式的全基因组变化和随后的功能后果的重要性。目前的计算方法只支持这种基于基因的分析。因此,扩展了 IsoformSwitchAnalyzeR 库,以分析特定类型的选择性剪接的全基因组变化,并预测由此产生的异构体开关的功能后果。作为一个案例研究,分析了来自癌症基因组图谱的 RNA-s...
原创
发布博客 2024.09.11 ·
579 阅读 ·
4 点赞 ·
0 评论 ·
8 收藏

RNA 45. 基于转录组的分段筛选DEG/DET/DTU(stageR)

简 介具有复杂设计和转录分辨率分析的 RNA 测序研究涉及每个基因的多个假设;然而,传统的方法无法在基因水平上控制错误发现率 (FDR) 。提出 stageR 一种两阶段测试范式,利用聚合基因水平测试的增强能力,并允许对重要基因进行事后评估。这种方法提供了基因水平的 FDR 控制,并提高了测试相互作用效应的能力。在转录水平分析中,提供了一个框架,执行强大的基因水平测试,同时维持转录水平分辨率的...
原创
发布博客 2024.08.19 ·
1000 阅读 ·
13 点赞 ·
0 评论 ·
12 收藏

RNA 44. 基于单细胞/bulk转录组的转录本差异分析(satuRn)

简 介可变剪接从单个基因中产生多个功能转录物。已知剪接失调与疾病有关,并且是癌症的标志。现有的差分转录使用 (DTU) 分析工具要么缺乏性能,要么不能解释复杂的实验设计,要么不能扩展到大规模的单细胞转录组测序 (scRNA-seq) 数据集。引入了 satuRn,这是一个快速灵活的准二项广义线性建模框架,它与来自大量 RNA-seq 领域的最佳 DTU 方法相当,同时提供了良好的 FDR 控制...
原创
发布博客 2024.08.18 ·
797 阅读 ·
22 点赞 ·
0 评论 ·
16 收藏

RNA 43. 基于转录组的外显子差异分析(DEXSeq)

简 介RNA-seq 是研究选择性剪接和其他形式的选择性异构体表达的有力工具。了解这些过程的调节需要在不同条件、细胞类型或组织之间的比较中对差异异构体丰度进行敏感和特异性的检测。提出 DEXSeq 一种在 RNA-seq 数据中测试差异外显子使用的统计方法。DEXSeq 使用广义线性模型,并通过考虑生物变异提供可靠的错误发现控制。DEXSeq 检测高灵敏度基因,在许多情况下外显子,受差异外显子...
原创
发布博客 2024.08.16 ·
822 阅读 ·
23 点赞 ·
0 评论 ·
25 收藏

SEQ 10. 真核生物蛋白质的亚细胞定位(DeepLoc)

简 介蛋白质亚细胞定位的预测对蛋白质组学研究具有重要意义。在这里,我们建议对流行的工具 DeepLoc 进行更新,以进行多定位预测并改进性能和可解释性。为了进行训练和验证,我们整理了具有严格同源性分区的真核和人类多位置蛋白质数据集,并丰富了从文献中汇编的排序信号信息。我们通过使用预训练的蛋白质语言模型在 DeepLoc 2.0 中实现了最先进的性能。它的另一个优点是它使用序列输入而不是依赖较慢的...
原创
发布博客 2024.08.14 ·
1167 阅读 ·
16 点赞 ·
0 评论 ·
19 收藏

SEQ 9. α-螺旋和 β-桶跨膜蛋白的预测(DeepTMHMM)

简 介跨膜蛋白跨越脂质双分子层,分为两种主要结构类,即螺旋状和桶状。我们介绍了 DeepTMHMM,这是一种基于深度学习蛋白质语言模型的算法,可以以前所未有的精度检测和预测 α-螺旋和 β-桶跨膜蛋白的拓扑。DeepTMHMM 可扩展到蛋白质组,并涵盖生命的所有领域,这使其成为宏基因组学分析的理想选择。在过去的几年中,使用深度学习方法进行蛋白质结构预测已经取得了一些进展。在这个项目中,我们研究...
原创
发布博客 2024.08.09 ·
571 阅读 ·
4 点赞 ·
0 评论 ·
5 收藏

SEQ 8. 蛋白序列结构的无序性预测(IUPred2A)

简 介蛋白质的结构状态包括有序的球状结构域以及本质上无序的蛋白质区域,这些区域作为高度灵活的构象集合体孤立存在。已经开发了各种计算工具来区分基于氨基酸序列的有序和无序片段。然而,IDR 的性质也可以取决于各种条件,包括与球状蛋白伴侣的结合或环境因素,如氧化还原电位。这些案例为无序段的计算表征提供了进一步的挑战。因此,提出了 IUPred2A,这是一个组合的web界面,允许生成基于 IUPred...
原创
发布博客 2024.08.08 ·
990 阅读 ·
21 点赞 ·
0 评论 ·
25 收藏

SEQ 7. 蛋白序列的结构特征预测(NetSurfP3)

简 介机器学习和自然语言处理的最新进展使我们能够深刻地提高准确预测蛋白质结构及其功能的能力。虽然这些改进对生物学和生物技术领域产生了重大影响,但这些方法在计算能力和运行时间方面有很高的要求,阻碍了它们对大型数据集的适用性。在这里,我们介绍NetSurfP-3.0,预测溶剂可及性的工具,二级结构,结构无序和主干二面角的氨基酸序列的每个残基。这次NetSurfP更新利用了预训练蛋白质语言模型的最新...
原创
发布博客 2024.08.07 ·
1123 阅读 ·
13 点赞 ·
0 评论 ·
27 收藏

SEQ 6. 蛋白序列的信号肽预测(SignalP)

‍‍简 介信号肽(SPs)是一种短的氨基酸序列,在所有生物体中控制蛋白质分泌和易位。SPs可以从序列数据中预测,但现有的算法无法检测到所有已知类型的SPs。我们介绍SignalP6.0,这是一个机器学习模型,可以检测所有五种SP类型,并适用于宏基因组数据。SignalP 在线分析工作流程:a、五种SP类型的区域结构。b、蛋白质LM训练程序。c、预测训练前蛋白质表示的t-分布随机邻居嵌入(t-S...
原创
发布博客 2024.08.06 ·
2150 阅读 ·
22 点赞 ·
0 评论 ·
30 收藏

SEQ 5. 转录本蛋白编码能力预测(CPC2)

简 介随着新一代测序技术的进步,在大量生物体中发现了许多新的转录本。为了快速、准确地评估RNA转录物的编码能力,将编码势计算器CPC1升级为CPC2。CPC2的运行速度比CPC1快 ~ 1000倍,与CPC1相比具有更高的准确性,特别是对于长的非编码转录本。此外,CPC2的模型是种中性的,这使得它可以用于不断生长的非模式生物转录组。可以在线分析,也可以下载独立包进行本地安装分析。CPC...
原创
发布博客 2024.08.01 ·
513 阅读 ·
5 点赞 ·
0 评论 ·
10 收藏

SEQ 4. 转录本蛋白编码能力预测软件(CPAT)

简 介深度转录组测序能够检测数千个新的转录本。这一发现大而“隐藏”的转录组重新激活了对能够快速区分编码和非编码 RNA 的方法的需求。在这里提出了一种新的无比对方法,编码潜在评估工具( CPAT) ,可以快速识别来自大量候选转录本的编码和非编码转录本。为此,CPAT 使用了一个 Logistic 回归模型,该模型包含四个序列特征:开放阅读框大小、开放阅读框覆盖率、Fickett TESTC...
原创
发布博客 2024.07.30 ·
545 阅读 ·
4 点赞 ·
0 评论 ·
3 收藏

SEQ 3. pfam数据库的注释及本地分析 (pfam_scan)

简 介Pfam数据库是一个蛋白质家族的大集合,每个家族都由多个序列比对和隐马尔可夫模型(hmm)表示。蛋白质通常由一个或多个功能区组成,通常称为结构域。不同的结构域组合产生了自然界中发现的各种各样的蛋白质。因此,鉴定发生在蛋白质内部的结构域可以深入了解其的功能。Pfam还生成相关条目的高级分组,称为宗族。宗族是由序列、结构或剖面的相似性联系在一起的Pfam条目的集合。每个条目的数据都是基于U...
原创
发布博客 2024.07.29 ·
1103 阅读 ·
4 点赞 ·
0 评论 ·
9 收藏

SCS 43. 单细胞数据中细胞群的纯度/异质性计算(ROGUE)

简 介单细胞RNA测序(scRNA-seq)是一种发现和注释细胞类型和状态的通用工具,但细胞亚型的确定和注释往往是主观的和任意的。通常甚至不清楚给定的群集是否均匀。在这里提出了一个基于熵的统计,ROGUE以准确地量化鉴定细胞团的纯度并证明ROGUE指标是广泛适用的,并且能够在广泛的模拟和真实数据集上对聚类纯度进行准确,敏感和稳健的评估。将这一指标应用于成纤维细胞、B细胞和大脑数据,确定了额外...
原创
发布博客 2024.07.22 ·
1555 阅读 ·
11 点赞 ·
0 评论 ·
24 收藏
加载更多