- 博客(235)
- 资源 (1)
- 收藏
- 关注
原创 双Docker Oracle XE 跨库查询操作文档
本文介绍了在同一宿主机上部署两个Oracle XE 21c容器(db1和db2),通过Docker内网和Oracle DBLINK实现跨库联合查询的方法。主要步骤包括:创建Docker自定义网络连接两个容器;查询db2容器内网IP;在db1中创建DBLINK连接db2;执行跨库查询(示例为血脂相关数据查询)。文章还提供了常见问题解决方案,如网络连接问题、账号锁定、容量限制等注意事项,并说明查询结果需导出至本地文件以避免Oracle XE版本的12GB容量限制。
2026-06-08 09:28:50
265
原创 Oracle双库部署
本文介绍了Oracle XE数据库双库部署方案,以解决单库12GB容量限制问题。主要内容包括: 部署背景:Oracle XE版本存在单库12GB容量限制,导致大数据量导入失败(ORA-12954错误) 解决方案:通过Docker部署oracle-db1和oracle-db2双库,分别使用1521和1522端口,各自拥有12GB容量空间 实施步骤: 拉取Oracle镜像并创建两个容器 配置数据卷实现持久化存储 创建表空间和业务用户 处理常见错误(容器冲突、连接问题等) 数据导入:通过DMP文件分别导入两个数据
2026-05-11 12:48:38
405
原创 为您的预测模型打通临床落地“最后一公里”
当前,凭借专业积累研发的预测模型,凝聚了大量临床数据与开发者的科研心血,却可能因缺乏应用载体、决策指引及临床验证等关键支撑,迟迟无法从“科研成果”转化为“日常诊疗工具”。为此,我们打造了“技术开发+临床验证+价值落地”一体化服务,通过标准化流程与定制化设计相结合,助力预测模型突破临床应用壁垒,真正实现对诊疗决策的支撑价值,让科研成果切实服务于临床、惠及患者。本方案围绕预测模型临床转化核心需求,构建“载体开发-阈值确定-效能验证”全链条一体化服务体系,助力科研模型落地为临床实用工具。
2025-11-03 12:47:00
573
原创 预测模型构建技术路线:以甲状腺癌远处转移为例
在精准医疗浪潮下,临床预测模型已成为打通医学数据与临床决策的核心枢纽。以甲状腺癌远处转移筛查为例,131I-WBS与18F-FDG PET/CT虽为临床确诊的关键手段,但高达数千元的检测成本与仅2.4%的转移发生率之间的矛盾,使得"精准筛选高危人群"成为破解过度医疗的关键。明确模型的临床价值定位,关键在于厘清其在临床路径中的角色——本研究中模型的核心价值,正是为后续131I-WBS与18F-FDG PET/CT检查提供精准的前置筛选依据,形成"模型筛选-精准检测"的协同闭环。
2025-10-28 14:30:51
1028
原创 从入门到实操:贝叶斯分析完整技术步骤与核心R包指南
本文系统介绍了贝叶斯分析的完整技术框架与R语言实现,涵盖从数据准备到结果可视化的全流程。主要内容包括:1)贝叶斯分析的5个核心步骤:问题定义、先验设定、模型构建、诊断和后验推断;2)关键R包如brms、rstan、metaBMA和tidybayes的实操应用;3)针对不同场景(原始数据/Meta分析数据)的代码示例,包括信息先验构建、模型采样与诊断。文章特别强调先验分布设定的重要性,并提供了敏感性分析方法,帮助研究者规范开展贝叶斯分析。
2025-10-26 11:19:26
996
原创 贝叶斯统计结合机器学习在术后院内感染危险因素分析中的应用
本研究创新性地结合贝叶斯统计和机器学习方法,对术后院内感染危险因素进行系统分析。通过Boruta算法筛选出住院时长(LOS)和上臂肌肉面积(AMA)两个核心因素,采用贝叶斯逻辑回归量化关联强度,发现LOS每增加1单位感染风险升高42%。结合SHAP分析和立方样条回归,确定LOS超过6天为感染风险临界值,AMA在36.4-58cm²区间时感染风险最低。该研究为临床术后感染预防提供了科学依据,并建立了可复用的"数据采集-指标筛选-关联量化-阈值验证"分析框架。
2025-10-22 10:07:59
626
原创 预测模型类的“发表瓶颈”,临床影响力评价是解方?
临床预测模型研究面临发表瓶颈,核心问题在于模型难以临床转化。当前研究普遍存在三大短板:过度依赖统计指标而脱离临床需求、缺乏明确的临床应用场景、缺乏与传统方法的对比验证。破解之道在于构建"临床影响力评价"体系,通过"概率+DCA锚定临床阈值-APP实现临床整合-RCT验证实际价值"的三步法,形成完整研究闭环。这一转变不仅可突破发表困境,更能推动预测模型从实验室走向病床,真正服务于临床决策。
2025-10-21 13:14:05
494
原创 如何从已有的研究中选择先验
从已有研究中选择先验,本质是 “尊重历史证据,同时适配当前场景” 的过程。记住三个核心原则:筛选要 “严”:按证据等级和匹配度淘汰低质量、差异大的研究,确保先验来源可靠;提取要 “准”:根据参数类型选择正确分布,精准计算先验参数,避免数据误读;调整要 “柔”:用扩大方差、剂量换算、多研究整合等方法,包容研究差异,不强行套用;验证要 “全”:通过敏感性分析确保先验稳健,让后验结论既依托历史,又忠于当前数据。
2025-09-29 13:15:43
883
原创 使用无信息先验是否合乎贝叶斯分析的规范
核心结论:只要满足 “选择有依据、报告透明、与模型兼容”,使用无信息先验的贝叶斯分析完全合乎规范,尤其适用于无可靠先验信息的场景;实践建议:无可靠先验信息→用正确的无信息先验或软件默认弱信息先验;有可靠先验信息→优先用信息性先验;无论何种先验,均需详细报告先验细节,并做敏感性分析;最终提醒:贝叶斯分析的规范与否,取决于 “先验选择的逻辑自洽与透明性”,而非 “先验是否有信息”。拒绝 “无信息先验不规范” 的误区,根据研究实际场景选择合适的先验,才是科学的做法。
2025-09-29 12:30:29
922
原创 可信区间含 0 但分布偏侧?贝叶斯这样下结论
贝叶斯分析中常遇到可信区间含0但分布偏侧的情况。这通常由于样本不足或效应量较小所致。核心分析思路是:1)计算参数偏向某侧的概率(如>0的概率88%);2)结合最小重要效应量评估实际意义(如>0.2的概率75%)。结论应分三步:说明倾向性(如"88%概率为正关联")、评价实际意义(如"75%概率达临床阈值")、指出不确定性。相比传统"显著/不显著"二分法,贝叶斯通过概率量化提供了更丰富的信息。
2025-09-26 15:22:40
1200
原创 贝叶斯分析如何得出结论?从后验分布到临床决策
贝叶斯分析的核心逻辑是用概率说话,通过后验分布判断参数落在"有意义区间"的可能性。分析过程分为三步:首先必须验证模型收敛(通过迹图和R-hat值);其次解读后验分布,将系数转化为优势比(OR),用可信区间和概率描述关联性;最后结合临床阈值(如MCIOR、ROPE)将统计结果转化为实际结论。贝叶斯分析强调以概率量化关联性,而非非黑即白的假设检验,为决策提供清晰的信心程度。
2025-09-26 15:19:57
462
原创 新手入门:贝叶斯统计分析核心概念与结局类型专项指南
对新手而言,贝叶斯分析的核心优势在于“直接回答临床问题”——无需通过“p值”间接推断,而是直接量化“治疗获益的概率”(如“药物降低死亡率超过5%的概率为90%”),更贴合医生决策逻辑。
2025-09-03 11:47:50
1191
原创 贝叶斯分析中MCID概率计算
本文阐述了贝叶斯统计在计算最小临床重要差异(MCID)概率中的应用。核心思路是通过后验分布量化治疗效果达到MCID的可能性,而非给出单一结论。计算过程包括:定义疗效指标与MCID阈值、设定先验分布、构建似然函数、利用MCMC方法生成后验分布并计算概率。MCID概率越高,表明疗效越可信,为临床决策提供量化依据。相比传统方法,贝叶斯框架能整合先验信息、处理小样本不确定性,并支持动态更新结论,在临床评估中更具优势。
2025-08-28 10:28:14
955
原创 如何查询最小临床重要差异(MCID)
如何精准查询MCID 确定最小临床重要差异(MCID)需要系统性思考。首先需明确"量表+疾病"这一核心基础,因为不同量表和疾病场景下的MCID完全不同。接着要考虑四个关键补充因素:量表版本/适用人群的差异、MCID计算方法的不同、研究人群特征的差异以及临床干预目标的区别。要获得最准确的MCID,建议采取五步法:1)确定疾病和量表;2)确认量表细节;3)选择可靠计算方法;4)匹配人群特征;5)结合应用场景调整。查询时应使用更精准的关键词组合,避免直接套用通用数值。
2025-08-28 10:26:00
1838
原创 以Boruta算法为基础的特征选择方法
摘要: Boruta算法适合初步变量筛选,但需结合多重共线性处理(如VIF、相关性分析)和模型性能优化(如RFE、Lasso、树模型二次筛选)进一步精简特征。方法选择取决于场景需求:线性模型优先Lasso或VIF,非线性模型可用树模型重要性筛选,适配特定模型则推荐RFE。最终变量需兼顾统计显著性、模型性能与业务解释性,建议交叉验证不同方法结果并通过测试集确认。
2025-07-29 16:14:05
1398
原创 从meta分析结果提取先验信息用于新的医学RCT研究
这里实现的一个策略是,计划使用贝叶斯方法来分析RCT研究的数据,为了获取先验,使用meta分析来确定先验。如果已经有发表的Meta分析,但是Meta分析是采用传统的非贝叶斯方法进行的,可以重新使用贝叶斯方法进行分析,来确定先验;如果没有已经发表的Meta,则可以在文章里使用贝叶斯meta分析的方法来确定先验,作为新的文章的探索先验的一部分。本文以下所指的meta分析,都是贝叶斯meta分析,传统的meta分析可能需要更多的转化。通过统计软件可以方便地进行meta分析,使得整个策略具有更大的可行性。
2025-06-24 08:55:17
1161
原创 理解贝叶斯分析中的“模型比较”部分
在贝叶斯分析体系中,模型比较是一项至关重要的核心任务,而敏感性分析可被视作模型比较的重要分支。接下来,本文将系统地阐述模型比较的方法论,并着重探讨其与敏感性分析之间的区别与联系。
2025-06-22 11:56:05
584
原创 贝叶斯先验分布决定树(先验决定策略)
本文还是想解决先验确定的问题,毕竟先验的确定是贝叶斯分析的重中之重,关系到如何贝叶斯分析结果的确定性和结果的解释。有一篇综述中介绍了先验分布决策的流程,具有参考价值,在此介绍。参考文献: Larson C, Kaplan D, Girolamo T, Kover ST, Eigsti IM. A BayesianNov;37477577;
2025-06-21 09:42:25
1066
原创 从已经发表的元分析中获取先验数据并将其应用于贝叶斯分析
使用元分析中提取的均值和标准误来定义先验分布的参数。均值(μ):元分析的综合效应量。标准差(σ):元分析中效应量的标准误或方差的平方根。# 定义先验# 拟合贝叶斯模型prior = c(),# 查看模型摘要从已发表的元分析中提取先验数据并将其应用于贝叶斯模型,是一种有效利用现有研究成果的方法。通过合理选择和设定先验,可以增强模型的信息量和可靠性。务必确保先验的合理性和透明度,并通过敏感性分析和模型比较来验证先验的有效性。
2025-06-09 12:52:40
793
原创 通过meta分析确定先验并进行贝叶斯分析的构想
假设元分析得到的效应量均值()和标准差(sd_effect)可以作为回归系数的先验。常用的先验分布包括正态分布、学生t分布等。# 假设的元分析结果mean_effect <- 0.5 # 综合效应量均值sd_effect <- 0.1 # 综合效应量标准差# 定义先验通过元分析获取综合效应量及其方差,并将其作为贝叶斯模型的先验信息,可以显著提升模型的准确性和可靠性。进行元分析:收集相关研究,计算综合效应量及其方差。设定先验:将元分析结果转化为适当的先验分布,并应用于贝叶斯模型。验证和调整。
2025-06-09 12:39:20
1285
原创 贝叶斯医学分析中“先验”的如何进行选择(文献解读)
作者:Callum Taylor, Kathryn Puxty, Tara Quasim, Martin Shaw文章标题:Understanding Bayesian analysis of clinical trials: an overviewfor clinicians 期刊名称:Critical Care Science 发表年份:2025 卷号:37 页码:e20250267在实际医学数据分析中选择先验需遵循。
2025-06-08 16:35:44
1092
原创 贝叶斯定理与医学分析(t检验场景)
贝叶斯定理可以用在各种领域,在不同领域,先验和后验的定义会有所不同,所以需要具体进行研究。在医学领域, pubmed近年发表了多篇关于贝叶斯定理在医学数据分析中使用的综述性文章,体现了贝叶斯分析逐渐重要的地位。因为以P值为代表的频率统计学方法在我们心中根深蒂固,这里想通过展示贝叶斯方法在各种频率学方法的场景下的表现,在帮助理解贝叶斯方法的优势。贝叶斯主要属于参数型统计,观察某参数(先验),在新数据显的改变(后验);所以,贝叶斯适合的医学研究是以贝叶斯的结果作为主要结论的研究设计,比如随机对照研究设计。
2025-06-08 13:57:15
1039
原创 贝叶斯回归分析连续变量的结果的解释(对比分类变量)
贝叶斯回归分析在医学研究中具有独特优势,特别适用于连续变量分析。与传统的二分类变量分析不同,连续变量模型(如剂量与疗效关系)能提供更丰富的结论:包括剂量-反应关系的强度、方向和不确定性,特定剂量下的疗效预测,以及最优剂量区间的概率估计。贝叶斯方法直接量化概率结论(如"剂量增加1单位疗效提高0.2-0.5的概率为95%"),特别适合剂量探索、精准医疗等需要精细化治疗方案的场景。相比频率学派方法,贝叶斯回归在小样本、需要利用先验知识或回答概率问题时更具优势,为临床决策提供更直观的概率依据。
2025-06-04 15:24:21
1233
原创 使用Bambi包进行贝叶斯混合效应模型分析
本文系统介绍了使用Bambi包进行贝叶斯混合效应模型分析的全流程关键步骤。在建模前需通过数据探索、结构分析和变量预处理确保数据质量;建模中要合理设置模型结构、先验分布,并进行严格的MCMC收敛性诊断;建模后需通过方差分解、后验预测检查等方法验证模型合理性。文章还提供了常见问题(如不收敛、样本量不足等)的解决方案,并强调通过先验敏感性分析和可视化增强结果的可解释性。该指南为研究人员提供了从数据准备到模型优化的完整技术路线。
2025-06-02 20:41:01
948
1
原创 混和效应模型在医学分析中的应用
混合效应模型(多层/随机效应模型)在医学研究中广泛应用于处理层次结构数据,能同时分析固定效应(群体趋势)和随机效应(个体差异)。典型场景包括:1)纵向数据(如追踪血糖变化),处理缺失值并分析个体差异;2)多中心试验(如抗肿瘤药物研究),分离中心效应与治疗作用;3)家庭聚集性研究(如儿童肥胖),校正家庭相关性;4)生存分析(如术后生存期),结合随机效应;5)遗传研究(如基因表达),控制家系结构影响;6)诊断一致性评价(如CT阅片),量化观察者差异。其优势在于灵活性、效率及个体化解释,但需注意随机效应的正态性假
2025-06-02 20:07:58
1843
原创 AI 大模型辅助临床科研发表训练营
摘要: “AI大模型辅助临床科研发表训练营”由医研趣与和鲸社区联合推出,针对临床科研人员面临的时间紧张、技术门槛高、学习成本大等痛点,提供AI驱动的全流程论文撰写解决方案。训练营独创“支点原则”,通过规范化文献、统计结果等专业材料引导AI生成高质内容,覆盖科研规划、数据分析、可视化、论文撰写及格式整理五大场景。课程特色包括免提示词技巧、纯AI工具链操作及手把手教学,助力高效完成试验设计、图表生成、文献匹配等任务。适合各阶段科研人员提升效率,实现从数据到发表的智能化突破。 (注:摘要严格控制在150字内,突出
2025-05-24 09:40:25
620
原创 单细胞测序数据分析试验设计赏析(二)
接着,基于这些 Hub 基因,使用多种机器学习算法构建 AD 诊断模型,经 5 折交叉验证评估模型性能,选取最佳模型并用 SHAP 进行解释和可视化。还开展基因功能分析,涵盖 GSEA、免疫浸润分析、免疫检查点分析等,同时通过 RT-qPCR、数据库验证和单细胞转录组分析对基因功能进行实验验证。这次的单细胞测序数据分析的试验设计是单细胞测序分析+机器学习(with SHAP分析),也是常见的试验设计之一,重点是可以用于筛选鉴定基因调控网络,也可以是构建(基因)预测模型。
2025-05-04 15:10:16
1019
原创 单细胞测序试验设计赏析(一)
单细胞测序试验设计赏析(一)单细胞测序试验设计中,单细胞测序技术通常会结合其它的技术来共同说明问题,或者结合年龄、性别等临床数据,进行分层分析说明问题以下以发表文章来进行一定的分析。Abstract。
2025-05-03 21:27:02
1142
原创 单细胞测序数据分析流程的最佳实践
单细胞测试数据分析流程是整个论文数据分析过程中相对固定的部分,有一定的标准流程,以下整理了发表论文的相关内容供简要了解,详细内容可以参照2019年发表的综述:Luecken MD, Theis FJ. Current best practices in single-cell RNA-seq analysis: a tutorial. Mol Syst Biol. 2019 Jun 19;
2025-05-03 18:01:38
1904
2
原创 医生视角下转录组学的生物信息学分析
转录组学的生物信息学分析是医生解决临床与科研问题的有力工具。这里罗列医学转录组学相关的几个概念,从使用者(医生)的角度看待理解相关技术,为后续使用该技术说明临床和科研问题奠定基础。
2025-05-02 13:12:27
731
原创 举例谈谈数据收集的“主题性”
收集数据的技巧也是数据分析技巧的一部分。人口统计学信息:年龄(age,单位:years)性别(gender)住院相关:住院时长(the duration of the hospital stay)ICU 住院天数(ICU Hospitalization Days)临床结果相关:28 天的临床结果(clinical outcomes at 28 days)生命体征:心率(Heart Rate,单位:beats per minute)
2025-04-03 12:51:10
978
原创 一个卒中继发癫痫的数据集和初步分析
一、并发症uremia - 尿毒症dvt - 深静脉血栓形成fatty_liver - 脂肪肝疾病或肝脂肪变性diabetes - 糖尿病hypertension - 高血压coronary_disease - 冠状动脉疾病atrial_fibrillation - 一种心律失常,即心房颤动cerebral_hernia - 脑疝,大脑从正常位置移位的病症hydrocephalus - 脑积水,大脑中脑脊液过多的情况。
2025-04-02 15:32:22
1236
原创 模型解释的另一个选择--Dalex
当使用 type=‘dropout_loss’ 时,y 轴代表的是模型效能的变化,也就是移除某个特征后模型性能的下降程度。SHAP分析是最流行的模型解释的包,是模型解释的标杆,可以进行全局性解释和局部解释,对标SHAP,Dalex是另外一个功能比较齐全的python包,采用不同的算法,是SHAP之外的选择。条件依赖图展示了在特定特征值下,模型预测结果的分布情况。Dalex包功能是比较齐全,常用的全局性和局部性解释功能可以实现SHAP的功能,只是算法不同,而变量层面的解释功能,感觉可解释性不如SHAP。
2025-04-02 13:21:11
479
原创 交互作用分析体会总结
交互作用分析的内容不多,往往占的比重也不大,单独作为研究的主要内容并不适合,还是要和其他的研究进行整合。也不好说全对,供大家参考。三种交互作用分析的项目可以在和鲸社区搜索“交互作用”获得。
2025-03-30 11:18:54
481
原创 交互作用扫描的另外一个选择--vivid包(R)
之前的帖子使用了批量扫描变量间交互作用的包-iml的interaction函数,在其中“交互作用通过弗里德曼H统计量(H平方检验统计量的平方根)来衡量,其取值范围在0(无交互作用)到1之间(1表示因交互作用导致的f(x)标准差达到100% )”。如下图所示(图中变量并没有交互作用)。除了iml包,vivid包也是一个可以进行交互作用扫描的R包,并且提供了更加丰富的可视化选择,在这里进行介绍。虽然常听说交互作用分析,但是在个人尝试的几个医学数据集中还没有发现明显的交互作用,所以在此只做技术上的探讨。
2025-03-26 12:28:23
332
原创 从技术角度看交互作用分析
以上步骤整合在一起,SHAP分析中对交互作用的筛查,结合传统的使用P值对交互作用进行定性,形成一个相对完整的交互作用分析过程。还有interactionR和epiR包可以用来进行交互作用的分析,要求参与分析的两个变量是二分类变量,可以尝试进行探索。
2025-03-19 16:41:05
623
原创 绘制列线图并解释线性模型的Python包-nomogram-explainer(记我的第一个pypi项目)
SHAP分析是目前可以对预测模型同时进行全局性和局部性两种解释唯一的包,其它的包要么仅能进行局部解释,比如LIME,要么只能进行全局性解释,比如xgboost的变量重要性。列线图(算法)是展示线性模型的一种算法,目前在了解该算法的基础上,我用python的pyplot包绘制了列线图,过程中发现该算法可以发展成为解释线性模型的工具,且可以进行全局性和局部性解释。撰写相关代码期间,也曾分享过代码,但是总觉得不够方便,最后,在AI的辅助下,也终于把相关的代码上传到pypi来发布。绘制列线图,使用plotly包构建
2025-03-09 20:04:49
1055
《一个临床数据收集/调查问卷APP》配套源代码
2024-10-28
依托SHAP值的COX版本的变量间关系描述:boruta+treeshap+立方样条拟合
2024-10-08
shiny APP 实现 tidymodels代码驱动的xgboost 模型构建、超参数调节和后概率校准
2024-10-08
食管癌远处转移机器学习web app+shiny源代码+R语言
2024-08-29
构建的Boruta+SHAP分析+立方样条回归R语言shiny应用
2024-05-08
yuce-1.0-armeabi-v7a-debug.apk
2021-07-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅