自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Debroon

闲下来就写点东西。

  • 博客(649)
  • 资源 (46)
  • 问答 (1)
  • 收藏
  • 关注

原创 CRE-LLM:告别复杂特征工程,直接关系抽取

因此,当输入“糖尿病患者因胰岛素不足而经常感到疲劳”这句话时,模型不仅识别出实体和关系,还能直接输出具体的关系:“糖尿病患者”因“胰岛素不足”而“感到疲劳”,显示出胰岛素不足导致了疲劳。例如,对于句子“糖尿病患者需要定期检查血糖”,一个基于PLMs的模型可能会识别出“糖尿病患者”作为实体,并提取出与“糖尿病患者”相关的关系,比如“需要定期检查”等。通过这样的应用,CRE-LLM不仅提高了从医学文本中自动提取关键信息的效率,而且通过精确的关系抽取,支持了更深入的医学研究和更有针对性的治疗决策。

2024-05-02 15:03:50 783 1

原创 自适应医疗决策框架 MDAgents:问题复杂度评估 + 医疗决策 + 多智能体协作

整个决策过程使用复杂的集成技术,如温度集成,并采用多数投票和加权投票等决策策略,确保决策的健壮性,并在适用的情况下反映模型间的自适应医疗决策框架 MDAgents,通过整合问题复杂度评估、医疗决策以及多智能体协作三个关键部分,目的是提升医疗决策的质量和效率。总的来说,MDAgents框架的整合使用提供了一个系统性、层次化和协作性强的解决方案,能够更精确地处理从简单到极端复杂的各种医疗问题,确保医疗决策的效率和效果,最终提升患者的治疗结果和生活质量。:这一步是识别和分类医疗问题的复杂程度。

2024-05-02 11:02:30 1007

原创 llamaindex 分成检索 实现 多文档 RAG架构

首先,你需要定义一组文档属性,这些属性能够描述文档的特征、内容或其他相关信息。这些属性可能包括文档的主题、关键字、作者、日期等等。

2024-05-02 09:15:40 914 1

原创 婚姻情感 21

不管怎么样啊,这是肯定了对方的缺点啊,让对方知道啊,暴露缺点在我这儿啊,是无所谓的,我是愿意去肯定的,当他明白啊 — 他最介意的缺点在我们这儿都变成了优点,那他在我们面前自然就会卸下防备,减少伪装,他在我们这儿啊,就不用去当男神,能够自然的啊,显得轻松自在。故意跟其他的异性很亲密,让男生有危机感,或者故意在公众场合表现自己,让男朋友见识自己的性能力,这些负面的情绪价值,让他吃醋紧张,用在比较闲的学生,小男生上啊,其实没有太大的问题,年轻的女生啊,确实也能用这样的方式获得更多的关注和陪伴啊。

2024-04-30 15:32:19 525 1

原创 RAPTOR:索引树状 RAG,使用树结构来捕捉文本的高级和低级细节

递归摘要作为上下文摘要技术:递归摘要提供了文档的简明视图,使人们能够更专注地参与内容。尽管递归摘要模型对于捕捉更广泛的主题很有效,但可能会忽略细节。LlamaIndex通过类似的方式摘要相邻的文本块,但也保留了中间节点,因此保留了不同级别的细节,保持了细粒度的细节。然而,这两种方法由于依赖邻接来对节点进行分组或摘要,可能仍然会忽略文本内的远程依赖关系,而RAPTOR可以找到并组织这些依赖关系。

2024-04-30 10:47:13 607

原创 婚姻情感 20

通过这一系列的步骤,Tom不仅自然而然地加深了与Emily的联系,还在不显露痕迹的情况下引导了关系的发展。假设Tom和Emily在一个共同朋友的聚会上认识,Tom对Emily感兴趣并希望发展进一步的关系。每一步都是为了在男女关系中更有效地沟通和建立联系,使双方都能在舒适和满意的基础上发展关系。这种方法使得双方都感到舒适且愉悦,同时有效地推动了关系向前发展。异性之间聊天是为什么?

2024-04-25 13:35:52 540 1

原创 OpenAI API 使用指南

当用户的查询处理完毕后,这三个问题的文本将被显示给用户,帮助他们获得关于感冒治疗的具体信息,尤其是关于是否可以使用阿莫西林的详细解答。这三种角色共同构成了聊天的完整流程,其中系统角色可用于初始化设置,用户角色表达用户需求,智能助手角色则是响应这些需求,完成交互。这个过程有效地将用户的自然语言查询转化为可以操作的数据(向量),通过数学方法找到最相关的回答,从而提供具体而有用的医疗建议。假设你是一个用户,想要找到关于感冒治疗的最佳建议,尤其是关于阿莫西林的使用。用户查询:“感冒吃什么药效果好?

2024-04-23 13:55:18 800

原创 Agent 智能体食用指南

科技圈焦点:三年前都在 ALL in AI,一年前都在 ALL in LLM,现在都在 ALL in Agent。但 GPT4 跑 Agent 成本高,多轮 + 输入多 + 交互多 + API 调用 + 多智能体,一天花费几十美刀。Llama 系列是本地大模型中接入 Agent最稳定的,而且免费, 不会像其他大模型跑不完流程,就崩了。Agent 依赖大模型推理分析能力,基于 GPT4 是最智能 + 最稳定 + 体验最好。上图最后一列是,Agent性能评分(主观)。其实落地很快,主要是成本问题。

2024-04-22 21:14:00 392

原创 从电子病历(EMRs)构建医学知识图谱

在本研究中,通过使用中国一家三甲医院的大数据平台,我们构建了一个复杂的医学知识图谱,这个图谱不仅包含多种医学实体类型,还采用了四元组结构代替了传统的三元组结构,以提供更丰富的信息和关系表示。本研究通过使用大规模的数据和先进的分析技术,构建了一个能够全面反映糖尿病及其相关条件的知识图谱,这在以往的研究中是很少见的。在之前的研究中,构建糖尿病相关的知识图谱通常只利用了少量的数据,比如特定的医学文献或者小规模的病例记录。在这些四元组中,第四元素提供了关于关系的额外信息,如症状出现的频率或治疗的具体适应症。

2024-04-13 12:04:03 773

原创 PrimeKG:为精准医学分析设计的多模态知识图谱

PrimeKG是为精确医学研究专门设计的一个知识图谱,它集成了来自20个高质量数据源的信息,涵盖17,080种疾病和超过400万种数据关系。这些关系包括了疾病与蛋白质变化、生物过程、身体结构功能以及药物治疗作用等多个层面。与其他知识图谱不同的是,PrimeKG特别强调了包括药物的适应症、禁忌症和非标签用途等通常缺失的药物-疾病关系。

2024-04-13 10:04:02 706

原创 RCTKG:针对用户的罕见病临床试验知识图谱

RCTKG的规模和内容节点和边:知识图谱中有2,216,062个节点和8,437,108条边。节点代表数据点,比如临床试验、疾病等;边则代表节点之间的连接或关系。罕见病与临床试验的关联:这个图谱包含了2,086种被称为GARD的罕见病,这些疾病与一个或多个临床试验有关联。如何使用RCTKG通过编程方式,研究人员可以从这个知识图谱中提取关于临床试验的信息,这支持了罕见病的研究和治疗方法的开发。知识图谱的完善状态当前状态。

2024-04-13 09:21:33 678

原创 PBXAI:将疾病预测转为沿知识图谱的随机游走

表格展示了每种预测疾病的概率以及相应的转移概率,例如,患者从现在的高血压、糖尿病、肥胖、贫血状态,预测未来可能继续患有高血压(自循环概率0.88)、糖尿病(自循环概率0.81)、贫血(自循环概率0.87);然后,一个数学对象沿着知识图谱行走,从一个患者实体开始行走,该实体根据患者当前的疾病或者风险因素连接知识图谱,停止在疾病的实体,数学对象的生成轨迹表示患者的疾病发展路径,对象的行走策略由强化学习模块控制,该模块由电子健康记录数据训练。这个图展示的是一个算法的伪代码,具体是疾病预测和路径推理的算法。

2024-04-12 17:30:41 797

原创 怎么构建医学临床知识图谱?

因此,面对一个具体的患者,医生可能会选择一个基于个人偏好而不是最佳证据的治疗方案,这可能不是最优的选择,从而影响治疗效果和患者的长期健康。临床知识图谱不仅作为一个信息的整合者,还充当了一个智能的推理工具,它能够基于现有的知识和数据生成新的假设和见解,帮助找到新的治疗方法。然后,CKG还考虑了张阿姨的生活方式,提出了一系列个性化的饮食建议和运动计划,这些都是专门为她的情况量身定制的。最后,CKG分析了这种新药物可能的副作用和张阿姨目前正在服用的药物之间的交互作用,以确保新方案的安全性。

2024-04-11 14:58:49 595

原创 用临床知识图谱 + 医学文本向量库,设计一个医疗诊断系统

两大类深度学习模型,分别用于不同的自然语言处理(NLP)任务:词嵌入模型是一类用于将单词、短语或者文档转换为向量形式的模型。这些向量捕捉了单词之间的语义关系,如相似性或上下文关联。例如,text2vec、M3E等模型能够将文本中的每个单词映射到一个高维空间中的点,这个点的位置与单词的语义密切相关。通过这种方式,模型能够理解和处理自然语言,为诸如文本分类、情感分析等任务提供基础。举个例子:在词嵌入模型中,"king"和"queen"这两个词虽然是不同的,但它们在向量空间中的位置会非常接近,因为它们有着相似的上

2024-04-09 17:30:46 1050

原创 【中文医疗词嵌入模型】SMedBERT:结构化知识图谱 + 混合注意力机制 + 提及-邻居上下文建模

然后,图中显示了从知识图谱中提取的邻近实体信息,如“呼吸感染”(respiratory infection)、“发热”(fever)、“呼吸综合症”(respiratory syndrome)和“肺炎”(pneumonia),它们都与“新型冠状病毒”(novel coronavirus)相关联。两个知识图谱中的三元组数量分别是1,007,818和3,764,711。在训练语料中的每一个提及(如“糖尿病”),都与知识图谱中的实体集合E相对应,并形成实体和关系的三元组(S),比如(糖尿病,关联,心脏疾病)。

2024-04-09 15:42:58 1014

原创 秘塔 AI 搜索:颠覆搜索的常态体验,强大+惊艳

相比之下,微软的new bing就是单纯的“搜索+ai”,很多时候还没有传统搜索引擎好用,但是这样的搜索方式,依然能让new bing访问量上升了15.8%。给出的内容不亚于一篇专业的测评,而且还综合了其他博主的评测,让你知道最全面的消息,不知道你看了这个之后,还有没有所谓的“信息差”的概念,这是完全透明了。传统搜索引擎的结果是平铺的、零散的,需要我们自己去梳理,慢慢形成脉络,找到自己想要的信息或学到自己想学的知识。比如,今天是 4.8 号,ta引用了4.7号的数据,刚发的婚姻司法解释,这真的牛逼了。

2024-04-08 15:00:04 4169

原创 男人圣经 9

我渴望的,是无可匹敌的力量——力量到让每一个与我交谈的人都带着求助的目光,而不是我向他们伸出求助之手。很多女人找有钱男人的思维方式是——他买房买车、负责一起生活、负责我的大额开销,然后我自己在外面工作,我的钱都是我的,他的钱都花给家里(相当于花给我)。我所想的,是财富的极致——不仅仅满足于基本的生活需求,而是富有到能够支撑我所有的梦想和追求,这关乎我所渴望的力量、自由和尊重。我追求的,是绝对的成功——不仅仅是微小的成就,而是让我站在世界的顶峰,拥有无数的仰慕者,远远超出普通人的羡慕和认可。

2024-04-07 21:18:15 939 12

原创 MiLP:低秩适应和贝叶斯优化,实现个性化的大模型响应生成

图2展示了MiLP方法的工作流程。描述了LLM的多层结构,包含添加和标准化(Add & Norm)、前馈(Feed Forward)和多头注意力(Multi-Head Attention)部分。每一层中都包含了用于记忆注入的低秩适应(LoRA)模块,这些模块由W_A和W_B矩阵组成。这部分展示了对LLM进行调整的可能配置。例如,决定在LLM的哪些层插入LoRA模块(通过二进制参数α控制),以及LoRA模块的数量和低秩大小(r)。

2024-04-05 17:30:41 744

原创 LongVLM:让大模型解读长视频 SOTA 的方法

这种结合局部和全局信息的策略,使得LongVLM能够实现对长视频内容的精细理解和响应生成,克服了现有方法在处理长视频时细节理解不足的问题。将长视频分解为短期片段,对每个片段应用令牌合并模块,生成紧凑的片段级特征,这些特征按顺序连接,显式保留短期片段在长视频中的时间顺序。不同于依赖全局语义进行长视频理解的传统方法,LongVLM提供了一种直接且有效的方法,用于实现长期视频中的精细级别理解。LongVLM的提出有效地解决了长视频理解的挑战,其结合局部和全局信息的策略为视频内容理解领域提供了新的视角和方法。

2024-04-05 17:09:06 1330

原创 一点点金融 5

高成交密度区域表明该价格区间内有强烈的买卖意愿和大量的交易,而低成交密度区域则可能预示着价格的快速移动,因为较少的交易就能推动价格突破。以时间为单位的成交密度反映在特定时间内的交易活跃程度,而以价格区间为单位的成交密度则展示了在特定价格水平上的交易积聚情况。通过以上步骤,投资者利用对市场行为和价格波动背后深层次原因的理解,结合基本面分析和技术分析,实施了一套综合的交易策略。:左侧的趋势展示了一个总体向上的移动,其中包含了一个临时的下跌或“回撤”,由虚线标示。这种回撤是短暂的,并不意味着整体趋势方向的改变。

2024-04-05 10:41:56 1308

原创 一点点金融 4

要找到股市里真正靠谱的"弹簧板"和"天花板",就看在大事发生前,是不是有一大波人突然疯狂买卖,不管是价格不动还是突然直线下降或飙升,这就是大家默契的信号,表示这个价格很关键。在这个阶段,椰子的价格可能会因为各种预测和传言而出现波动,但总体上可能呈现出横盘的趋势,因为市场参与者都在等待这个关键事件的结果,以此作为做出买卖决策的依据。但如果某一天,你跳不过这个低高度了,就好比股价跌破了弹簧板,说明情况不妙,可能你累了或者有什么阻碍,接下来可能会跌倒,就像股价可能会继续下跌。

2024-04-04 11:51:40 1534 1

原创 一点点金融 3

一开始,我进入股市,梦想着快速赚大钱。像玩游戏一样每天买卖股票,希望能捕捉到每一次价格的小波动来赚钱。但很快发现,频繁交易像是在给券商送钱,手续费堆积如山,加上几次买卖失误,钱包越来越瘪。

2024-04-03 21:11:31 560

原创 一点点金融 2

在这种情况下,你在现货市场上因为价格上涨而获得了更多的利润,同时,在期货市场上,你之前的空单策略(赌价格会下跌)也让你获得了盈利。在这种情况下,尽管你在现货市场上因价格上涨而获得了盈利,但因为你之前在期货市场上建立了空头仓位(预测价格会下跌),期货市场价格的上涨导致你需要以更高的价格平仓,从而在期货市场上遭受亏损。最终的结果是,你通过在两个市场上的精明操作,成功地保护了自己的利润,即使在现货市场上的椰子价格没有按照你最初的期望那样高。这时候,你想出了一个聪明的计划:你在椰子“期货市场”上做了一些操作。

2024-04-03 11:46:25 1221

原创 基于多数据源融合的医疗知识图谱框架构建研究

医疗大数据通常包括规范的电子病历、医疗健康社区中的用户生成内容(UGC)、医疗词典资源和相关政策文件等,这些数据根据其表现形式,可以被分为结构化数据、半结构化数据和非结构化数据三类。中文医疗知识图谱的构建过程,包括多数据源融合、医疗文本数据处理、医疗实体识别、实体及实体关系标注、实体链接与知识融合、实体关系抽取、知识图谱表示及存储和图谱的动态构建等关键技术环节。:收集到的数据需要进行清洗和预处理,包括格式统一、去除噪声数据、数据分词和词性标注等,以提高数据质量,为后续的实体识别和关系抽取打好基础。

2024-04-02 10:52:47 972

原创 一点点金融

比如字节跳动、阿里、腾讯、拼多多、谷歌、英伟达、meta、微软、苹果、亚马逊,他们形成了一个互联网新世界,相当于新世纪的巨头,提供一切互联网运作的基础设施和服务,包含数据、算力、云、计算、支付、交易、社交、娱乐、吃喝玩乐、衣食住行。趋势减速的识别都是寻找趋势反转信号的关键步骤,通过观察这些减速迹象,可以更好地准备迎接可能的趋势转变,无论是采取止损措施,还是寻找新的入场机会。还有更傻的呢,债务缠身,就为了买辆看着体面的车,不管是奔驰还是保时捷,那车间一开工,车子成堆成堆的往外冒。你把辛苦钱都扔那儿了。

2024-04-01 21:46:30 989

原创 HyKGE = 预检索阶段生成假设性输出 + 知识图谱深入探索 + 信息片段重排序,解决了查询不完整性、准确度和深度不足、展示不佳问题,提升了答案的准确性、相关性和体验。

基于现有方法的局限性,作者提出了假设知识图谱增强(HyKGE)框架,该框架旨在通过结合知识图谱和LLMs,利用LLMs的零样本能力和预训练知识来弥补用户查询的不完整性,从而提供更准确和可靠的回答。通过上述四个子解法的组合运作,HyKGE框架能够有效地处理用户查询的不完整性,精准地从知识图谱中检索和整合信息,同时过滤掉噪声,最终提供准确、相关且高质量的回答。通过这种逐步拆解的方式,HyKGE框架利用LLMs的强大生成能力和知识图谱的准确性,有效处理了用户查询的不完整性,提高了回答的准确度和用户体验。

2024-03-31 23:13:18 874

原创 BioMedKGs:算法生成医学知识图谱,解决构建和维护工作量巨大问题

在关系识别方面,BIOS能够识别和表示生物医学概念之间的复杂关系,例如,它可能包含一个关系三元组[阿司匹林, 可治疗, 发热],其中"可治疗"是连接阿司匹林和发热两个概念的关系,展示了BIOS如何用于自动诊断、问答和药物发现等多种AI任务。:我们从文献中收集关于肺结核的术语和短语,并为每个术语建立索引。比如,在BIOS中,“2型糖尿病"这一概念可能会以多种形式和名称存在,如"2型糖尿病”、“II型糖尿病”、“2型糖尿病糖尿病”、“T2DM”、“非胰岛素依赖型糖尿病”、"NIDDM"等。

2024-03-31 17:46:40 1307

原创 【大而全 被震惊到了】12个类别、100多万张视网膜数据集

图像可读性的更广泛的完整注释范围指的是,SynFundus-1M数据集不仅标注了眼底图像是否包含特定的疾病,还细致地标注了图像中不同区域的清晰度和可用性,这对于自动分析和医学研究来说至关重要。利用SynFundus-Generator,我们生成了超过一百万张合成眼底图像的集合,称为SynFundus-1M数据集,包含15种类型的注释(11种疾病标签和4种图像可读性标签)。广泛的实验表明,即使是经验丰富的标注者也难以将我们的合成图像与真实图像区分开来,合成的疾病相关视觉特征也无法与真实的区分。

2024-03-30 00:30:50 783 1

原创 【医学嵌入模型】中文医疗文本处理大模型 PCL-MedBERT

提出背景与动机预训练语言模型(PLMs)在自然语言处理(NLP)领域取得了显著的成功,特别是BERT及其变体通过在大规模未标注文本上的自监督学习,显著推动了NLP的发展。尽管在通用领域PLMs取得了巨大成功,但直接将这些模型应用于生物医学等专业领域的效果并不总是理想的,因为专业领域具有独特的词汇、术语和语言结构,需要专门的预训练模型来处理。ELECTRA模型的限制ELECTRA模型采用令牌级别的二元分类任务进行预训练,虽有效,但可能不足以捕捉更复杂的语言模式。

2024-03-29 11:41:21 1087

原创 【阿里近100人+花27.1万造的】中文医学数据集 ChineseBLUE 分析

需要注意的是,中文生物医学文本在语言上与英文不同,具有其领域特性,这需要专门为中文设计的评估BioNLP基准测试。在本研究中,我们专注于中文,旨在填补这一空白并开发第一个中文生物医学语言理解基准测试。我们收集了真实世界的生物医学数据,并提出了第一个中文生物医学语言理解评估(CBLUE)基准:包括命名实体识别、信息抽取、临床诊断标准化、单句/句对分类等自然语言理解任务的集合,以及一个用于模型评估、比较和分析的在线平台。

2024-03-29 09:57:02 819

原创 男人圣经 8

钱的意义,意味着你必须为社会创造更大的价值,它意味着你必须有更强的责任心,它意味着你必须有更强的延迟满足感,它意味着你必须要冒险、存钱、没有休息日、不停的工作,你必须与众不同且足够自信。在你熟悉的领域里,一旦你有半年、1年的中断期,你去做别的了,比如陪你爸妈去了,或者生孩子去了,或者是辞职旅行去了,或者是买房子去了,你将失去在你本行业的生态位。是你的天赋、能力、野心、资源、勇气、毅力、专注、百折不挠、愿意为了实现自己的理想吃最大的苦,愿意去人最少的一条路走一趟,不管别人说什么。如果你想成为一个富人。

2024-03-28 20:28:54 1203 10

原创 让机器理解语言,从字词开始,逐步发展到句子和文档理解:独热编码、word2vec、词义搜索、句意表示、暴力加算力

举例:在句子“猫坐在垫子上”中,如果目标词是“坐”,上下文词是“猫”和“在垫子上”,CBOW会使用“猫”和“在垫子上”对应向量的平均值来预测“坐”。举例:在句子“猫坐在垫子上”中,如果目标词是“坐”,Skip-Gram模型会尝试使用“坐”的词向量来预测“猫”和“在垫子上”的词向量。不同于Word2Vec模型生成的词向量,文档向量捕获了文档中所有词的上下文关系以及词之间的交互作用,提供了一个全面的文档表示。GPT-3有1750亿个参数,无疑是非常大的数字,但是在指数增长的算力面前,这些是有限的数字。

2024-03-27 10:44:55 1134

原创 【大模型 数据增强】LLM2LLM:迭代学习 + 针对性增强 + 错误分析 + 合成数据生成 + 质量控制

我们在使用LLaMA2-7B学生模型的低数据范畴中,在GSM8K数据集上实现了高达24.2%的改进,在CaseHOLD上为32.6%,在SNIPS上为32.0%,在TREC上为52.6%,在SST-2上为39.8%,超过了常规微调。在医学领域的具体应用中,例如提高模型在分类罕见病症或解析复杂医疗图像方面的能力,LLM2LLM能够生成更加贴近实际临床场景的数据,比如根据模型识别错误的病症症状生成新的案例,我们的结果显示,LLM2LLM在低数据范畴中显著提高了LLM的性能,超过了传统微调和其他数据增强基准。

2024-03-26 11:00:18 824

原创 眼底 Fundus、OCT 图竞赛分析

ResNet(残差网络)是一种深度卷积神经网络(CNN),最初由微软研究院的研究人员在2015年提出。ResNet的关键创新是引入了所谓的“残差块”,这些残差块允许信息通过网络的跨层连接直接传递,帮助解决了更深层网络中的梯度消失和梯度爆炸问题,使得网络可以通过增加更多的层来提高准确性,而不会降低训练效率。

2024-03-26 09:58:31 889

原创 Bi-LSTM-CRF:其结合了 BI-LSTM 的上下文捕获能力和 CRF 的标签关系建模

BI-LSTM-CRF模型的独特优势在于它结合了双向LSTM的能力来捕获长距离的双向上下文依赖性,并通过CRF层来精确地建模标签之间的约束关系,从而在复杂的序列标注任务中提供了显著的性能提升。本节中,我们描述了本文中使用的模型:LSTM、BI-LSTM、CRF、LSTM-CRF和BI-LSTM-CRF。这些模型包括LSTM网络、双向LSTM(BI-LSTM)网络、带有条件随机场(CRF)层的LSTM(LSTM-CRF)以及带有CRF层的双向LSTM(BI-LSTM-CRF)。前置知识:序列模型、LSTM。

2024-03-25 14:05:22 734

原创 【医学实体识别】从糖尿病论文和临床指南中,做关键信息分类

BiLSTM层的输出是每个单词对于不同实体类别的分数(例如B-Person表示一个人名的开始,I-Person表示人名的内部,B-Organization表示组织名的开始,I-Organization表示组织名的内部,O表示不属于任何实体类别)。例如,当处理用户的医疗咨询问题时,可以利用这个实体识别模型来分析问题文本,识别出里面提到的医疗实体,然后根据这些实体和知识图谱中的信息进行匹配,找到最合适的答案或建议给用户。在这句话中,命名实体识别(NER)的任务是识别并分类句子中的关键信息。

2024-03-25 11:23:59 835 5

原创 CycleGAN-Turbo:CycleGAN结合扩散模型,一步图像到图像转换方法

结合了CycleGAN的非成对图像翻译概念和Diffusion模型的强大生成能力,创造了CycleGAN-Turbo和Pix2Pix-Turbo这两个新模型。在本文中,作者团队解决了条件扩散模型存在的两个问题:推理速度慢和对成对数据的依赖。他们通过引入单步扩散模型来适应新任务和领域的方法,成功地整合了传统的CycleGAN和pix2pix模型的优点到扩散模型框架中。这不仅提升了推理速度,还允许在无需成对数据的情况下进行训练。

2024-03-23 14:13:44 1224

原创 AI大模型学习

未来会更新,偏项目部分,现在偏原理。笔记收录,持续更新。

2024-03-22 11:10:01 1043

原创 好用的GPTs:指定主题搜索、爬虫、数据清洗、数据分析自动化

能不能 APP逆向抓取、JS 逆向抓取、APP 群控抓取、验证码拖拽、大规模抓取等!但我不知道,Scraper配合GPT4的多模态和智力,爬虫水平有多好?居然找到了改进的YOLOv5s模型在医学图像中肺结节检测的应用。不过我没做过肺结节检测,没推荐,没想到这都能找到。输入:搜索 YOLO+小目标+医学方面+最新论文。不过我更好奇,这个插件爬虫的能力到了什么程度。只能说,牛逼,不愧是最先进的生产力工具。这篇文章评论中,就有提到肺结节检测。输入:这只是第1页,总共有10页。

2024-03-21 15:24:51 765

原创 【医学大模型 数据增强】GPT4 生成多样性医学语料模版,医疗知识图谱抽取实体,填充语料模板

代入角色>假定你是深度学习领域的一位资深训练专家,目前你面临的任务是创建一套用于意图识别的数据集。特别是,在关于“疾病定义”的问题分类中,你发现现有的训练语料库显得相当匮乏。因此,你的目标是为这一特定类别扩充更多的训练样本。为了使问题样本更加多样和口语化,你需要构造各式各样的询问句,这些句子长度不一,风格各异,以避免重复的表达形式。在构建的语料模板中,将用[disease]来代替具体的疾病名,[symptom]用来代替具体的症状,[department]则代表相关的医疗科室。

2024-03-21 09:47:01 1724 2

blog配套资料、blog配套资料、blog配套资料

blog配套资料blog配套资料blog配套资料blog配套资料blog配套资料blog配套资料

2023-07-14

博客配套资料博客配套资料

博客配套资料博客配套资料博客配套资料

2022-08-06

博客配套博客配套博客配套

博客配套博客配套博客配套博客配套

2022-08-05

博客配套https://download.csdn.net/download/qq_41739364/86339152

https://download.csdn.net/download/qq_41739364/86339152

2022-08-05

配套博客资料,配套博客资料

配套博客资料

2022-08-05

processed_data.xlsx

博客配套数据:https://blog.csdn.net/qq_41739364/article/details/120967416

2021-10-27

original_data.xlsx

博客配套资源:https://blog.csdn.net/qq_41739364/article/details/120967416

2021-10-27

博客配套资源数据集.zip

博客配套资源

2021-10-09

莎士比亚诗歌数据集.txt.zip

博客配套资源

2021-10-08

恐龙名字数据集.txt.zip

博客配套数据集

2021-10-08

我的数据集+我的数据集.zip

博客配套资源

2021-09-07

data.xlsx.zip

博客配套数据

2021-08-21

神经网络识别猫的项目代码

博客程序:https://blog.csdn.net/qq_41739364/article/details/118094724

2021-07-17

疫情监控项目源码.zip

博客配套:https://blog.csdn.net/qq_41739364/article/details/115742139

2021-04-15

label.xlsx ....

label.xlsx ....

2021-03-08

data.xlsx ....

配套博客:https://blog.csdn.net/qq_41739364/article/details/113818246

2021-03-08

smi_sol.dat

化学分子数据

2021-03-08

口罩厂亏损分析的相关数据

配套博客:https://blog.csdn.net/qq_41739364

2021-02-23

breast_cancer.xlsx

配套博客:https://blog.csdn.net/qq_41739364/article/details/113818246

2021-02-21

att_faces.zip

人脸数据集,数据集里有 40 个人,每个都有 10 张照片,分别存储在 40 个文件夹里,s1-s40,每个文件夹下面都有 10 张 .pgm 照片,每张照片的尺寸 112*92(长 * 宽)。

2020-07-04

att_face.zip

人脸测试数据集,配套博客:https://blog.csdn.net/qq_41739364/category_9414685.html

2020-07-03

阶的估计.pdf

配套博客:https://blog.csdn.net/qq_41739364/article/details/86718524

2019-09-03

1.数据挖掘入门.pdf

配套博客:https://blog.csdn.net/qq_41739364/column/info/42524 的 第四章。

2019-08-13

3.机器学习常用算法.pdf

配套博客:https://blog.csdn.net/qq_41739364/column/info/42524 的 第 4 篇。

2019-08-13

强大的防御跨站点请求伪造.pdf

配套博客:https://blog.csdn.net/qq_41739364/article/details/96846943

2019-08-01

dict.txt.zip

配套博客:https://blog.csdn.net/qq_41739364/article/details/96767359

2019-07-23

phpStudy.zip

配套博客:https://blog.csdn.net/qq_41739364/article/details/93403910

2019-07-19

SQL字符型注入漏洞.pdf

配套博客:https://blog.csdn.net/qq_41739364/article/details/94025729

2019-07-18

0day安全:软件漏洞分析技术(第2版)一 PART2.pdf

全书分为俩部分,这是第二部分。 配套博客:https://blog.csdn.net/qq_41739364/article/details/96202158

2019-07-17

0day安全:软件漏洞分析技术(第2版)一 PART1.pdf

全书分为 2 部分,这是第一部,配套博客:https://blog.csdn.net/qq_41739364/article/details/96202158

2019-07-17

burpsuite实战指南.pdf

配套博客:https://blog.csdn.net/qq_41739364/article/details/93862232

2019-07-02

渗透测试实践指南:必知必会的工具与方法.pdf

中文版,配套博客:https://blog.csdn.net/qq_41739364/article/details/93862232

2019-06-28

端口大全介绍(2).doc

很详细,配套博客:https://mp.csdn.net/postedit/93862232

2019-06-27

初等数论大全

计算机数学专题5: 数论配套资料 博客地址:https://mp.csdn.net/postedit/86761357

2019-04-24

C语言RSA素数部分

配套博客:https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-08

DES加密位操作部分 C语言

配套博客:https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-07

DES加密代码 C语言

配套博客:https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-07

RSA加密 C语言实现

配套博客:https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-07

DES加密代码 java

匹配博客:https://blog.csdn.net/qq_41739364/article/details/86775886

2019-04-07

系统学习 公钥体系

配套博客 https://blog.csdn.net/qq_41739364/article/details/86775886 ,效果最佳。

2019-03-28

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除