人工智能
文章平均质量分 70
医学小达人
以前主要从事医疗NLP方面的研究和工作,包含但不限于疾病归一化、病历结构化、智能编码和智能诊断、CDSS等方向,其次对知识图谱(合理用药方向)和DRG分组器也有一定的研究。近期,主攻图神经网络和大模型,已经转战金融方向,风控和推荐,后续会整理图神经网络的相关知识,现在主攻大模型后训练,一起学习哦
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Natively Trainable Sparse Attention,deepseek稀疏注意力机制;LLMs创新性探索
Natively Trainable Sparse Attention,deepseek稀疏注意力机制;LLMs创新性探索原创 2025-10-24 14:56:48 · 274 阅读 · 0 评论 -
Python 通俗易懂系列之-Transformer 各种优化技术,KV Cache,RMSNorm, SwiGLU,GQA,RoPE,旋转编码,归一化,原理讲解和代码实战
Python 通俗易懂系列之-Transformer 各种优化技术,KV Cache,RMSNorm, SwiGLU,GQA,RoPE,旋转编码,归一化,原理讲解和代码实战原创 2025-06-04 14:50:15 · 1225 阅读 · 0 评论 -
Python 大模型知识蒸馏详解,知识蒸馏大模型,大模型蒸馏代码实战,LLMs knowledge distill LLM
Python 大模型知识蒸馏,知识蒸馏大模型,大模型蒸馏代码实战,LLMs knowledge distill LLM,大模型蒸馏详解原创 2025-05-23 15:31:28 · 1080 阅读 · 0 评论 -
Python MTP:Multi-Token Prediction原理与代码实现;LLMs中的多token预测,Deepseek-v3中的MTP的原理详解与代码实践
Python MTP:Multi-Token Prediction原理与代码实现;LLMs中的多token预测,Deepseek-v3中的MTP的原理详解与代码实践原创 2025-05-13 15:06:26 · 1023 阅读 · 0 评论 -
Python 从MOE到Deepseek-v3 MOE详解,MOE原理和代码详解,混合专家模型代码实战详解,手撕MOE代码和流程图
Python 从MOE到Deepseek-v3 MOE详解,MOE原理和代码详解,混合专家模型代码实战详解,手撕MOE代码和流程图原创 2025-05-13 11:17:35 · 811 阅读 · 0 评论 -
Python 详解deepseek-R1中GRPO的实现与原理,GRPO的伪代码实现,RL中GRPO与PPO的区别,详解LLMs中强化学习GRPO与PPO的不同
Python 详解deepseek-R1中GRPO的实现与原理,GRPO的伪代码实现,RL中GRPO与PPO的区别,详解LLMs中强化学习GRPO与PPO的不同原创 2025-05-12 17:14:19 · 535 阅读 · 0 评论 -
Python 图解deepseek MLA;详解MLA机制,LLM中的多头潜在注意力机制
Python 图解deepseek MLA;详解MLA机制,LLM中的多头潜在注意力机制原创 2025-05-12 14:55:18 · 1147 阅读 · 0 评论 -
DeepSeek-v1到DeepSeek-v3再到DeepSeek-R1的变迁和进化史,创新点,值得大家学习,DeepSeek系列干货
DeepSeek-v1到DeepSeek-v3再到DeepSeek-R1的变迁和进化史,创新点,值得大家学习,DeepSeek创新变化过程原创 2025-02-27 14:52:59 · 1503 阅读 · 0 评论 -
DeepSeek-V3 技术细节详细介绍;Deepseek-v3技术报告学,最强开源大模型DeepSeek-V3的技术亮点和创新性详细介绍;LLMs
DeepSeek-V3 技术细节详细介绍;DeepSeek-V3 技术细节详细介绍;Deepseek-v3技术报告学,最强开源大模型DeepSeek-V3的技术亮点和创新性详细介绍;LLMs;DeepSeek-V3 技术细节详细介绍;Deepseek-v3技术报告学,最强开源大模型DeepSeek-V3的技术亮点和创新性详细介绍;LLMs原创 2025-02-11 17:32:46 · 1754 阅读 · 0 评论 -
Python DeepSeek-v3介绍(一),最强大的开源大模型deepseek详细介绍,和本地化部署实战
Python DeepSeek-v3介绍(一),最强大的开源大模型deepseek详细介绍,和本地化部署实战,最强开源大模型deepseek的部署实践,deepseek技术简介一原创 2025-02-06 12:58:34 · 3736 阅读 · 0 评论 -
NodeFormer: A Scalable Graph Structure LearningTransformer,图transformer,node transformer方法原理
NodeFormer: A Scalable Graph Structure LearningTransformer,图transformer,node transformer方法原理原创 2024-12-10 11:01:06 · 599 阅读 · 0 评论 -
Python GLM-4-9B-Chat微调代码和步骤,glm-4-9b-chat微调代码实战;GLM-4-9B-Chat微调:Lora,P-Tuning V2,SFT
Python GLM-4-9B-Chat微调代码和步骤,glm-4-9b-chat微调代码实战;GLM-4-9B-Chat微调:Lora,P-Tuning V2,SFT原创 2024-11-07 16:33:11 · 1735 阅读 · 2 评论 -
Python 医疗领域大模型微调,LLMs在医疗领域的lora微调,医疗领域问答大模型微调训练,大模型在医疗领域的SFT,基于glm-4-9b-chat在医疗领域的指令微调(一)
Python 医疗领域大模型微调,LLMs在医疗领域的lora微调,医疗领域问答大模型微调训练,大模型在医疗领域的SFT,基于glm-4-9b-chat在医疗领域的指令微调原创 2024-11-04 16:30:10 · 619 阅读 · 0 评论 -
python 简单GCN模型代码,实践代码
python 简单GCN模型代码,实践代码原创 2024-11-04 14:46:51 · 619 阅读 · 0 评论 -
Python LLMs大模型llama的推理代码,半精度推理.half(),占用内存小推理
Python LLMs大模型llama的推理代码,半精度推理.half(),占用内存小推理原创 2024-10-24 17:34:40 · 383 阅读 · 0 评论 -
Python 知识图谱补全,Knowledge Graph Completion,基于大模型的知识图谱补全,基于LLMs的KGC任务
Python 知识图谱补全,Knowledge Graph Completion,基于大模型的知识图谱补全,基于LLMs的KGC任务原创 2024-06-06 14:51:51 · 2111 阅读 · 0 评论 -
Python GraphSAGE原理与代码详解,GraphSAGE代码实战,图神经网络,图计算,GraphSAGE代码模版,超简单学习GraphSAGE
Python GraphSAGE原理与代码详解,GraphSAGE代码实战,图神经网络,图计算,GraphSAGE代码模版,超简单学习GraphSAGE原创 2024-06-03 15:33:40 · 6036 阅读 · 0 评论 -
Python GNN图神经网络代码实战;GAT代码模版,简单套用,易于修改和提升,图注意力机制代码实战
Python GNN图神经网络代码实战;GAT代码模版,简单套用,易于修改和提升,图注意力机制代码实战原创 2024-06-03 10:52:25 · 1069 阅读 · 0 评论 -
Python GCN代码实战,图卷积神经网络代码模板,GCN代码框架,直接套用
Python GCN代码实战,图卷积神经网络代码模板,GCN代码框架,直接套用原创 2024-05-30 17:19:13 · 1010 阅读 · 0 评论 -
Python 将文本先转化为bert向量,然后计算相似度,bert代码实战
Python 将文本先转化为bert向量,然后计算相似度,bert代码实战原创 2024-05-14 16:28:53 · 627 阅读 · 0 评论 -
Python tensor向量维度转换,不同维度的向量转化为相同的维度,经过全连接层MLP的维度转换,代码实战
Python tensor向量维度转换,不同维度的向量转化为相同的维度,经过全连接层MLP的维度转换,代码实战原创 2024-05-14 16:02:12 · 618 阅读 · 0 评论 -
Python 写一个简单的神经网络,就是用x预测y ,简单的神经网络代码实战;神经网络代码基础实战
Python 写一个简单的神经网络,就是用x预测y ,简单的神经网络代码实战;神经网络代码基础实战原创 2024-05-14 15:42:41 · 462 阅读 · 1 评论 -
LLMs 大模型微调Finetune,LISA强势来袭,相比LoRA微调LISA性能提升巨大,微调新方法LISA微调登榜sota,LISA: Layerwise Importance Sampling
LLMs 大模型微调Finetune,LISA强势来袭,相比LoRA微调LISA性能提升巨大,微调新方法LISA微调登榜sota,LISA: Layerwise Importance Sampling原创 2024-04-02 15:21:07 · 2199 阅读 · 0 评论 -
Pyhon 大模型常见的微调方式,LLMs常见的Finetune方式;chatglm3微调实战;大模型微调通俗易懂总结
Pyhon 大模型常见的微调方式,LLMs常见的Finetune方式;chatglm3微调实战;大模型微调通俗易懂总结原创 2024-04-01 18:25:22 · 3034 阅读 · 0 评论 -
python 人岗推荐论文,SHPJF模型代码,人岗推荐思路和实践
python 人岗推荐论文,SHPJF模型代码,人岗推荐思路和实践原创 2024-03-28 20:22:40 · 601 阅读 · 0 评论 -
Python MUFFIN人岗匹配,推荐算法,Self-Attentional Multi-Field Features Representation and Interaction Learning
Python MUFFIN人岗匹配,推荐算法,Self-Attentional Multi-Field Features Representation and Interaction Learning原创 2024-03-16 09:00:00 · 1389 阅读 · 2 评论 -
PaGE-Link:Path-based Graph Neural Network Explanation for Heterogeneous Link Prediction,链接预测,边预测和解释
PaGE-Link:Path-based Graph Neural Network Explanation for Heterogeneous Link Prediction,链接预测,边预测和解释原创 2024-03-14 15:44:33 · 1330 阅读 · 0 评论 -
Python deepFM推荐系统,推荐算法,deepFM源码实战,deepFM代码模板
Python deepFM推荐系统,推荐算法,deepFM源码实战,deepFM代码模板原创 2024-03-12 17:40:46 · 1574 阅读 · 0 评论 -
基于结构感知图学习的正-无标签节点分类,Positive-Unlabeled Node Classification with Structure-aware Graph Learning
基于结构感知图学习的正-无标签节点分类,Positive-Unlabeled Node Classification with Structure-aware Graph Learning原创 2024-03-12 10:08:37 · 814 阅读 · 0 评论 -
Dist-PU,正样本-无标签学习的一个pu-loss改进版。文章源自:Dist-PU: Positive-Unlabeled Learning from a Label Distribution P
Dist-PU,正样本-无标签学习的一个pu-loss改进版。文章源自:Dist-PU: Positive-Unlabeled Learning from a Label Distribution P原创 2024-03-07 15:57:53 · 918 阅读 · 0 评论 -
Python GCN、GAT、MP等图神经网络学习,从入门全面概述和讲解GNN,入门到精通图神经网络
Python GCN、GAT、MP等图神经网络学习,从入门全面概述和讲解GNN,入门到精通图神经网络原创 2024-02-02 14:14:29 · 986 阅读 · 0 评论 -
Python 猎户星空Orion-14B,截止到目前为止,各评测指标均名列前茅,综合指标最强;Orion-14B表现强大,LLMs大模型
Python 猎户星空Orion-14B,截止到目前为止,各评测指标均名列前茅,综合指标最强;Orion-14B表现强大,LLMs大模型原创 2024-01-23 11:55:43 · 2039 阅读 · 0 评论 -
BERT和ALBERT的区别;BERT和RoBERTa的区别;与bert相关的模型总结
BERT和ALBERT的区别;BERT和RoBERTa的区别;与bert相关的模型总结原创 2023-11-03 16:56:32 · 4636 阅读 · 0 评论 -
在NLP中一下常见的任务,可以用作baseline;MRPC,CoLA,STS-B,RTE
在NLP中一下常见的任务,可以用作baseline;MRPC,CoLA,STS-B,RTE原创 2023-10-26 11:08:37 · 1898 阅读 · 0 评论 -
sigmoid和softmax函数的区别;神经网路常用的损失函数以及对应的应用场景;softmax的作用
sigmoid和softmax函数的区别;神经网路常用的损失函数以及对应的应用场景;softmax的作用原创 2023-10-24 14:23:13 · 2235 阅读 · 0 评论 -
在推荐系统中,BPRloss、Embloss、CrossEntropyloss是怎么计算的,代表的意义是什么
在推荐系统中,BPRloss、Embloss、CrossEntropyloss是怎么计算的,代表的意义是什么;是如何计算的原创 2023-10-24 07:00:00 · 5107 阅读 · 0 评论 -
在推荐系统中,常用的评价指标如下:
在推荐系统中,常用的评价指标如下:recision@5、Recall@5、NDCG@5和MRR@5;在推荐系统中,常用的评价指标如下:recision@5、Recall@5、NDCG@5和MRR@5;的理解原创 2023-10-23 16:31:12 · 2099 阅读 · 0 评论 -
LLMs和GPT的相关概念
LLMs和GPT的相关概念,prompt、instruction、input和response在LLMs中的作用和区别;在LLMs中temperature、top p、top k、beams、stream output 分别表示的含义原创 2023-07-17 20:26:48 · 6003 阅读 · 0 评论 -
python 大模型处理的常见问答,知识蒸馏,数据增强,大模型funtuning,大模型训练
python 大模型处理的常见问答,知识蒸馏,数据增强,大模型funtuning,大模型训练;原创 2023-06-28 15:27:18 · 2194 阅读 · 1 评论 -
python 某度算法岗位,一面,手撕代码+八股文
python 某度算法岗位,一面,手撕代码+八股文原创 2023-06-15 11:07:27 · 1242 阅读 · 0 评论
分享