HMTT
码龄7年
关注
提问 私信
  • 博客:305,804
    305,804
    总访问量
  • 100
    原创
  • 147,101
    排名
  • 247
    粉丝
  • 1
    铁粉

个人简介:有任何问题,可以使用QQ824626339联系本人,博客私信不常看

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江苏省
  • 加入CSDN时间: 2018-06-15
博客简介:

HMT的博客

查看详细资料
  • 原力等级
    当前等级
    5
    当前总分
    1,128
    当月
    2
个人成就
  • 获得460次点赞
  • 内容获得72次评论
  • 获得1,653次收藏
  • 代码片获得3,569次分享
创作历程
  • 8篇
    2024年
  • 8篇
    2023年
  • 12篇
    2022年
  • 31篇
    2021年
  • 41篇
    2020年
成就勋章
TA的专栏
  • 机器学习/深度学习
    4篇
  • pytorch学习
    22篇
  • 其他
    3篇
  • 论文随笔
    9篇
  • #pytorch_lightning
    1篇
  • torchtext
    3篇
  • Transformers
    13篇
  • 基础算法
    27篇
  • C语言相关
    28篇
  • leetcode做题
    2篇
  • 数据库基础
    10篇
  • 数据结构概念相关
    13篇
兴趣领域 设置
  • 人工智能
    深度学习自然语言处理pytorchnlp
创作活动更多

新星杯·14天创作挑战营·第9期

这是一个以写作博客为目的的创作活动,旨在鼓励大学生博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。我们诚挚邀请你们参加为期14天的创作挑战赛! 注: 1、参赛者可以进入活动群进行交流、分享创作心得,互相鼓励与支持(开卷),答疑及活动群请见 https://bbs.csdn.net/topics/619626357 2、文章质量分查询:https://www.csdn.net/qc

474人参与 去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

pycharm的debug模式不会在非断点处抛出异常时暂停

pycharm调试(debug)模式下自动在异常处暂停并允许调试的功能非常好用,可以帮助我们快速定位错误并解决。但在远程调试的时候,pycharm的debug模式在非断点处碰到异常时会直接退出,无法暂停。有时候虽然能暂停,但会定位到奇怪的地方。如下图:我这里有个除以0的异常,但debug却定位到了其他地方:这种情况非常莫名其妙,且不知道怎么搜索这个问题。
原创
发布博客 2024.07.30 ·
488 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

关于transformers库验证时不进入compute_metrics方法的一些坑

就会是false,从而无法进入compute_metrics方法。这样就可以进入compute_metrics函数了。生成式任务如果没有标签字段,即。
原创
发布博客 2024.07.11 ·
659 阅读 ·
3 点赞 ·
1 评论 ·
2 收藏

Q-Learning实战——找房间

样例来自简单来说就是。
原创
发布博客 2024.07.08 ·
454 阅读 ·
4 点赞 ·
0 评论 ·
4 收藏

CIDEr(Consensus-based Image Description Evaluation)的计算

CIDEr的计算
原创
发布博客 2024.07.04 ·
1320 阅读 ·
16 点赞 ·
0 评论 ·
8 收藏

trainer使用 torch.utils.data 的 Dataset

在transformers库的Trainer中使用pytorch自带的Dataset类
原创
发布博客 2024.07.02 ·
461 阅读 ·
6 点赞 ·
0 评论 ·
9 收藏

Automated clinical coding using off-the-shelf large language models

给住院病人分配icd诊断编码通常是专业的人类编码专家的工作。在人工智能领域,主要的方向是通过有监督深度学习模型来进行自动icd编码。然而,学习如何预测大量的罕见编码仍然是临床实践中存在的困难。因此本文尝试利用现成的大语言模型来尝试开发一个零样本和少样本的编码对齐方案,尝试避开特定任务的训练过程。由于无监督的预训练并不能保证对于ICD本体和临床编码任务的准确性,因此本文将任务视为信息抽取。让大语言模型根据提供的编码概念来进行相关提及的抽取。
原创
发布博客 2024.01.21 ·
747 阅读 ·
9 点赞 ·
0 评论 ·
7 收藏

Graph of Thoughts: Solving Elaborate Problems with Large Language Models

本文提出了思维图Graph of Thoughts (GoT),是一个用于提升大语言模型提示能力的框架。与之前工作思维链(CoT)、思维树(ToT)类似,但思维图有将大语言模型产生的信息建模为图结构的能力。提出了一种新的方法来增强大语言模型通过网络进行推理的能力。设计了用于实现GoT的模块化框架。展示了几个GoT的使用案例(排序、摘要关键词计数、集合操作、文档合并),并详细说明如何使用基于图的范式来实现它们。评估GoT并展示其相对于现有技术的优势。
原创
发布博客 2024.01.18 ·
883 阅读 ·
8 点赞 ·
0 评论 ·
7 收藏

Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding

过去的工作通常使用标签注意力来匹配相关的文本片段。本文认为编码的同义词能提供更加丰富的信息,因为电子病历中的表达方式通常与ICD编码的描述不一致。因此作者将ICD编码与UMLS中的概念进行了对齐,并收集了一些同义词。文中样例:编码244.9的icd描述为“Unspecified hypothyroidism “,但在电子病历中通常与”low t4“和“subthyroidism”相关。
原创
发布博客 2024.01.11 ·
544 阅读 ·
8 点赞 ·
0 评论 ·
9 收藏

LARGE LANGUAGE MODELS ARE HUMAN-LEVEL PROMPT ENGINEERS

在大模型时代,提示的作用非常巨大,一个好的提示可以在任务中表现出极好的性能。但通常来说最有效的提示是由人手工制作的,需要耗费大量的人工开销。因此本文就尝试让大语言模型自动生提示本并优化提示。
原创
发布博客 2023.12.18 ·
1600 阅读 ·
9 点赞 ·
0 评论 ·
7 收藏

CESI: Canonicalizing Open Knowledge Bases using Embeddings and Side Information

本文的任务是开放性知识图谱标准化,旨在将开放信息抽取中的实体和关系进行标准化,将相同意义但不同描述的实体和关系归为一类。本文指出,过去的方法需要手动定义特征,并以此进行聚类。这些方法往往非常昂贵且通常只能得到次优结果。因此作者提出了一个新的框架,通过训练嵌入的方式来进行特征提取。
原创
发布博客 2023.12.18 ·
900 阅读 ·
18 点赞 ·
0 评论 ·
16 收藏

Can LLM-Generated Misinformation Be Detected?

本文讨论**“大语言模型生成的错误是否能被检测出来?”**这个问题,并做了一系列研究实验。大语言模型的出现对自然语言处理领域造成变革性的影响。然而,像ChatGPT这样的大语言模型有可能被用来制造错误信息,这对网络安全和公众信任构成了严重威胁。大语言模型制造的错误信息会比人类构造的错误信息产生更大的危害吗?如何利用大语言模型生成错误信息?人类是否能检测大语言模型生成的错误信息?侦测器是否能检测大语言模型生成的错误信息?
原创
发布博客 2023.12.11 ·
1156 阅读 ·
17 点赞 ·
0 评论 ·
23 收藏

Low-resource Personal Attribute Prediction from Conversations

本文研究的任务是个人属性预测,旨在通过用户的对话内容,从中推断出用户的一些隐含属性,如职业或爱好。文中为了解决上述问题,提出了PEARL,可以在资源受限的情况下,仅通过未标记的对话数据来预测个人属性。通过一个迭代的基于双词语义的Gibbs抽样过程,AKI模块建立了属性值与主题之间的关联,并优化了双词-属性值相似性分数的计算。PEARL可以在不依赖于标记的语料或外部数据的情况下表现良好,使得它能够低资源情况的也能保持良好的效果,这在实际应用中很常见,因为标记数据往往难以获取。
原创
发布博客 2023.12.08 ·
409 阅读 ·
8 点赞 ·
0 评论 ·
10 收藏

Iterative Entity Alignment via Knowledge Embeddings

本文的任务是实体对齐,目的是将两个知识图谱的实体和关系进行对齐(假设范围相同)。之前的方法往往依赖于实体的外部知识库,比如维基百科,因此需要花费大量的资源来手动构造特征以完成对齐。本文提出了一个基于联合知识嵌入的方法。根据少量的已对齐实体,将不同知识图谱的实体和关系编码到同一个低纬度语义空间。
原创
发布博客 2023.12.07 ·
454 阅读 ·
10 点赞 ·
0 评论 ·
8 收藏

PyTorch Lightning基础入门

pytorch_ligntning的一些基础操作
原创
发布博客 2023.06.28 ·
2409 阅读 ·
1 点赞 ·
2 评论 ·
0 收藏

stable-diffusion-webui 快捷安装教程

本文介绍了Stable Diffusion Webui框架在linux环境下的安装流程,包含了绝大部分依赖库,自测可以正常运行
原创
发布博客 2023.06.19 ·
2723 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

Alist百度网盘大文件需要权限解决

解决Alist中百度云大文件无法复制的问题
原创
发布博客 2023.02.13 ·
10110 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

EM算法——投硬币样例实现

有c个硬币,每次随机选一个投掷n次,重复执行m次并记录结果。根据投掷结果计算出每个硬币正面的概率。每次选择的硬币未知。随机初始化硬币为正的概率 head_p根据 head_p 求出选择某个硬币的概率 selected_p根据 selected_p 计算新的硬币概率 head_p若 head_p 收敛,执行5;否则,执行2结束。
原创
发布博客 2022.12.09 ·
1096 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Transformers实战——使用Trainer类训练和评估自己的数据和模型

使用Transformers中的Trainer类训练自己的模型
原创
发布博客 2022.04.06 ·
28241 阅读 ·
35 点赞 ·
20 评论 ·
78 收藏

Transformers实战——使用本地数据进行AclImdb情感分类

使用本地数据进行AclImdb情感分类
原创
发布博客 2022.04.01 ·
4023 阅读 ·
9 点赞 ·
6 评论 ·
33 收藏

Transformers训练和微调:Training and Fine-tuning

使用Transformers来训练和微调模型
原创
发布博客 2022.03.28 ·
9921 阅读 ·
10 点赞 ·
3 评论 ·
31 收藏
加载更多