自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 收藏
  • 关注

原创 2025 百度提前批校招内推

百度,内推,提前批 ,2025

2024-07-08 13:18:39 1063 2

原创 symbol cublasLtHSHMatmulAlgoInit version libcublasLt.so.11 not defined in file libcublasLt.so.11

cuda debug

2024-03-04 21:25:21 461 2

原创 计算机是什么做的

硅 半导体 cpu

2024-01-30 23:04:42 461

原创 使用 Pegasus-t5 预训练模型遇到问题解决

中文摘要 预训练模型

2024-01-29 15:10:38 578

原创 ValueError Your setup doesn‘t support bf16gpu. You need torch=1.10, using Ampere GPU with cuda=11.0

debug 深度学习训练,bf16

2023-11-08 17:05:35 2467 2

原创 huggingface 的trainer训练框架优势

训练框架,trainer,huggingface , transformers

2023-11-07 17:19:50 648

原创 评估大型语言模型:综述

大模型评估,综述,论文笔记

2023-11-06 15:52:25 684

原创 解决mac系统终端无法使用vpn

vpn mac终端

2023-10-11 11:17:18 4921

原创 FlashAttention

flashattention llm加速

2023-08-11 10:29:10 337

原创 TypeError Object of type int64 is not JSON serializable

debug python json numpy

2023-05-19 11:02:47 368

原创 大模型Founation Model

大模型 LLM Foundation Model NLP

2023-05-16 11:38:21 661

原创 教练,我想写论文

论文 NLP 人工智能 如何写论文

2023-05-06 10:45:34 438

原创 工业界NER

NER 搜索领域 美团

2023-05-04 16:59:50 452

原创 LLM 大规模语言模型综述

LLM 大模型 综述 survey

2023-04-18 18:12:12 2046

原创 T5模型及其后续优化

t5 transformer text-to-text 预训练模型

2023-04-11 15:04:33 1634

原创 论文笔记 CoT:提示+推理+大模型=思维链提示

Google Brain CoT 思维链提示,为后面Instruction Finetune 打下基础的论文

2023-04-10 15:42:05 2320 1

原创 LLaMA Open and Efficient Foundation Language Models

LLaMA 大规模语言模型 论文笔记

2023-04-10 12:17:31 328

原创 解决libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit

解决安装pyroch1.13的报错

2023-02-15 10:32:46 7579 4

原创 Boundary Smoothing for NER

ACL2022 NER 实体抽取 中文NER 置信度

2022-12-15 11:07:34 484

原创 一种用于半监督文本分类的渐进类语义匹配方法

NAACL 2022 半监督文本分类,少样本

2022-11-04 11:36:28 341

原创 MGIMN:用于Few-shot文本分类的多粒度交互式匹配网络

NAACL 2022. Few-shot 文本分类 少样本 文本匹配 阿里达摩院

2022-11-02 15:37:54 301

原创 EPiDA:用于高性能文本分类的简单插件数据增强框架

NAACL 2022 ,DA 数据增强,文本分类

2022-10-13 15:52:33 427 1

原创 优化器 optimizer

优化器 optimizer 学习率 scheduler

2022-09-02 15:07:50 1827

原创 Pytorch-lightning

Pytorch-Lightning AI工具库

2022-09-01 10:32:21 1206 2

原创 句向量 Sentence Embedding

句向量 Sentence embedding 对比学习 SimCSE SCD Bert-flow Bert-whitening

2022-07-11 12:48:17 2335 2

原创 去相关与白化

去相关 白化 PCA

2022-07-11 10:40:39 1124

原创 SCD Self-Contrastive Decorrelation for Sentence Embeddings

ACL2022 句向量 句嵌入向量 sentence embedding 对比学习 自监督 NLP

2022-07-11 00:10:58 340

原创 A Closer Look at How Fine-tuning Changes BERT

ACL 2022 bert的fine-tune机制对向量表示的影响分析

2022-07-05 17:38:58 581

原创 ParaBLEU:Generative Pretraining for Paraphrase Evaluation

ACL2022 生成任务评测 ParaBLEU

2022-05-29 11:56:41 125

原创 GLM General Language Model Pretraining with Autoregressive Blank Infilling

ACL2022 统一预训练模型

2022-05-29 11:52:49 1937 1

原创 ACL 2022 泛读文章 (一)

ACL 2022 论文笔记 论文泛读

2022-05-26 16:57:22 376

原创 CLIP的后续工作

CLIP的后续工作clip作为Open-AI给咱做的一个玩具,自从21年2月到22年5月看了一下差不多有一千篇有关的工作和论文,下面介绍一下一些比较有趣的工作,在github上star比较多的工作。StyleCLIP论文链接:https://arxiv.org/pdf/2103.17249.pdf项目链接:https://github.com/orpatashnik/StyleCLIP结合StyleGAN和CLIP的工作,提出了三种结合方法:以文本为指导的 latent 优化,其中

2022-05-18 16:29:06 1765 4

原创 GLIDE 学习笔记

GLIDE模型完成,文字条件生成图片,图片修复任务。

2022-05-17 15:42:35 4643

原创 SimCTG:缓解GPT2在生成任务上token的各向异性

2022 腾讯AI lab的文章,使用SimCTG对比损失loss和decode解码方式,来缓解生成模型的各向异性问题,解决重复生成问题,有代码示例。

2022-05-15 23:07:41 1098

原创 CLIP学习笔记

CLIP 学习笔记论文:Learning Transferable Visual Models From Natural Language SupervisionopenAI在2021年2月发表对NLP和CV圈都很重要的一篇工作主要是通过4亿个文本图片对,进行对比学习预训练,得到词和图片的embedding转换器,在图片分类zero-shot上达到很好效果,后续也可以接很多工作。clip的github地址 openai/CLIP: Contrastive Language-Image Pretrai

2022-05-13 15:38:45 1832

原创 字节AL LAB nlp 日常实习面试失败

面试失败公司:字节跳动职位 : AL lab 的NLP方向面试时长 :1h一面就失败了,没有二面,面试官非常年轻,感觉字节面试官都很年轻。面试官因为疫情也是在居家远程办公,虽然最后没面过,但就像东京喰种里面所说,世界上一切的不利都是当事人能力不足所导致的,跟面试官没什么关系。刚开始自我介绍一下,xx大学读研,研一下,NLP方向,想找个日常实习,没论文,项目也都不是纯NLP方向的,比赛经历,最近在搞京东GAIIC 赛道二的复赛,其他去年参加过百度的两个比赛,都没取得什么名次。研究方向的话NER比

2022-05-10 22:24:13 648 1

原创 BitFit : Bias-term Fine-tuning

ACL2022 ,fine-tune 变体

2022-04-15 11:24:16 2947 1

原创 PRIMERA Pyramid-based Masked Sentence Pre-training for Multi-document Summarization

ACL 2021 多文档摘要 预训练模型 state-of-the-art

2022-04-09 21:28:38 3254 2

原创 Back to CSDN

Back to CSDN当下人们生活形式越发单一,疫情还没完全消除,许多学校,包括我的学校还没解封,导致生活单一无趣,就希望可以把无聊的日常进行分享和记录,这样可能就不会感觉过于无聊了哈。许多人在微博,朋友圈和QQ空间分享日常生活,也有人喜欢拍摄vlog放到B站,抖音等平台分享自我,也有的喜欢放自己生活照片到ins上。对于我们这类特定的人群–程序员,热衷于偶尔把自己的经验总结,方法技术,论文笔记,放到知乎,博客园,CSDN上进行分享,最近我通过打一个比赛,在交流方法中,了解了一个大神–苏剑林,苏神。然

2022-03-28 19:55:28 299

原创 tf-idf kmeans文本聚类

文本聚类数据集 THUnews中文新闻文本分类方法 jieba分词后,使用tf-idf提取特征,提取时使用停用词表删除停用词,最后使用kmeans进行聚类。优化 优化停用词表,增加max_feature特征,使用minibatchkmeans增加聚类速度评价标准 外在(已知标签) 兰德基数RI ,调整兰德基数 ARI内在 轮廓系数from sklearn.feature_extraction.text import TfidfVectorizerimport paddlenlpfrom

2021-11-09 19:24:05 3732

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除