
人工智能学习笔记
文章平均质量分 87
博主在人工智能领域的学习笔记
诸神缄默不语
浙大AI硕士毕业生,研究方向主要是自然语言处理和图神经网络。目前在传统企业做研发岗。
展开
-
RAG检索增强生成(持续更新ing...)
本文系统性介绍RAG原创 2025-05-18 13:58:02 · 333 阅读 · 0 评论 -
langchain.text_splitter:用RecursiveCharacterTextSplitter而不是CharacterTextSplitter,解决chunk过长的问题
langchain.text_splitter:用RecursiveCharacterTextSplitter而不是CharacterTextSplitter,解决chunk过长的问题原创 2025-03-03 14:28:13 · 567 阅读 · 0 评论 -
LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程
LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程原创 2025-02-21 11:31:51 · 567 阅读 · 0 评论 -
LangChain v0.1调用OpenAI接口进行智能问答教程
LangChain v0.1调用OpenAI接口进行智能问答教程原创 2025-02-21 09:19:51 · 827 阅读 · 0 评论 -
深度学习中的Checkpoint是什么?
深度学习中的Checkpoint是什么?原创 2025-02-09 12:22:31 · 1607 阅读 · 0 评论 -
阿里大模型:Qwen2.5
本文介绍Qwen2.5模型原创 2025-02-09 10:39:39 · 1401 阅读 · 0 评论 -
Re 80 读论文:DeepSeek-V3:2025年初最强大模型(几天前还是的)
DeepSeek-V3论文阅读笔记原创 2025-02-08 09:51:30 · 1526 阅读 · 0 评论 -
Re 79 读论文:RoPE RoFormer: Enhanced Transformer with Rotary Position Embedding
RoPE论文阅读笔记原创 2025-02-07 10:11:53 · 925 阅读 · 0 评论 -
混合专家模型(MoE)详解
混合专家模型(MoE)详解原创 2025-01-17 11:03:24 · 2177 阅读 · 0 评论 -
Re78 读论文:GPT-4 Technical Report
论文阅读笔记:GPT-4 Technical Report原创 2025-01-15 16:12:00 · 1107 阅读 · 0 评论 -
Re77 读论文:LoRA: Low-Rank Adaptation of Large Language Models
论文阅读笔记:《LoRA: Low-Rank Adaptation of Large Language Models》原创 2025-01-06 14:49:15 · 2344 阅读 · 0 评论 -
如何使用大语言模型进行事件抽取与关系抽取
本文介绍如何使用大语言模型进行事件抽取与关系抽取原创 2024-12-31 14:52:09 · 1191 阅读 · 0 评论 -
Re76 读论文:新兴技术的多指标量化识别研究——基于向量表征方法的探索
《新兴技术的多指标量化识别研究——基于向量表征方法的探索》阅读笔记原创 2024-12-04 15:17:21 · 462 阅读 · 0 评论 -
如何调用百度文心一言API实现智能问答
本文介绍如何调用百度文心一言API实现智能问答原创 2024-11-30 13:14:55 · 2202 阅读 · 1 评论 -
Lora里面说大模型参数是over-parametrized(过参数的),什么是over-parametrized?(另附相关概念:double descent和bias-variance trade
Lora里面说大模型参数是over-parametrized(过参数的),什么是over-parametrized?(另附相关概念:double descent和bias-variance trade原创 2024-11-20 14:27:47 · 1775 阅读 · 0 评论 -
游程编码(Run-Length Encoding, RLE)在图像分割中的应用
本文介绍游程编码(Run-Length Encoding, RLE)在图像分割中的应用原创 2024-11-15 18:01:00 · 568 阅读 · 0 评论 -
RGBA图像格式详解
RGBA代表红(Red)、绿(Green)、蓝(Blue)和透明度(Alpha)。它是在RGB颜色模型的基础上增加了一个透明度通道,使得图像可以表现出半透明效果。红色(R):表示红色的强度,取值范围为0-255。绿色(G):表示绿色的强度,取值范围为0-255。蓝色(B):表示蓝色的强度,取值范围为0-255。透明度(A):表示图像的透明度,取值范围为0-255。其中,0表示完全透明,255表示完全不透明。原创 2024-11-15 17:46:40 · 1858 阅读 · 0 评论 -
PIL包在Python图像处理中的应用
本文介绍PIL包在Python图像处理中的应用原创 2024-11-15 17:43:34 · 515 阅读 · 0 评论 -
Python 3中的OpenCV(cv2):图像处理的强大工具
本文介绍cv2包原创 2024-11-15 14:58:11 · 1346 阅读 · 0 评论 -
torchvision库在进行图片转换操作中报antialias参数没有显式设置会导致不同图片后端中的值不统一的警告信息
处理torchvision库的警告信息:UserWarning: The default value of the antialias parameter of all the resizing transforms (Resize(), RandomResizedCrop(), etc.) will change from None to True in v0.17, in order to be consistent across the PIL and Tensor backends. To supp原创 2024-11-15 14:28:03 · 865 阅读 · 0 评论 -
如何在Win10系统本地部署语音转文字模型FunASR
本文介绍如何在Win10系统本地部署语音转文字模型FunASR原创 2024-11-11 22:49:26 · 2954 阅读 · 2 评论 -
提示工程指南 笔记
《提示工程指南》笔记原创 2024-11-05 15:16:08 · 1267 阅读 · 0 评论 -
Re75 读论文:Toolformer: Language Models Can Teach Themselves to Use Tools
论文阅读笔记:Toolformer: Language Models Can Teach Themselves to Use Tools原创 2024-10-16 16:45:41 · 1233 阅读 · 0 评论 -
Re74 读论文:DataGemma Knowing When to Ask - Bridging Large Language Models and Data
DataGemma技术报告阅读笔记原创 2024-09-26 11:20:12 · 747 阅读 · 0 评论 -
DataGemma:谷歌大模型
本文介绍DataGemma:谷歌大模型原创 2024-09-24 19:10:59 · 440 阅读 · 0 评论 -
Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南(写了一半跑去改大论文了所以没正式参赛)
Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南(写了一半跑去改大论文了所以没正式参赛)原创 2024-07-20 16:39:09 · 1051 阅读 · 0 评论 -
香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵
香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵原创 2024-05-25 18:29:12 · 1448 阅读 · 0 评论 -
Re72:读论文 XLM Cross-lingual Language Model Pretraining
XLM论文阅读笔记原创 2024-05-25 15:48:50 · 535 阅读 · 0 评论 -
Application Development using Large Language Models笔记
Application Development using Large Language Models笔记原创 2024-05-17 10:29:36 · 931 阅读 · 0 评论 -
Re71:读论文 Sequence to Sequence Learning with Neural Networks
《Sequence to Sequence Learning with Neural Networks》论文阅读笔记原创 2024-05-02 17:22:24 · 959 阅读 · 0 评论 -
机器翻译常用指标BLEU
本文介绍机器翻译常用指标BLEU原创 2024-05-02 14:41:22 · 2047 阅读 · 0 评论 -
Re70:读论文 T5 Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
T5论文阅读笔记原创 2024-05-01 20:02:31 · 1459 阅读 · 0 评论 -
Re69:读论文 LaMDA: Language Models for Dialog Applications
《LaMDA: Language Models for Dialog Applications》论文阅读笔记原创 2024-04-29 14:57:22 · 1341 阅读 · 0 评论 -
Re68:读论文 instruction tuning FLAN Finetuned Language Models Are Zero-Shot Learners
《Finetuned Language Models Are Zero-Shot Learners》论文阅读笔记原创 2024-04-23 15:54:18 · 1262 阅读 · 0 评论 -
完全小白如何用Windows电脑运行人生中的第一个Bert文本分类代码(更简单版)
BERT文本分类入门代码原创 2024-04-22 14:17:11 · 1293 阅读 · 0 评论 -
文字转语音TTS工具,开源可本地或云端部署:GPT-SoVITS
本文介绍文字转语音工具:GPT-SoVITS原创 2024-04-15 17:13:25 · 4899 阅读 · 1 评论 -
Re67:读论文 Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities
《Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities》论文阅读笔记原创 2024-04-14 16:50:47 · 787 阅读 · 0 评论 -
Re66:读论文 Bottom-Up Abstractive Summarization
《Bottom-Up Abstractive Summarization》论文阅读笔记原创 2024-04-14 16:28:58 · 943 阅读 · 0 评论 -
Re65:读论文 GPT-3 Language Models are Few-Shot Learners
《Language Models are Few-Shot Learners》论文阅读笔记原创 2024-04-14 11:17:24 · 1348 阅读 · 0 评论 -
ECAI 2024投稿指南
ECAI 2024投稿指南原创 2024-04-07 14:11:45 · 4857 阅读 · 6 评论