人工智能学习笔记_诸神缄默不语的博客-CSDN博客

人工智能学习笔记

关注

文章平均质量分 87

博主在人工智能领域的学习笔记

关注数：文章数：268 文章阅读量：1042668 文章收藏量：7197

作者: 诸神缄默不语

浙大AI硕士毕业生，研究方向主要是自然语言处理和图神经网络。目前在传统企业做研发岗。

展开

RAG检索增强生成（持续更新ing...）

本文系统性介绍RAG

原创 2025-05-18 13:58:02 · 333 阅读 · 0 评论
langchain.text_splitter：用RecursiveCharacterTextSplitter而不是CharacterTextSplitter，解决chunk过长的问题

langchain.text_splitter：用RecursiveCharacterTextSplitter而不是CharacterTextSplitter，解决chunk过长的问题

原创 2025-03-03 14:28:13 · 567 阅读 · 0 评论
LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程

LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程

原创 2025-02-21 11:31:51 · 567 阅读 · 0 评论
LangChain v0.1调用OpenAI接口进行智能问答教程

LangChain v0.1调用OpenAI接口进行智能问答教程

原创 2025-02-21 09:19:51 · 827 阅读 · 0 评论
深度学习中的Checkpoint是什么？

深度学习中的Checkpoint是什么？

原创 2025-02-09 12:22:31 · 1607 阅读 · 0 评论
阿里大模型：Qwen2.5

本文介绍Qwen2.5模型

原创 2025-02-09 10:39:39 · 1401 阅读 · 0 评论
Re 80 读论文：DeepSeek-V3：2025年初最强大模型（几天前还是的）

DeepSeek-V3论文阅读笔记

原创 2025-02-08 09:51:30 · 1526 阅读 · 0 评论
Re 79 读论文：RoPE RoFormer: Enhanced Transformer with Rotary Position Embedding

RoPE论文阅读笔记

原创 2025-02-07 10:11:53 · 925 阅读 · 0 评论
混合专家模型（MoE）详解

混合专家模型（MoE）详解

原创 2025-01-17 11:03:24 · 2177 阅读 · 0 评论
Re78 读论文：GPT-4 Technical Report

论文阅读笔记：GPT-4 Technical Report

原创 2025-01-15 16:12:00 · 1107 阅读 · 0 评论
Re77 读论文：LoRA: Low-Rank Adaptation of Large Language Models

论文阅读笔记：《LoRA: Low-Rank Adaptation of Large Language Models》

原创 2025-01-06 14:49:15 · 2344 阅读 · 0 评论
如何使用大语言模型进行事件抽取与关系抽取

本文介绍如何使用大语言模型进行事件抽取与关系抽取

原创 2024-12-31 14:52:09 · 1191 阅读 · 0 评论
Re76 读论文：新兴技术的多指标量化识别研究——基于向量表征方法的探索

《新兴技术的多指标量化识别研究——基于向量表征方法的探索》阅读笔记

原创 2024-12-04 15:17:21 · 462 阅读 · 0 评论
如何调用百度文心一言API实现智能问答

本文介绍如何调用百度文心一言API实现智能问答

原创 2024-11-30 13:14:55 · 2202 阅读 · 1 评论
Lora里面说大模型参数是over-parametrized（过参数的），什么是over-parametrized？（另附相关概念：double descent和bias-variance trade

Lora里面说大模型参数是over-parametrized（过参数的），什么是over-parametrized？（另附相关概念：double descent和bias-variance trade

原创 2024-11-20 14:27:47 · 1775 阅读 · 0 评论
游程编码（Run-Length Encoding, RLE）在图像分割中的应用

本文介绍游程编码（Run-Length Encoding, RLE）在图像分割中的应用

原创 2024-11-15 18:01:00 · 568 阅读 · 0 评论
RGBA图像格式详解

RGBA代表红（Red）、绿（Green）、蓝（Blue）和透明度（Alpha）。它是在RGB颜色模型的基础上增加了一个透明度通道，使得图像可以表现出半透明效果。红色（R）：表示红色的强度，取值范围为0-255。绿色（G）：表示绿色的强度，取值范围为0-255。蓝色（B）：表示蓝色的强度，取值范围为0-255。透明度（A）：表示图像的透明度，取值范围为0-255。其中，0表示完全透明，255表示完全不透明。

原创 2024-11-15 17:46:40 · 1858 阅读 · 0 评论
PIL包在Python图像处理中的应用

本文介绍PIL包在Python图像处理中的应用

原创 2024-11-15 17:43:34 · 515 阅读 · 0 评论
Python 3中的OpenCV（cv2）：图像处理的强大工具

本文介绍cv2包

原创 2024-11-15 14:58:11 · 1346 阅读 · 0 评论
torchvision库在进行图片转换操作中报antialias参数没有显式设置会导致不同图片后端中的值不统一的警告信息

处理torchvision库的警告信息：UserWarning: The default value of the antialias parameter of all the resizing transforms (Resize(), RandomResizedCrop(), etc.) will change from None to True in v0.17, in order to be consistent across the PIL and Tensor backends. To supp

原创 2024-11-15 14:28:03 · 865 阅读 · 0 评论
如何在Win10系统本地部署语音转文字模型FunASR

本文介绍如何在Win10系统本地部署语音转文字模型FunASR

原创 2024-11-11 22:49:26 · 2954 阅读 · 2 评论
提示工程指南笔记

《提示工程指南》笔记

原创 2024-11-05 15:16:08 · 1267 阅读 · 0 评论
Re75 读论文：Toolformer: Language Models Can Teach Themselves to Use Tools

论文阅读笔记：Toolformer: Language Models Can Teach Themselves to Use Tools

原创 2024-10-16 16:45:41 · 1233 阅读 · 0 评论
Re74 读论文：DataGemma Knowing When to Ask - Bridging Large Language Models and Data

DataGemma技术报告阅读笔记

原创 2024-09-26 11:20:12 · 747 阅读 · 0 评论
DataGemma：谷歌大模型

本文介绍DataGemma：谷歌大模型

原创 2024-09-24 19:10:59 · 440 阅读 · 0 评论
Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）

Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）

原创 2024-07-20 16:39:09 · 1051 阅读 · 0 评论
香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵

香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵

原创 2024-05-25 18:29:12 · 1448 阅读 · 0 评论
Re72：读论文 XLM Cross-lingual Language Model Pretraining

XLM论文阅读笔记

原创 2024-05-25 15:48:50 · 535 阅读 · 0 评论
Application Development using Large Language Models笔记

Application Development using Large Language Models笔记

原创 2024-05-17 10:29:36 · 931 阅读 · 0 评论
Re71：读论文 Sequence to Sequence Learning with Neural Networks

《Sequence to Sequence Learning with Neural Networks》论文阅读笔记

原创 2024-05-02 17:22:24 · 959 阅读 · 0 评论
机器翻译常用指标BLEU

本文介绍机器翻译常用指标BLEU

原创 2024-05-02 14:41:22 · 2047 阅读 · 0 评论
Re70：读论文 T5 Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

T5论文阅读笔记

原创 2024-05-01 20:02:31 · 1459 阅读 · 0 评论
Re69：读论文 LaMDA: Language Models for Dialog Applications

《LaMDA: Language Models for Dialog Applications》论文阅读笔记

原创 2024-04-29 14:57:22 · 1341 阅读 · 0 评论
Re68：读论文 instruction tuning FLAN Finetuned Language Models Are Zero-Shot Learners

《Finetuned Language Models Are Zero-Shot Learners》论文阅读笔记

原创 2024-04-23 15:54:18 · 1262 阅读 · 0 评论
完全小白如何用Windows电脑运行人生中的第一个Bert文本分类代码（更简单版）

BERT文本分类入门代码

原创 2024-04-22 14:17:11 · 1293 阅读 · 0 评论
文字转语音TTS工具，开源可本地或云端部署：GPT-SoVITS

本文介绍文字转语音工具：GPT-SoVITS

原创 2024-04-15 17:13:25 · 4899 阅读 · 1 评论
Re67：读论文 Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities

《Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities》论文阅读笔记

原创 2024-04-14 16:50:47 · 787 阅读 · 0 评论
Re66：读论文 Bottom-Up Abstractive Summarization

《Bottom-Up Abstractive Summarization》论文阅读笔记

原创 2024-04-14 16:28:58 · 943 阅读 · 0 评论
Re65：读论文 GPT-3 Language Models are Few-Shot Learners

《Language Models are Few-Shot Learners》论文阅读笔记

原创 2024-04-14 11:17:24 · 1348 阅读 · 0 评论
ECAI 2024投稿指南

ECAI 2024投稿指南

原创 2024-04-07 14:11:45 · 4857 阅读 · 6 评论

人工智能学习笔记

作者: 诸神缄默不语

RAG检索增强生成（持续更新ing...）

langchain.text_splitter：用RecursiveCharacterTextSplitter而不是CharacterTextSplitter，解决chunk过长的问题

LangChain v0.3 langchain.chat_models.init_chat_model调用现成大模型接口进行智能问答教程

LangChain v0.1调用OpenAI接口进行智能问答教程

深度学习中的Checkpoint是什么？

阿里大模型：Qwen2.5

Re 80 读论文：DeepSeek-V3：2025年初最强大模型（几天前还是的）

Re 79 读论文：RoPE RoFormer: Enhanced Transformer with Rotary Position Embedding

混合专家模型（MoE）详解

Re78 读论文：GPT-4 Technical Report

Re77 读论文：LoRA: Low-Rank Adaptation of Large Language Models

如何使用大语言模型进行事件抽取与关系抽取

Re76 读论文：新兴技术的多指标量化识别研究——基于向量表征方法的探索

如何调用百度文心一言API实现智能问答

Lora里面说大模型参数是over-parametrized（过参数的），什么是over-parametrized？（另附相关概念：double descent和bias-variance trade

游程编码（Run-Length Encoding, RLE）在图像分割中的应用

RGBA图像格式详解

PIL包在Python图像处理中的应用

Python 3中的OpenCV（cv2）：图像处理的强大工具

torchvision库在进行图片转换操作中报antialias参数没有显式设置会导致不同图片后端中的值不统一的警告信息

如何在Win10系统本地部署语音转文字模型FunASR

提示工程指南 笔记

Re75 读论文：Toolformer: Language Models Can Teach Themselves to Use Tools

Re74 读论文：DataGemma Knowing When to Ask - Bridging Large Language Models and Data

DataGemma：谷歌大模型

Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）

香农信息量/自信息、信息熵、相对熵/KL散度/信息散度、交叉熵

Re72：读论文 XLM Cross-lingual Language Model Pretraining

Application Development using Large Language Models笔记

Re71：读论文 Sequence to Sequence Learning with Neural Networks

机器翻译常用指标BLEU

Re70：读论文 T5 Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

Re69：读论文 LaMDA: Language Models for Dialog Applications

Re68：读论文 instruction tuning FLAN Finetuned Language Models Are Zero-Shot Learners

完全小白如何用Windows电脑运行人生中的第一个Bert文本分类代码（更简单版）

文字转语音TTS工具，开源可本地或云端部署：GPT-SoVITS

Re67：读论文 Don‘t Trust ChatGPT when Your Question is not in English: A Study of Multilingual Abilities

Re66：读论文 Bottom-Up Abstractive Summarization

Re65：读论文 GPT-3 Language Models are Few-Shot Learners

ECAI 2024投稿指南

提示工程指南笔记