![](https://img-blog.csdnimg.cn/direct/5bfa24388c794b9c83e0c536a9f1d0a2.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
NLP&机器学习
文章平均质量分 91
本文主要记录工作、学习NLP以及机器学习涉及到的相关知识,和大家共同学习进步~
SmallerFL
到处搞点事情的程序猿;
一起进步,一起学习;
时不时记录,嘿嘿;
展开
-
LLM指令微调Prompt的最佳实践(六):基于ChatGPT搭建聊天机器人
本文主要介绍llm Prompt的最佳实践:基于ChatGPT搭建聊天机器人。本文根据《面向开发者的LLM入门教程》,总结凝练核心内容,加深印象,同时方便快速查阅浏览。原创 2024-07-09 16:29:30 · 876 阅读 · 0 评论 -
大模型常见的LoRA算法原理、实现和运用详解
本文介绍大模型llm微调环节的lora算法,包含lora的算法原理、实现以及运用详解!原创 2024-07-09 15:53:11 · 1028 阅读 · 0 评论 -
LLM指令微调Prompt的最佳实践(五):文本转换Prompt
本文介绍llm指令微调Prompt的最佳实践:文本转换。根据《面向开发者的LLM入门教程》],总结凝练核心内容,加深印象,同时方便快速查阅浏览。原创 2024-07-05 17:15:08 · 714 阅读 · 0 评论 -
LLM指令微调Prompt的最佳实践(三):编写文本摘要的Prompt
本文介绍 llm 指令微调 Prompt 的最佳实践:编写文本摘要的Prompt。根据《面向开发者的LLM入门教程》,总结凝练核心内容,加深印象,同时方便快速查阅浏览。原创 2024-07-04 15:13:58 · 802 阅读 · 0 评论 -
LLM指令微调Prompt的最佳实践(四):编写推理的Prompt
本文介绍llm指令微调Prompt的最佳实践:编写推断的Prompt。本文根据《面向开发者的LLM入门教程》,总结凝练核心内容,加深印象,同时方便快速查阅浏览。原创 2024-07-04 15:14:52 · 531 阅读 · 0 评论 -
LLM指令微调Prompt的最佳实践(二):Prompt迭代优化
本文根据《面向开发者的LLM入门教程》,主要介绍llm指令微调的Prompt的最佳实践:Prompt的迭代优化过程。原创 2024-07-02 17:44:22 · 999 阅读 · 0 评论 -
LLM指令微调Prompt的最佳实践(一):Prompt原则
本文根据《面向开发者的LLM入门教程》,主要介绍llm指令微调的Prompt的最佳实践:Prompt原则。原创 2024-07-02 17:29:47 · 840 阅读 · 0 评论 -
汇总大语言模型LLM的评测基准数据集(BenchMarks)
本文介绍大语言模型LLM的BenchMarks评测数据集,帮助评估模型能力。原创 2024-06-28 17:04:13 · 1060 阅读 · 0 评论 -
介绍opencompass具备哪些数据集?
本文介绍 Opencompass 具备哪些具体的数据集。原创 2024-06-28 15:36:28 · 385 阅读 · 0 评论 -
K8s 如何集成ChatGPT?
本文介绍如何集成 K8s 和 ChatGPT,以提升 K8s 的运维效率。原创 2024-06-21 10:58:27 · 510 阅读 · 0 评论 -
ChatGPT做2024高考数学题能得多少分?
chatgpt 做2024高考数学看能的多少分?原创 2024-06-11 11:26:05 · 1047 阅读 · 0 评论 -
NLP:将中文/英文文档切分多个句子
本文介绍如何利用 SpaCy 将中文、英文文档切分成多个句子。原创 2024-06-04 17:52:45 · 343 阅读 · 0 评论 -
NLP:如何计算两个句子的相似度
本文介绍如何利用 sentence_transformers 计算两个句子之间的相似程度。原创 2024-06-04 17:44:20 · 598 阅读 · 0 评论 -
各种“Ops“的对比:DevOps vs. DataOps vs. MLOps vs. AIOps
本文主要介绍各种 Ops 的对比,包含 DevOps、DataOps、MLOps以及AIOps等原创 2024-05-30 14:42:40 · 1014 阅读 · 0 评论 -
Pytorch: IterableDataset详细使用
本文介绍pytorch IterableDataset 的详细使用方法。原创 2024-05-28 15:37:44 · 474 阅读 · 0 评论 -
Pytorch: loss.backward()背后的原理
本文介绍pytorch的 loss.backward()的背后原理原创 2024-05-28 11:30:31 · 1631 阅读 · 0 评论 -
NLP深入学习(十五):LDA 模型
本文介绍nlp有关的lda模型,包含原理、公式以及python代码。原创 2024-05-23 18:47:50 · 1061 阅读 · 0 评论 -
GPT-4o 新旗舰模型,具备哪些多模态能力
本文介绍 GPT-4o, OpenAI 新的旗舰模型,具备哪些多模态能力。原创 2024-05-20 16:10:25 · 1053 阅读 · 0 评论 -
Pytorch CrossEntropyLoss() 原理和用法详解
本文主要介绍 Pytorch 的 CrossEntropyLoss 的原理和用法原创 2024-05-13 14:59:23 · 3994 阅读 · 2 评论 -
了解并实现一个Transformer Block
本文介绍什么是 Transformer Block,其中包含哪些细节内容。原创 2024-05-13 14:57:45 · 687 阅读 · 0 评论 -
NLP 词嵌入向量即word embedding原理详解
本文介绍 NLP 词嵌入向量即word embedding原理详解,包含word2vec的CBOW模型等。原创 2024-05-11 17:29:16 · 1661 阅读 · 0 评论 -
FastText 算法原理及使用方法
本文根据论文介绍 FastText 的原理以及使用方法。原创 2024-05-08 16:47:59 · 915 阅读 · 0 评论 -
常用的文本分类算法概览
本文介绍常用的文本分类算法概览,包含多种文本分类算法原创 2024-04-30 15:38:08 · 789 阅读 · 0 评论 -
国内外大模型免费访问入口汇总
本文主要介绍国内外的大模型免费访问入口,包含 gpt-3、gpt-4、Claude-3、Gemini、通义千问、文心一言、Kimi、海螺、讯飞星火、百川大模型、智谱AI大模型、盘古NLP大模型等。原创 2024-04-26 16:21:03 · 2036 阅读 · 0 评论 -
论文《ZeRO-Offload: Democratizing Billion-Scale Model Training》快览
本文主要介绍论文《ZeRO-Offload: Democratizing Billion-Scale Model Training》的主要内容。原创 2024-04-26 16:17:18 · 918 阅读 · 0 评论 -
LLM 为什么需要 tokenizer?
本文详细介绍为什么 llm 需要 tokenizer?原创 2024-04-24 15:59:47 · 1153 阅读 · 0 评论 -
详解GPT-4论文《GPT-4 Technical Report》
详解GPT-4论文《GPT-4 Technical Report》。原创 2024-04-16 17:09:27 · 1495 阅读 · 3 评论 -
详解GPT-1到GPT-3的论文亮点以及实验结论
详解GPT-1到GPT-3的论文亮点以及实验结论!原创 2024-04-12 18:14:33 · 1231 阅读 · 0 评论 -
NLP深入学习(十四):TextRank算法
本文介绍常见的NLP分词算法,TextRank 算法原创 2024-04-07 16:17:17 · 1451 阅读 · 0 评论 -
Pytorch torch.utils.data.DataLoader 用法详细介绍
本文详细介绍 Pytorch torch.utils.data.DataLoader 用法。原创 2024-04-03 17:57:06 · 1475 阅读 · 0 评论 -
PyTorch 常见用法介绍
介绍 Pytorch 张量基本操作,包含,创建张量、重塑张量、索引和切片、数据类型转换、深度学习相关的操作、损失函数、层和模型、优化器、自动求导以及保存和加载模型操作原创 2024-04-03 17:16:05 · 808 阅读 · 0 评论 -
NLP深入学习:结合源码详解 BERT 模型(三)
本文详细介绍 BERT模型 的预训练代码,包含modeling.BertModel、embedding_lookup、embedding_postprocessor、 transformer_model、get_masked_lm_output、get_next_sentence_output等方法原创 2024-03-28 15:59:45 · 1033 阅读 · 0 评论 -
Tensorflow 2.0 常见函数用法(一)
介绍 Tensorflow 2.0的一些常见函数用法,包含 tf.cast,tf.keras.layers.Dense,tf.variable_scope, tf.squeeze, tf.math.multiply原创 2024-03-22 23:52:05 · 631 阅读 · 0 评论 -
Tensorflow 2.0 基础用法(适合初入学习)
本文介绍 Tensorflow 2.0 的基础用法,适合初入门学习参考。原创 2024-03-14 10:51:27 · 861 阅读 · 0 评论 -
NLP深入学习:结合源码详解 BERT 模型(二)
本文主要介绍 BERT 源码预训练的数据准备代码!理清楚几个关键变量的含义:input_ids、input_mask、segment_ids、masked_lm_positions、masked_lm_ids、masked_lm_weights、next_sentence_labels原创 2024-03-14 10:45:50 · 1063 阅读 · 1 评论 -
NLP深入学习:结合源码详解 BERT 模型(一)
本文结合论文级源码介绍 BERT 模型,包含Pre-training(预训练)、Fine-tuning(微调)等流程。原创 2024-03-11 17:30:02 · 1059 阅读 · 0 评论 -
常见深度学习优化器 BGD、SGD、MBGD及Adam 对比总结
本文介绍深度学习常见的优化器:BGD、SGD、MBGD以及Adam原创 2024-03-04 17:17:41 · 1509 阅读 · 0 评论 -
NLP深入学习:大模型背后的Transformer模型究竟是什么?(二)
本文讲解 Transformer 模型的核心机制: Self-Attention 机制原创 2024-02-29 21:47:25 · 1009 阅读 · 0 评论 -
NLP深入学习:大模型背后的Transformer模型究竟是什么?(一)
本文主要讲解输入部分内容!后文会讲解核心的 Self-Attention 机制。原创 2024-02-27 17:43:57 · 1087 阅读 · 0 评论 -
深度学习:完全理解反向传播算法(二)
本文主要介绍深度学习网络的反向传播算法流程!原创 2024-02-22 15:48:34 · 847 阅读 · 0 评论