自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

青山的博客

软件是工具,赋予其智慧

  • 博客(64)
  • 收藏
  • 关注

原创 Ollama离线部署模型

文章主要内容是没有显卡的CPU环境下,Linux系统中进行私有化大语言模型、embedding模型的部署部署

2025-01-10 01:30:00 611

原创 ElasticSearch基础学习使用

简要分享ES的docker安装,浏览器客户端插件,以及分词插件使用、关键词检索的简单案例分享

2024-12-31 08:00:00 636

原创 服务器部署LLM、Embedding

介绍在服务器下将大语言模型、embedding模型通过transformers或者vllm的方式部署为API服务的搭建步骤和脚本

2024-12-30 20:43:41 800

原创 推荐系统简介(下)

衔接推荐系统简介上,本章内容主要介绍召回内容的排序方案,以及谷歌、You Tube、阿里公布的策略方案,分享推荐上线的A/B test方案的优缺点。

2024-12-18 07:00:00 1212

原创 推荐系统简介(上)

主要介绍推荐系统的整体组成结构,重点介绍了基于内容、协同过滤、统计信息、冷启动等召回策略和问题;以及召回的核心点,特征处理工程。

2024-12-15 11:41:23 671

原创 我的创作纪念日

响应创作纪念日,拿勋章的成就感

2024-11-24 16:10:59 241

原创 LLM在Transformer上的改动

介绍关于当前大模型的在Transformer结构上的优化和改进:multi-head共享、attention前后网络、归一化层位置、归一化层函数、激活函数等调整方案,并给出LLama2方案介绍;以及大语言模型长文本输出中,涉及到位置编码的方案

2024-11-14 03:00:00 800

原创 RAG介绍

介绍当前大语言模型下应用广泛的RAG技术优势、缺点、一些场景的解决方案,RAG的评价指标

2024-11-13 02:00:00 984

原创 BPE算法

介绍BPE算法大语言模型中Tokenizer之间的使用方案和逻辑,和好处

2024-11-10 21:20:27 605

原创 知识图谱构建

介绍在知识图谱中,非常重要的:知识抽取、知识融合、知识推理、知识表示的内容;以及基于知识图谱的NL2SQL应用

2024-11-09 02:00:00 1712

原创 对话系统介绍

主要介绍对话系统中:任务型对话、问答型对话、闲聊型对话的介绍,重点介绍任务型对话系统的流程和实现;介绍LLM多轮对话的训练等信息

2024-10-24 22:53:56 977

原创 大语言模型使用和测评

主要介绍大语言模型中ICL的使用案例和特殊的情况;大语言模型评价数据集;当前两种业内对大模型可解释性的实验和结论;以及从大模型层面对输出结果真实性可靠性的实验介绍

2024-10-22 20:54:25 1033

原创 agent介绍

主要介绍agent的原理和前一段时间较火热的一些应用项目

2024-10-14 21:00:00 940

原创 大语言模型训练

主要介绍当前大语言模型训练过程中的数据并行、模型并行等方法;模型权重上的混合精度训练、deepspeed训练框架内容,以及LoRA、P-tuning等PEFT方法,推理加速KV cache的原理

2024-10-13 16:00:51 931

原创 多模态简单了解

主要内容即图片在transformer中的编码逻辑,以及图文训练时、diffusion的方式:CLIP图文交互、对比学习训练、flamingo图文交互、LLava图文交互;

2024-10-09 20:59:05 390

原创 预训练发展

文章主要介绍预训练的历史中,出现的一些重要模型结构、训练方法和思想;包含模型:ELMo、GPT、Bert、GPT2、UNILM、Transformer-XL & XLNet、Roberta、SpanBert、ALBERT、T5、GPT3。

2024-09-15 14:07:43 788

原创 NLP中文本生成任务

简单介绍文本生成式任务的应用领域,主要讲解实现的方案,包括自回归模型实现、Encoder-Decoder结构;其中注意力机制原理和种类,训练方式;以及评价指标和常见问题的解决方案。

2024-09-11 23:46:44 1102 1

原创 序列标注任务

序列标注任务中的场景任务,中文分词和实体提取;重点分享中文分词的数据标注方法、NER实体提取的相关算法和实现方案。

2024-09-09 12:05:21 977

原创 文本匹配任务(下)

主要内容为:深度学习中的文本匹配任务,包含交互型、表示型,以及训练的方法;对比学习、真实场景中海量向量检索的办法

2024-09-05 23:59:13 1153

原创 文本匹配任务(上)

主要对文本匹配任务的定义、到应用的介绍;从智能问答中可知难点核心是文本匹配相似度算法;接着对算法进行详细介绍:编辑距离、Jaccard、BM25算法、word2vec

2024-08-20 23:39:58 817

原创 文本分类任务算法演变(二)

主要讲解在深度学习技术在文本分类任务中的算法应用,包含fastText、LSTM、TextCNN、Gated CNN、TextRCNN、Bert;以及实验中常见数据稀疏、标签不均衡问题处理。多标签分类任务的实现。

2024-08-17 18:25:31 1017

原创 文本分类任务算法演变(一)

主要对分类任务中的NLP应用场景;和算法的演变,其中主要介绍了:贝叶斯算法、支持向量机的优缺点和计算公式

2024-08-14 21:27:11 946

原创 语言模型-预训练模型(三)

主要内容为预训练模型的介绍、BERT结构的介绍,embedding、encoder、self-attention等核心结构的分析

2024-08-07 21:13:51 1315

原创 语言模型-神经网络模型(二)

主要讲解神经网络语言模型以及语言模型的一些应用的方向

2024-08-06 20:43:29 826

原创 语言模型简介和Ngram模型(1)

主要讲解语言模型的发展四个阶段、应用和PPL评价指标;以及第一阶段的Ngram模型的计算和构建

2024-08-04 15:51:50 1007

原创 词的向量化和文本向量化

主要为文本的向量化内容,包含两种编码:词向量和one-hot;词向量训练方式介绍基于语言模型、基于窗口、基于共现矩阵Glove;窗口训练讲解CBOW模型;SkipGram模型;以及负采样、Huffman树;包含聚类应用

2024-07-29 23:23:39 1251

原创 新词发现与重要词计算

新词发现与重要词TFIDF的计算、应用场景介绍

2024-07-22 20:04:15 624

原创 分词任务介绍-(十)

分词任务的简介,以及分词实现技术:正向最大匹配、反向最大匹配、jieba分词、机器学习实现分词的介绍

2024-07-18 21:42:45 796

原创 网络结构-组件-AI(九)

深度学习常使用的组件包括CNN、RNN、Normalization、Dropout层介绍

2024-07-17 21:59:33 731

原创 文本分类--NLP-AI(八)

自然语言处理中的文本分类任务,引入介绍池化层(pooling)和向量化表示embedding层

2024-07-14 08:42:35 867

原创 深度学习组件优化器简介--AI(七)

深度学习基础组件之优化器的简介

2024-07-10 09:00:00 395

原创 深度学习-基础网络组件介绍(六)

深度学习基础网络组件--全连接层、激活层、损失函数的常用介绍

2024-07-09 09:00:00 1015

原创 深度学习-梯度下降算法-NLP(五)

深度学习中梯度下降算法是如何发挥作用的,在整个流程中起到的作用

2024-07-08 20:49:59 994 3

原创 深度学习-数学基础(四)

总结深度学习会涉及到的基础数学知识内容

2024-07-04 23:46:24 1123

原创 深度学习简介-AI(三)

深度学习的基础逻辑和概念的总结介绍

2024-07-03 20:34:06 751 1

原创 机器学习简介--NLP(二)

机器学习逻辑的基本介绍和理解

2024-07-02 19:15:59 991

原创 人工智能基础解释(一)

NLP学习技术梳理--人工智能概述

2024-06-29 17:58:37 662

原创 面向对象OOP基础(2)

Java面向对象基础2,包含继承、实现关系、抽象类、Object类方法,多态的使用

2024-04-02 01:00:00 716

原创 面向对象OOP基础(1)

面向对象基础,包括类、对象、局部变量、成员变量、构造方法、封装的内容

2024-03-31 12:03:53 876

原创 Java基础 IV数组

Java基础-数组(数组基础定义、冒泡排序、选择排序、二维数组、main函数数组)

2024-02-13 09:12:53 363

本文中推荐系统相关的案例介绍论文

包含文章中介绍的谷歌、You-Tube、阿里、Bert4REC、Chat-REC的论文

2024-12-15

You-Tube推荐策略论文

You-Tube公布的推荐系统论文

2024-12-15

wide and deep

谷歌公布的推荐系统论文

2024-12-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除