自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 LLM大模型之基于SentencePiece扩充LLaMa中文词表实践

目前大模型的词表和分词器都是基于SentencePiece工具实现的,比如LLaMa,BLOOM,ChatGLM,Baichuan等,简单来说SentencePiece就是工程化的实现了之前写的各种的分词算法

2023-09-09 17:49:45 1422 2

原创 LLM大语言模型之Generate/Inference生成/推理参数与解码策略原理与代码实现

LLM大语言模型Generate/Inference生成或者说推理时,有很多的参数和解码策略,比如OpenAI在提供GPT系列的模型时,就提供了很多的参数[1],那这些参数的原理以及代码上怎么实现的呢?本文将尽力进行一一的解释

2023-09-09 17:45:14 1065 1

原创 LLM大语言模型之Tokenization分词方法(WordPiece,Byte-Pair Encoding (BPE),Byte-level BPE(BBPE)原理及其代码实现)

本文主要内容为目前大模型时代分词是怎么做的☺️,WordPiece,Byte-Pair Encoding (BPE),Byte-level BPE(BBPE)分词方法的原理以及其代码实现

2023-09-09 17:38:01 599 2

原创 Anaconda+Tensorflow2.0+Pycharm安装教程(Win10)

人工智能三件套Anaconda+Tensorflow2.0+Pycharm+Win10的安装过程,尽量详细Anaconda是一个开源的包、环境管理器,可以用于在同一个电脑上安装不同版本的软件包,并能够在不同的环境之间切换Tensorflow是一个开源的机器学习平台/环境,用于各类机器学习算法的编程实现,其中2.0版本中更好的支持Keras。Pycharm是一个非常好用的Python IDE...

2019-10-24 16:40:51 7304 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除