大模型
文章平均质量分 86
大模型
m0_37559973
这个作者很懒,什么都没留下…
展开
-
大模型:JTokkit 分词
JTokkit 是一个专为 Java 开发者设计的高效文本分词库,主要适用于与 OpenAI 模型进行集成。它提供了一种简单易用的接口,使开发者能够轻松地对输入文本进行编码和解码,尤其是在准备向 GPT-3.5 等模型发送请求时。这个库的设计初衷是为了在 JVM 生态系统中实现类似 Python 中 tiktoken 库的功能。原创 2024-09-25 16:08:22 · 296 阅读 · 0 评论 -
大模型:文本分割模型
BERT文本分割-中文-通用领域(nlp_bert_document-segmentation_chinese-base),该模型基于wiki-zh公开语料训练,对未分割的长文本进行段落分割。提升未分割文本的可读性以及下游NLP任务的性能。原创 2024-06-13 00:01:55 · 2847 阅读 · 1 评论 -
阿里通义千问:本地部署Qwen1.5开源大模型
通义千问为阿里云研发的大语言系列模型。千问模型基于Transformer架构,在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在预训练模型的基础之上,使用对齐机制打造了模型的chat版本。原创 2024-06-06 23:07:44 · 6455 阅读 · 0 评论 -
大模型管理工具:SWIFT
SWIFT(Scalable lightWeight Infrastructure for Fine-Tuning)是魔搭ModelScope开源社区推出的一套完整的轻量级训练、推理、评估和部署工具,支持200+大模型、15+多模态大模型以及10+轻量化Tuners,让AI爱好者能够使用自己的消费级显卡玩转大模型和AIGC。原创 2024-05-13 20:53:41 · 5297 阅读 · 1 评论 -
大模型管理工具:Ollama
Ollama 是一个基于 Go 语言开发的可以本地运行大模型的开源框架,同时提供 REST API 管理和使用大模型。原创 2024-05-13 20:53:58 · 2451 阅读 · 1 评论 -
大模型框架:vLLM
vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架。它利用了全新的注意力算法「PagedAttention」,提供易用、快速、便宜的LLM服务。原创 2024-05-24 16:56:07 · 9212 阅读 · 0 评论 -
智谱AI通用大模型:本地部署ChatGLM3-6B开源大模型
ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。原创 2024-04-23 17:16:59 · 4811 阅读 · 0 评论 -
百度文心一言:官方开放API开发基础
文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,其基础是文心大模型。文心大模型基于大规模训练数据进行预训练,结合有监督精调、人类反馈的强化学习、Prompt 机制,构建生成式人工智能大模型,具备知识增强、检索增强和对话增强的技术特色。原创 2024-04-18 10:55:01 · 4086 阅读 · 0 评论 -
智谱AI通用大模型:官方开放API开发基础
GLM-4是智谱AI发布了新一代基座大模型,整体性能相比GLM3提升60%,支持128K上下文,可根据用户意图自主理解和规划复杂指令、完成复杂任务。原创 2024-04-17 00:29:42 · 2193 阅读 · 0 评论 -
阿里通义千问:官方开放API开发基础
通义千问是由阿里云自主研发的大语言模型,用于理解和分析用户输入的自然语言,在不同领域、任务内为用户提供服务和帮助。您可以通过提供尽可能清晰详细的指令,来获取符合您预期的结果。原创 2024-04-17 00:29:57 · 10435 阅读 · 3 评论
分享