人工智能_Words worth的博客-CSDN博客

人工智能

关注

文章平均质量分 83

关注数：文章数：25 文章阅读量：20867 文章收藏量：369

作者: Words worth

这个作者很懒，什么都没留下…

展开

五一假期Llama 3之初体验不完全攻略（Part 1)

2024年4月18日，Meta AI 正式宣布推出 Llama 3，这标志着开源大型语言模型（LLM）领域的又一重大进步。如同一颗重磅炸弹， Llama 3 以其卓越的性能和广泛的应用前景，预示着 AI 技术的新时代。目前开源的是Llama3 8B 和 70B，趁着五一小长假，别人在外人从众，我在家偷偷魔改Llama3。

原创 2024-05-02 10:31:35 · 701 阅读 · 0 评论
五一假期Llama 3之魔改不完全攻略（Part 2)

2024年4月18日，Meta AI 正式宣布推出 Llama 3，这标志着开源大型语言模型（LLM）领域的又一重大进步。如同一颗重磅炸弹， Llama 3 以其卓越的性能和广泛的应用前景，预示着 AI 技术的新时代。目前开源的是Llama3 8B 和 70B，趁着五一小长假，别人在外人从众，我在家偷偷魔改Llama3。

原创 2024-05-02 10:31:14 · 861 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记（第七课）

书生·浦语是上海和商汤科技联合研发的一款大模型，这次有机会参与试用，特记录每日学习情况。今天学习的是评测。

原创 2024-04-23 20:07:05 · 1059 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记（第六课）

书生·浦语是上海人工智能实验室和商汤科技联合研发的一款大模型，这次有机会参与试用，特记录每日学习情况。今天学习的是Lagent & AgentLego 智能体应用搭建。 AgentLego 是一个提供了多种开源工具 API 的多模态工具包，旨在像是乐高积木一样，让用户可以快速简便地拓展自定义工具，从而组装出自己的智能体。通过 AgentLego 算法库，不仅可以直接使用多种工具，也可以利用这些工具，在相关智能体框架（如 Lagent，Transformers Agent 等）的帮助下，快速构建可以增强大语言

原创 2024-04-22 19:56:37 · 317 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记（第五课）

模型部署是指将训练好的模型在特定环境中运行的过程，以便将其应用到实际生产中。这个过程需要解决模型框架兼容性和运行速度的问题。LMDeploy是一个用于部署大模型的工具箱，由上海人工智能实验室开发。它使用C++/CUDA进行推理，并对外提供Python/gRPC/HTTP接口和WebUI界面。LMDeploy支持tensor parallel分布式推理，并支持fp16/weightint4/kv cache int8量化。LMDeploy的核心功能包括量化、TurboMind和推理服务。

原创 2024-04-19 12:43:10 · 782 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记（第四课）

Finetune中文译为“微调”，深度学习中需要在深层网络中不断进行训练更新模型的参数（权重）拟合能实现预期结果的模型。“微调”的原理就是利用已知的网络结构和已知的网络参数，修改output层为我们自己的层，微调最后一层前的若干层的参数，这样就有效利用了。

原创 2024-04-16 20:22:33 · 975 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记（第三课——下篇）

书生·浦语是上海和商汤科技联合研发的一款大模型，这次有机会参与试用，特记录每次学习情况。

原创 2024-04-12 21:53:42 · 841 阅读 · 0 评论
清明时节雨纷纷，AI达人用Bedrock（第一季）

今天是清明小长假第一天，没有外出踏青，在家体验是专门为创新者量身打造的平台，提供了构建生成式人工智能应用程序所需的一切。这次我主要尝试的是通过里的进行AI绘画。其实我最初冲着Claude 3去的，但可惜无法使用，被欺骗了感情！好在是一项完全托管的服务，通过单个 API 提供来自AI21 LabsAnthropicCohereMeta和等领先人工智能公司的高性能基础模型（FM），以及通过安全性、隐私性和负责任的 AI 构建生成式人工智能应用程序所需的一系列广泛功能。

原创 2024-04-04 22:32:41 · 860 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记（第二课）

书生·浦语是上海和商汤科技联合研发的一款大模型，这次有机会参与试用，特记录每日学习情况。

原创 2024-04-02 22:23:02 · 783 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记（第二期第一课之下篇）

传统的预训练策略主要依赖于大规模语料库的迭代训练，然而，这种方法在模型规模不断扩大时，面临着训练效率低下、计算资源消耗巨大等问题。为此，InternLM2提出了进化式预训练策略——InternEvo。

原创 2024-03-30 22:46:52 · 630 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记（第二期第一课之上篇）

在人工智能的发展道路上，大模型无疑成为了重要的突破口。从专用模型到通用大模型，它们在解决特定任务和应对多种任务、多种模态方面都展现出了强大的能力。本文记录书生浦语大模型的开源历程及其全链路开源体系。

原创 2024-03-30 22:06:06 · 591 阅读 · 0 评论
驾辰龙跨Llama持Wasm，玩转Yi模型迎新春

今年新年很特别，AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”，只要，为这个甲辰龙年带来一份九紫离火运的科技感。

原创 2024-03-02 20:16:45 · 1750 阅读 · 0 评论
RUST学习笔记（Day 2）

Tensor 为我们提供了一种通用的方式来描述 n 阶数组的扩展。0阶的Tensor可以理解为标量，1阶的Tensor是向量，2 阶的Tensor就是矩阵。Tensor类型有多个，比如PyTorch框架中的Tensor，本次学习的Tensor来自HuggingFace开发的Candle框架。

原创 2024-02-18 09:34:22 · 605 阅读 · 0 评论
RUST学习笔记（Day 3）

今天学习用Rust来实现开源 LLM代表LLaMA模型。本次使用的是karpathy/llama2.c: Inference Llama 2 in one file of pure C 的 Rust 实现的版本中的：danielgrittner/llama2-rs: LLaMA2 + Rust。仅涉及部份。

原创 2024-02-18 09:33:03 · 890 阅读 · 0 评论
驾辰龙跨Llama持Wasm，玩转Yi模型迎新春过大年（下篇）

大年初二，看春晚迎新年。今年新年很特别，AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”，只要，为这个甲辰龙年带来一份九紫离火运的科技感。书接上回，我们顺利地安装了runtime 以及 ggml plugin，将OpenBayes端口映射到了本地，启动了chatbot UI，现在可以愉快地和Yi玩耍了，让它给这个龙年春节创作一首祝福的微信、或者一个广告宣传文案、或者一首歌曲，只要你想得到，都可以让模型来创作。

原创 2024-02-11 20:51:33 · 921 阅读 · 1 评论
驾辰龙跨Llama持Wasm，玩转Yi模型迎新春过大年（上）

大年初一，看着春晚迎新年。今年新年很特别，AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”，只要，为这个甲辰龙年带来一份九紫离火运的科技感。

原创 2024-02-11 16:18:21 · 982 阅读 · 2 评论
第一期书生·浦语大模型实战营学习汇总

我觉得要再加一重角色，程序员，心态要放空，终身学习，才赶得上这个时代的变化。大型语言模型（LLM）是一种基于深度学习技术的自然语言处理工具，它通过大量文本数据的训练，能够生成自然语言文本或理解语言文本的含义，具有重要的应用价值。“微调”的原理就是利用已知的网络结构和已知的网络参数，修改output层为我们自己的层，微调最后一层前的若干层的参数，这样就有效利用了。“微调”的原理就是利用已知的网络结构和已知的网络参数，修改output层为我们自己的层，微调最后一层前的若干层的参数，这样就有效利用了。

原创 2024-01-29 15:28:00 · 873 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记及作业--day6

书生·浦语是上海和商汤科技联合研发的一款大模型，这次有机会参与试用，特记录每日学习情况。此前听过一个说法，身为社畜，要在江湖立足，须有两重角色，商人和公务。一是要脸皮厚，经得起折腾，二是要能忍，藏住内心，低调行事。我觉得要再加一重角色，程序员，心态要放空，终身学习，才赶得上这个时代的变化。学习要学三方面，技术是一，更重要的是理财、养生。技术是谋生手段，是财富的源泉。

原创 2024-01-27 10:25:29 · 1025 阅读 · 0 评论
上海人工智能实验室的书生·浦语大模型学习笔记及作业--day5

模型部署是指将训练好的模型在特定环境中运行的过程，以便将其应用到实际生产中。这个过程需要解决模型框架兼容性和运行速度的问题。LMDeploy是一个用于部署大模型的工具箱，由上海人工智能实验室开发。它使用C++/CUDA进行推理，并对外提供Python/gRPC/HTTP接口和WebUI界面。LMDeploy支持tensor parallel分布式推理，并支持fp16/weightint4/kv cache int8量化。LMDeploy的核心功能包括量化、TurboMind和推理服务。

原创 2024-01-26 20:31:46 · 944 阅读 · 1 评论
上海人工智能实验室的书生·浦语大模型学习笔记及作业--day4

Finetune中文译为“微调”，深度学习中需要在深层网络中不断进行训练更新模型的参数（权重）拟合能实现预期结果的模型。“微调”的原理就是利用已知的网络结构和已知的网络参数，修改output层为我们自己的层，微调最后一层前的若干层的参数，这样就有效利用了。

原创 2024-01-26 09:03:26 · 784 阅读 · 1 评论
上海人工智能实验室的书生·浦语大模型学习笔记--day3

大型语言模型（LLM）是一种基于深度学习技术的自然语言处理工具，它通过大量文本数据的训练，能够生成自然语言文本或理解语言文本的含义，具有重要的应用价值。它提供了丰富的组件和工具，简化了应用程序的开发过程，并提供了与外部资源的集成能力，使得应用程序更加灵活和功能强大。

原创 2024-01-18 23:13:12 · 936 阅读 · 1 评论
第三节课作业

选择一个垂直领域，收集该领域的专业资料构建专业知识库，并搭建专业问答助手，并在。复现课程知识库助手搭建过程。1、构建联邦学习的向量数据库。2、联邦学习专业问答助手。

原创 2024-01-14 18:57:28 · 423 阅读 · 1 评论
第二次课程作业

2、熟悉 hugging face 下载功能，使用。2、完成 Lagent 工具调用 Demo 创作部署。的 config.json 文件到本地。1、完成浦语·灵笔的图文理解及创作部署。python 包，下载。

原创 2024-01-12 23:04:20 · 416 阅读 · 1 评论
上海人工智能实验室的书生·浦语大模型学习笔记--day2

lnternLM是一个基于互联网的大型语言模型，它是基于Transformer架构构建的，包含数十亿个参数。

原创 2024-01-12 22:53:31 · 425 阅读 · 1 评论
上海人工智能实验室的书生·浦语大模型学习笔记--day 1

今天学习了书生·浦语的全链路开源体系，它包括了数据、预训练、微调、部署、评测和应用这六个方面。

原创 2024-01-08 22:44:11 · 1497 阅读 · 0 评论

人工智能

作者: Words worth

五一假期Llama 3之初体验不完全攻略（Part 1)

五一假期Llama 3之魔改不完全攻略（Part 2)

上海人工智能实验室的书生·浦语大模型学习笔记（第七课）

上海人工智能实验室的书生·浦语大模型学习笔记（第六课）

上海人工智能实验室的书生·浦语大模型学习笔记（第五课）

上海人工智能实验室的书生·浦语大模型学习笔记（第四课）

上海人工智能实验室的书生·浦语大模型学习笔记（第三课——下篇）

清明时节雨纷纷，AI达人用Bedrock（第一季）

上海人工智能实验室的书生·浦语大模型学习笔记（第二课）

上海人工智能实验室的书生·浦语大模型学习笔记（第二期第一课之下篇）

上海人工智能实验室的书生·浦语大模型学习笔记（第二期第一课之上篇）

驾辰龙跨Llama持Wasm，玩转Yi模型迎新春

RUST学习笔记（Day 2）

RUST学习笔记（Day 3）

驾辰龙跨Llama持Wasm，玩转Yi模型迎新春过大年（下篇）

驾辰龙跨Llama持Wasm，玩转Yi模型迎新春过大年（上）

第一期书生·浦语大模型实战营学习汇总

上海人工智能实验室的书生·浦语大模型学习笔记及作业--day6

上海人工智能实验室的书生·浦语大模型学习笔记及作业--day5

上海人工智能实验室的书生·浦语大模型学习笔记及作业--day4

上海人工智能实验室的书生·浦语大模型学习笔记--day3

第三节课作业

第二次课程作业

上海人工智能实验室的书生·浦语大模型学习笔记--day2

上海人工智能实验室的书生·浦语大模型学习笔记--day 1