自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 树莓派 5 代哪吒开发板套件,谁是你的菜?

台风“贝碧嘉”在上海浦东临港新城登陆了,外面刮着怒吼的狂风,倾盆的大雨宣泄着“贝碧嘉”的威力。瑟瑟发抖的人类,蜷缩在呜呜作响的出租屋的角落,看着抢购一空的奥乐齐货架,失望地关掉微信小程序,默默地掏出了开发板。感谢Intel的“走近开发者”活动,给了我这个试用的机会。之前是玩树莓派,还有行空板。但苦于他们俩的计算性能实在赶不上现在LLM大模型的变态算力需求。我也一直在寻找替代方案,正巧这时候参加了Intel和微软联合举办的开发者活动,很幸运获得了这个试用机会。看到之前已经有很多人写了开箱和试用报告,由于时间原

2024-09-16 22:23:42 1079

原创 五一假期Llama 3之初体验不完全攻略(Part 1)

2024年4月18日,Meta AI 正式宣布推出 Llama 3,这标志着开源大型语言模型(LLM)领域的又一重大进步。如同一颗重磅炸弹, Llama 3 以其卓越的性能和广泛的应用前景,预示着 AI 技术的新时代。目前开源的是Llama3 8B 和 70B,趁着五一小长假,别人在外人从众,我在家偷偷魔改Llama3。

2024-05-02 10:31:35 756

原创 五一假期Llama 3之魔改不完全攻略(Part 2)

2024年4月18日,Meta AI 正式宣布推出 Llama 3,这标志着开源大型语言模型(LLM)领域的又一重大进步。如同一颗重磅炸弹, Llama 3 以其卓越的性能和广泛的应用前景,预示着 AI 技术的新时代。目前开源的是Llama3 8B 和 70B,趁着五一小长假,别人在外人从众,我在家偷偷魔改Llama3。

2024-05-02 10:31:14 965

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第七课)

书生·浦语是上海和商汤科技联合研发的一款大模型,这次有机会参与试用,特记录每日学习情况。今天学习的是评测。

2024-04-23 20:07:05 1094

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第六课)

书生·浦语是上海人工智能实验室和商汤科技联合研发的一款大模型,这次有机会参与试用,特记录每日学习情况。今天学习的是Lagent & AgentLego 智能体应用搭建。 AgentLego 是一个提供了多种开源工具 API 的多模态工具包,旨在像是乐高积木一样,让用户可以快速简便地拓展自定义工具,从而组装出自己的智能体。通过 AgentLego 算法库,不仅可以直接使用多种工具,也可以利用这些工具,在相关智能体框架(如 Lagent,Transformers Agent 等)的帮助下,快速构建可以增强大语言

2024-04-22 19:56:37 339

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第五课)

模型部署是指将训练好的模型在特定环境中运行的过程,以便将其应用到实际生产中。这个过程需要解决模型框架兼容性和运行速度的问题。LMDeploy是一个用于部署大模型的工具箱,由上海人工智能实验室开发。它使用C++/CUDA进行推理,并对外提供Python/gRPC/HTTP接口和WebUI界面。LMDeploy支持tensor parallel分布式推理,并支持fp16/weightint4/kv cache int8量化。LMDeploy的核心功能包括量化、TurboMind和推理服务。

2024-04-19 12:43:10 827

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第四课)

Finetune中文译为“微调”,深度学习中需要在深层网络中不断进行训练更新模型的参数(权重)拟合能实现预期结果的模型。“微调”的原理就是利用已知的网络结构和已知的网络参数,修改output层为我们自己的层,微调最后一层前的若干层的参数,这样就有效利用了。

2024-04-16 20:22:33 1002

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第三课——下篇)

书生·浦语是上海和商汤科技联合研发的一款大模型,这次有机会参与试用,特记录每次学习情况。

2024-04-12 21:53:42 885

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第三课——上篇)

t=N7T8OpenXLab浦源 - 应用中心应用中心提供应用托管的服务,用户只需遵循平台规范,通过简单的前端封装组件(Gradio)即可构建模型推理应用演示demo,应用中心提供免费应用部署的能力,普通用户也可在应用中心中交互式体验模型的能力,更好帮助用户寻找想要的学术模型或应用服务。通过前端封装组件和平台的SDK工具,帮助AI开发者简单快速构建人工智能应用。

2024-04-11 23:00:09 859

原创 清明时节雨纷纷,AI达人用Bedrock(第一季)

今天是清明小长假第一天,没有外出踏青,在家体验是专门为创新者量身打造的平台,提供了构建生成式人工智能应用程序所需的一切。这次我主要尝试的是通过里的进行AI绘画。其实我最初冲着Claude 3去的,但可惜无法使用,被欺骗了感情!好在是一项完全托管的服务,通过单个 API 提供来自AI21 LabsAnthropicCohereMeta和等领先人工智能公司的高性能基础模型(FM),以及通过安全性、隐私性和负责任的 AI 构建生成式人工智能应用程序所需的一系列广泛功能。

2024-04-04 22:32:41 873

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第二课)

书生·浦语是上海和商汤科技联合研发的一款大模型,这次有机会参与试用,特记录每日学习情况。

2024-04-02 22:23:02 815

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第二期第一课之下篇)

传统的预训练策略主要依赖于大规模语料库的迭代训练,然而,这种方法在模型规模不断扩大时,面临着训练效率低下、计算资源消耗巨大等问题。为此,InternLM2提出了进化式预训练策略——InternEvo。

2024-03-30 22:46:52 649

原创 上海人工智能实验室的书生·浦语大模型学习笔记(第二期第一课之上篇)

在人工智能的发展道路上,大模型无疑成为了重要的突破口。从专用模型到通用大模型,它们在解决特定任务和应对多种任务、多种模态方面都展现出了强大的能力。本文记录书生浦语大模型的开源历程及其全链路开源体系。

2024-03-30 22:06:06 660

原创 驾辰龙跨Llama持Wasm,玩转Yi模型迎新春

今年新年很特别,AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”,只要,为这个甲辰龙年带来一份九紫离火运的科技感。

2024-03-02 20:16:45 1790

原创 我的创作纪念日

虽然这个小虾米的数字,和大佬们比起来实在相差太远。由于亚马逊的活动需要,开始了我的csdn之旅。

2024-03-02 20:01:30 291

原创 驾辰龙跨Llama持Wasm,玩转Yi模型迎新春

今年新年很特别,AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”,只要,为这个甲辰龙年带来一份九紫离火运的科技感。

2024-02-18 09:52:45 583

原创 RUST学习笔记(Day 2)

Tensor 为我们提供了一种通用的方式来描述 n 阶数组的扩展。0阶的Tensor可以理解为标量,1阶的Tensor是向量,2 阶的Tensor就是矩阵。Tensor类型有多个,比如PyTorch框架中的Tensor,本次学习的Tensor来自HuggingFace开发的Candle框架。

2024-02-18 09:34:22 634

原创 RUST学习笔记(Day 3)

今天学习用Rust来实现开源 LLM代表LLaMA模型。本次使用的是karpathy/llama2.c: Inference Llama 2 in one file of pure C 的 Rust 实现的版本中的:danielgrittner/llama2-rs: LLaMA2 + Rust。仅涉及部份。

2024-02-18 09:33:03 919

原创 驾辰龙跨Llama持Wasm,玩转Yi模型迎新春过大年(下篇)

大年初二,看春晚迎新年。今年新年很特别,AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”,只要,为这个甲辰龙年带来一份九紫离火运的科技感。书接上回,我们顺利地安装了runtime 以及 ggml plugin,将OpenBayes端口映射到了本地,启动了chatbot UI,现在可以愉快地和Yi玩耍了,让它给这个龙年春节创作一首祝福的微信、或者一个广告宣传文案、或者一首歌曲,只要你想得到,都可以让模型来创作。

2024-02-11 20:51:33 940 1

原创 驾辰龙跨Llama持Wasm,玩转Yi模型迎新春过大年(上)

大年初一,看着春晚迎新年。今年新年很特别,AI工具添光彩。今天就来感受下最新的AI神器天选组合“WasmEdge+Yi-34B”,只要,为这个甲辰龙年带来一份九紫离火运的科技感。

2024-02-11 16:18:21 1021 2

原创 第一期书生·浦语大模型实战营学习汇总

我觉得要再加一重角色,程序员,心态要放空,终身学习,才赶得上这个时代的变化。大型语言模型(LLM)是一种基于深度学习技术的自然语言处理工具,它通过大量文本数据的训练,能够生成自然语言文本或理解语言文本的含义,具有重要的应用价值。“微调”的原理就是利用已知的网络结构和已知的网络参数,修改output层为我们自己的层,微调最后一层前的若干层的参数,这样就有效利用了。“微调”的原理就是利用已知的网络结构和已知的网络参数,修改output层为我们自己的层,微调最后一层前的若干层的参数,这样就有效利用了。

2024-01-29 15:28:00 908

原创 上海人工智能实验室的书生·浦语大模型学习笔记及作业--day6

书生·浦语是上海和商汤科技联合研发的一款大模型,这次有机会参与试用,特记录每日学习情况。此前听过一个说法,身为社畜,要在江湖立足,须有两重角色,商人和公务。一是要脸皮厚,经得起折腾,二是要能忍,藏住内心,低调行事。我觉得要再加一重角色,程序员,心态要放空,终身学习,才赶得上这个时代的变化。学习要学三方面,技术是一,更重要的是理财、养生。技术是谋生手段,是财富的源泉。

2024-01-27 10:25:29 1065

原创 上海人工智能实验室的书生·浦语大模型学习笔记及作业--day5

模型部署是指将训练好的模型在特定环境中运行的过程,以便将其应用到实际生产中。这个过程需要解决模型框架兼容性和运行速度的问题。LMDeploy是一个用于部署大模型的工具箱,由上海人工智能实验室开发。它使用C++/CUDA进行推理,并对外提供Python/gRPC/HTTP接口和WebUI界面。LMDeploy支持tensor parallel分布式推理,并支持fp16/weightint4/kv cache int8量化。LMDeploy的核心功能包括量化、TurboMind和推理服务。

2024-01-26 20:31:46 1020 1

原创 上海人工智能实验室的书生·浦语大模型学习笔记及作业--day4

Finetune中文译为“微调”,深度学习中需要在深层网络中不断进行训练更新模型的参数(权重)拟合能实现预期结果的模型。“微调”的原理就是利用已知的网络结构和已知的网络参数,修改output层为我们自己的层,微调最后一层前的若干层的参数,这样就有效利用了。

2024-01-26 09:03:26 833 1

原创 上海人工智能实验室的书生·浦语大模型学习笔记--day3

大型语言模型(LLM)是一种基于深度学习技术的自然语言处理工具,它通过大量文本数据的训练,能够生成自然语言文本或理解语言文本的含义,具有重要的应用价值。它提供了丰富的组件和工具,简化了应用程序的开发过程,并提供了与外部资源的集成能力,使得应用程序更加灵活和功能强大。

2024-01-18 23:13:12 975 1

原创 第三节课作业

选择一个垂直领域,收集该领域的专业资料构建专业知识库,并搭建专业问答助手,并在。复现课程知识库助手搭建过程。1、构建联邦学习的向量数据库。2、联邦学习专业问答助手。

2024-01-14 18:57:28 454 1

原创 第二次课程作业

2、熟悉 hugging face 下载功能,使用。2、完成 Lagent 工具调用 Demo 创作部署。的 config.json 文件到本地。1、完成浦语·灵笔的图文理解及创作部署。python 包,下载。

2024-01-12 23:04:20 442 1

原创 上海人工智能实验室的书生·浦语大模型学习笔记--day2

lnternLM是一个基于互联网的大型语言模型,它是基于Transformer架构构建的,包含数十亿个参数。

2024-01-12 22:53:31 457 1

原创 上海人工智能实验室的书生·浦语大模型学习笔记--day 1

今天学习了书生·浦语的全链路开源体系,它包括了数据、预训练、微调、部署、评测和应用这六个方面。

2024-01-08 22:44:11 1548

原创 RUST学习笔记(Day 1)

开始学习RUST,为了督促自己,每天记录学习心得,大家监督。

2023-11-12 22:52:31 58 1

原创 好用且免费的CodeWhisperer,给1024程序员节送礼来了

CodeWhisperer经过数十亿行代码的训练,可以实时生成从代码片段到全函数的代码建议,绕过耗时的编码任务,加速使用不熟悉的API进行的构建。CodeWhisperer支持15种编程语言,包括Python、Java、JavaScript、TypeScript、C#、Go、Rust、PHP、Ruby、Kotlin、C、C++、Shell脚本、SQL和Scala,以及主流的IDE开发工具,包括VS Code、IntelliJ IDEA和Amazon Cloud9。要查看之前的建议,选择向左箭头键。

2023-10-24 22:00:39 13597

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除