![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大模型
文章平均质量分 74
程序猿阿三
Good ideal worth spreading
展开
-
【大模型开源篇1】彦宏您怎么看LLaMA3的开源
Meta LLaMA是Meta公司开源的大模型,作为大模型开源界得鼻祖, 刚刚发布LLaMA3。从ChatGPT 拉开了大模型竞赛的序幕,Meta 选择了开源,至此大模型也开始百花齐放的时期,但是开源模型一直无法超过必源模型,如今LLaMA3发布,大有后来居上的趋势。此外,Meta还支持丰富的应用生态, Meta 提供的生成式 AI 能力在免费产品中性能是最强大的。原创 2024-04-20 08:59:36 · 868 阅读 · 0 评论 -
【小白入门篇2】总有一款AI工具适合你
介绍了GPT的形成,直到今日,GPT工具层出不穷,搞得很多初学者眼花缭乱,今天梳理一下国内外比较出名的GPT工具,适用各个领域非专业的同学选择。值得注意的是,以上都是开箱即用的工具都有web端(部分还有手机端,只需注册即可),对于小白是可以快速使用的,大部分垂直领域的工具只开放试用功能,好在大部分通用的模型都有免费版,这些通用模型在某些插件加持下,可以完成垂直领域模型的功能,同时个人感觉有手机版的工具,确实方便了不少,随着携带一名助理,不香吗。从现在开始,学会AI工具,逐渐成为人们人生必修课。原创 2024-03-21 16:05:45 · 306 阅读 · 0 评论 -
光杆司令如何部署大模型?
之前有写过一篇《平民如何体验一把大模型知识库》里面有提到使用阿里的免费GPU进行部署,但是免费总有到头的一天, 今天教大家如何使用在线模型管理自己的知识库, 同样是基于ChatChat的开源代码来讲解. 随着大模型竞争的白热化,基本很多大模型都开放的api方式,让大家自己定义AI agent的应用.有了开放的api,让你没有显卡的电脑也能感受一下大模型管理知识库,进行垂直领域知识的检索和问答.算是自己初步玩一下AI agent。vim configs/model_config.py # 修改模型配置变量。原创 2024-02-01 12:27:50 · 294 阅读 · 0 评论 -
微调入门篇:大模型微调的理论学习
之前在《大模型这块蛋糕,想吃吗》介绍了普通人如何搭上大模型这块列车, 其中有一个就是模型微调,这个也是未来很多IT公司需要发力的方向,以及在《垂直领域大模型的应用更亲民》中论述了为什么微调适合大家,以及微调有什么价值? 作为小程序猿在开始进行微调实操之前,我们先了解一下微调大模型有什么方法和技术吗?原创 2024-01-30 21:18:34 · 936 阅读 · 0 评论 -
垂直领域大模型的应用更亲民
虽然2023年以来几乎很多公司都发出了自己的通用大模型,但是都还停留在“开放闲聊”阶段,这种泛娱乐的方式带来生产率是有限的。在之前的文章有介绍过: 普通人(包括程序员)怎么follow大模型的发展和如何成为提示词工程师.通用大模型类似ChatGPT等,一般公司和程序员是无法超越。chatgpt的成功是属于幸存者偏差,它的成功,不一定代表所有人都能成功,即使成功也不一定超越过。SFT: 通过SFT可以激发大模型理解领域内的各种问题并进行回答的能力(在有召回知识的基础上)。模型对特定问题的答案。原创 2024-01-20 12:35:59 · 512 阅读 · 0 评论