自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(121)
  • 收藏
  • 关注

原创 决定大模型未来的,为何是原生应用?

利用文心一言的自然语言理解和生成能力,度小优学习和汇聚全网的商品信息、优惠信息,通过对话的形式与用户进行交流,了解用户在购物过程中的需求、偏好、预算等信息,并根据用户的输入提供个性化的商品推荐和指引,解决用户在购物过程中的各种问题。很多用户可能已经注意到,手机地图导航的语音交互越来越接近真人交流的体验:当用户询问一个较为复杂的问题时,或许很难一次描述清楚自己的需求,但是可以多次补充追问,地图应用也会主动询问,还能根据用户的使用反馈自主学习成长,更准确理解和满足用户的真实意图,越来越像一位“AI向导”。

2024-07-21 14:00:00 574

原创 极少数据就能微调大模型,一文详解LoRA等方法的运作原理

先从最近大火的LoRA(《LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGEMODELS》)说起。该文章在ICLR2022中提出,说的是利用低秩适配(low-rankadaptation)的方法,可以在使用大模型适配下游任务时只需要训练少量的参数即可达到一个很好的效果。LoRA是怎么去微调适配下游任务的?流程很简单,LoRA利用对应下游任务的数据,只通过训练新加部分参数来适配下游任务。

2024-07-20 08:30:00 516

原创 AI小白的大模型学习路径

写这篇文章的初衷:想把我自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大模型时代,看出点门道。

2024-07-19 19:00:00 532

原创 国产大模型速度评测(谁是更快大模型?)

2024年无疑会被载入史册,各大科技厂商纷纷争先恐后地推出了自家的大模型产品。6月25日OpenAI暂停在我国大陆地区服务,国产大模型表现更加值得期待。本文将对比较流行的国产大模型进行速度评测,通过不同类型的问题来对比模型的回答速度。统计的标准为`completion tokens`数除以耗时。

2024-07-19 13:15:00 819

原创 爸妈也能看懂的AI大模型使用指南

2024年,AI是随处可见的名词。然而,对于爸爸妈妈们来说,如今的大模型、AIGC等等概念,仍旧是陌生的新词。他们中的许多人还没有真正体验到大模型为生活所带来的种种便捷。我在最近的尝试和实践中,切实感受到了大模型所带来的效率提升和成果优化。

2024-07-19 07:15:00 1253

原创 大模型时代的程序员:不会用AIGC编程,未来5年将被淘汰?

下面是一段利用 Co-Pilot 辅助开发的小视频,这是 Apache SeaTunnel 开发者日常开发流程中的一小部分。如果你还没有用过 Co-Pilot、ChatGPT 或者私有化大模型帮助你辅助开发的话,未来的 5 年,你可能很快就要被行业所淘汰。因为这些善于使用 AIGC 辅助编程的人可以 10 倍于你的速度开发相应的代码,而你没有这个技能。我并不是危言耸听,读完此文,我相信你对 AIGC 研发提升研发效率会有全新的认知。

2024-07-18 19:15:00 868

原创 人形机器人竞速大模型 得数据者得天下

认为,业内对人形机器人的关注从“专用场景解决具体问题”(灵巧性)到强调泛化性,主要还是出于降低成本考量,“原来一个场景应用一款机器人,(如果)泛化性可以做到足够好,一个机器人就可以在十个场景、百个场景应用,就可以实现规模化场景和规模化效应,一旦实现规模化,机器人的成本就可以拉到BOM(构建制造产品所需的原材料、组件、子组件等材料的详细清单)成本之下。”季超对中国工业报解释道,例如,过去,机器人从A点走到B点,或者在流水线上抓取某些物品,但它并不了解为何要走到B点,以及为什么要抓取物品。

2024-07-18 13:45:00 576

原创 AI大模型

AI大模型具有很高的计算和存储需求,需要使用极为强大的计算设备和高效的算法才能训练和应用,所以参数量一般可以达到惊人的数十亿或者数千亿。例如OpenAI的GPT系列,最开始的GPT-1拥有1.17亿个参数,到GPT-3的参数已经到达1750亿个,最新的GPT-4没有给出具体的参数量,但根据推测,它或将接近万亿。

2024-07-18 09:17:13 989

原创 大模型时代最热门职位,它来了!

每个时代,都有最热的职位有时候是Java有时候是PHP有时候是销售有时候是产品经理——第一次AI大热门发生在2013-2016,以face++为代表的计算机视觉技术产品将人脸识别玩出圈,随后AI四小龙迅速走红,之后的故事所有人都知道…2023年被认为是大模型强势出圈的第一年,而2024年则是万物智能的揭幕战,这次的智能不在基于机器学习、深度学习的算法设计逻辑,更多是基于LLM作为底座来赋能所有的设备,去将千万个业务场景更新体验和效率。

2024-07-17 17:49:37 748

原创 大语言模型LLM-三种模型架构

输入序列特征表示\(x_1, x_2, \cdots, x_n\),按行摆放,就构成了输入特征\(X \in \mathbb{R}^{n \times d}\),那么就将输入的\(n\)个特征序列都转换为对应的\(n\)个query vector, \(n\)个key vector, \(n\)个value vector, 矩阵化表示这些为。因此序列每个位置的输出,都可以看出输入序列转换后表示的加权平均,加权系数是由当前位置特征与序列所有位置的特征相似度确定的(这里的特征都是转换后的特征)

2024-07-17 13:48:42 999

原创 看完大模型们作答的高考作文,对AI的鼓吹与恐惧皆可缓一缓了

ChatGPT等大模型技术所具备的邮件 & 新闻 & 论文撰写、视频脚本、文案、翻译、代码编写等能力,让生成式AI技术在很大程度上超越了过往这类AI应用偏娱乐的属性,进入了真正的生产力乃至是创造性阶段。由此 也有不少业内惊呼 : 创造性工作机会,可能会被GPT们率先取代了,开始陷入悲观预期。事实上,对于生成式AI技术展现出的实力,我一直以来的观点都是:既没必要过度鼓吹,同时也没必要过度恐惧,以一颗平常心去对待技术的发展更迭,或许会更好。

2024-07-15 11:53:25 874

原创 50K star!构建离线的私有GPT,隐私不再泄露

PrivateGPT 的思路和方向和目前很多国内的研究一致,大家都是在探索一种及使用大模型能力,同时又保障足够的数据隐私安全,并且这种引入向量存储的方法一定程度上可以提升相应的准确度的速度(在特定的问题场景下)。个人觉得这个项目更多的可以给我们延伸的思考,当然直接拿来用也不错。

2024-07-15 11:52:12 725

原创 27K star!开源AI程序员,可独立完成95%的开发任务

GPT Pilot的主要用途是帮助开发人员更快速地构建应用程序。它的设计上实现了现在非常前言的多智能体设计,通过多个不同角色的ai agent协同工作来完成一个复杂的开发任务。关于多智能体,最新的吴恩达演讲中也提出了很多内容,非常值得研究一下。它的过程更加贴合目前可接受的方式,您则负责监督开发过程,AI来完成任务执行。当GPT Pilot完成每个任务或遇到困难时,它会要求您审查任务或在需要时提供帮助。快速原型开发:您可以使用GPT Pilot快速创建应用程序的原型,以便在不浪费太多时间的情况下验证概念。

2024-07-15 11:50:18 783

原创 金融大模型落地,还需跨越几重山?

金融的本质是风控,大模型在优化金融业务流程和用户体验的同时,也需要降低大模型高昂的迭代和训练成本。一些金融机构选择利用大数据的整合,在垂直领域精调模型,以小规模算力打造轻量级精调模型,将成本降到最低。此外,在大模型技术的应用过程中带来的伦理道德、价值观等问题,需要法律法规的约束,这些在未来都需要进一步厘清和给出明确的规定指引。总的来看,金融数据不充分、研发成本较高、大模型在金融垂直领域仍未挖掘出涌现效应等挑战,使得大模型落地实际效果和预期业务价值之间存在差异。

2024-07-13 11:07:14 1223

原创 50K star!构建离线的私有GPT,隐私不再泄露

随着越来越多的人使用ChatGPT等AI产品,用户的数据隐私泄露也越来越被重视。

2024-07-13 11:06:06 525

原创 27K star!开源AI程序员,可独立完成95%的开发任务

GPT Pilot的主要用途是帮助开发人员更快速地构建应用程序。它的设计上实现了现在非常前言的多智能体设计,通过多个不同角色的ai agent协同工作来完成一个复杂的开发任务。关于多智能体,最新的吴恩达演讲中也提出了很多内容,非常值得研究一下。它的过程更加贴合目前可接受的方式,您则负责监督开发过程,AI来完成任务执行。当GPT Pilot完成每个任务或遇到困难时,它会要求您审查任务或在需要时提供帮助。快速原型开发:您可以使用GPT Pilot快速创建应用程序的原型,以便在不浪费太多时间的情况下验证概念。

2024-07-13 11:04:14 529

原创 大模型时代(上):大模型的出现,会对未来产生什么影响?

Open AI将通用大模型训练的结果通过ChatGPT的应用形式带到大家面前,意味着发展了大半个世纪的人工智能领域正式步入了广泛意义生产力提升的新纪元。可预见的未来,大模型的时代会逐渐拉开序幕。那么,大模型的出现会对未来产生什么影响呢?一起来看一下吧。随着Open AI将通用大模型训练的结果通过ChatGPT的应用形式带到大家面前,我们可以认为,发展了大半个世纪的人工智能领域正式步入了广泛意义生产力提升的新纪元。

2024-07-12 10:58:40 1595

原创 10K star!免费离线的语音转文字工具,远超垃圾付费软件

高精度:基于 OpenAI 开源的强大机器学习模型 Whisper ,Buzz的识别精度很高速度快:Buzz 的模型都是离线使用,因此转换速度很快,适合批量转换语音跨平台:目前支持Windows /macOS / Linux多语言:不仅支持中文,也支持很多个国家的语言,还能将结果翻译,但翻译只支持英文读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。

2024-07-12 10:56:49 882

原创 4K star!录屏好帮手,超酷的实时按键显示工具

虽然存在一些问题,但Keyviz是目前我用过按键可视化效果最好的,期望2.0版本可以修复更多的问题,提供更稳定的使用效果。颜值高:支持显示键盘按下和鼠标点击操作,显示效果是我用过最好的自定义:可自定义设置自己喜欢的按键显示颜色和样式、位置、停留时间等可过滤:支持过滤某些按键,只显示需要展示的按键操作。

2024-07-12 10:55:37 785

原创 大模型加持后,数字人“更像人”了吗?

数字人正处于风口,吸引了大量想分一杯羹的创业者涌入。但不可否认的是,作为一项年轻的技术,数字人还处于早期阶段,市场尚在培育之中。对于同处一片红海中的数字人公司来说,要思考的或许不是如何“卷低价”,而是通过技术的不断进步,让数字人“更像人”,提高行业的整体水位,让数字人“活下去”,创造更多的价值。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。

2024-07-11 10:56:03 861

原创 17K star!30秒偷走你的声音,开源声音克隆工具

OpenVoice 是一项技术,而不是一个产品。项目希望可以通过不断的努力,让免费的声音克隆也能像商业产品一样优秀。虽然如果使用正确的话它可以在大多数声音上工作,但请不要指望它在所有情况下都能完美工作,因为将一项技术转化为稳定的产品需要大量的工程工作。该技术的目标用户是开发人员和研究人员,而不是最终用户。虽然它不是完美的产品,但OpenVoice 是可用开源语音克隆技术中最先进的。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。

2024-07-11 10:53:27 334

原创 这5个项目值得收藏

GitHub 一周热点汇总第19期(2024/04/14-04/20) ,最强的开源大模型又换人了,小羊驼Llama3一经发布热度绝对的第一,来一起看看这周的内容吧。

2024-07-11 10:52:24 285

原创 国内的AI大模型们路走偏了吧!

系统型超级应用这类产品太复杂,实在不好理解,单纯类比操作系统也还是不行,所以这次换个路数,我们拿一个最近受众比较多的App 豆包以及背后的大模型来做类比,在产品形态、业务模式等各方面说明下这类产品。需要的话大家也可以一边操作一边形成直观感受。豆包APP自身可以看成系统型超级用的面向C端的部分,但系统型超级应用不是豆包APP。系统是指操作系统,超级应用是指功能没边界。一边对各种硬件设备进行抽象靠驱动程序接入各种硬件。一边对应用进行开放,在它之上可以开发Office,PS等各种应用。

2024-07-10 11:03:13 807

原创 27K star!有没有显卡都能搞,快速基于LLM构建本地智能知识库

项目的结构非常不错,针对当前热门的AI知识库给出一种非常好的构建方式,而且还做到了全链条的开源产品,所以无论你是希望直接使用它来构建知识库,还是希望通过本项目学习和实现自己的解决方案,都会是非常好的选择。我也建议大家不要单纯的伸手党,还是要自己去研究一下项目的架构,因为这类项目实际上最精华的就是架构设计。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。

2024-07-10 11:02:26 756

原创 27K star!有没有显卡都能搞,快速基于LLM构建本地智能知识库

项目的结构非常不错,针对当前热门的AI知识库给出一种非常好的构建方式,而且还做到了全链条的开源产品,所以无论你是希望直接使用它来构建知识库,还是希望通过本项目学习和实现自己的解决方案,都会是非常好的选择。我也建议大家不要单纯的伸手党,还是要自己去研究一下项目的架构,因为这类项目实际上最精华的就是架构设计。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。

2024-07-10 10:59:16 888

原创 从 RAG 1.0到RAG 2.0,这次做对了什么?

最近的示例包括Jamba,它巧妙地将Transformer与其他更高效的架构(如Mamba)混合在一起。Mamba、Hyena、Attention……你可能认为我只是为了证明一个观点而随意列举一些花哨的词汇。所有这些名字背后都归结为同一个原则:它们是揭示语言模式的不同方式,帮助我们的AI模型理解文本。注意力机制驱动了当今99%的模型,其余的只是在尝试找到尽可能最小的性能降低的更便宜的方式,使大型语言模型(LLM)更加经济。

2024-07-10 10:58:07 940

原创 如何全面评测一个大模型

评测大模型是一个复杂而系统的过程,需要综合考虑多个因素。通过制定详细的评测标准、采用科学的评测方法以及充分利用权威机构的评测结果,我们可以更加全面地了解大模型的表现。同时,随着技术的不断进步和评测方法的不断完善,我们有理由相信大模型将在更多领域展现出其强大的潜力和价值。未来,评测大模型的工作将变得更加精细化和智能化,为AI技术的普及和应用提供更加坚实的保障。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。

2024-07-09 15:12:07 1453

原创 读懂 GraphRAG:提升LLM企业落地能力,智能问答革命

RAG 是一种自然语言查询方法,用于通过外部知识增强现有的LLM,因此如果问题需要特定知识,问题的答案会更相关。它包括一个检索信息组件,用于从外部源获取附加信息,也称为“基础上下文”,然后将其馈送到 LLM 提示以更准确地回答所需的问题。这种方法是最便宜和最标准的方法,可以通过额外的知识来增强 LLM 以回答问题。此外,它被证明可以减少 LLM 产生幻觉的倾向,因为这一代人更坚持来自上下文的信息,而这些信息通常是可靠的。由于该方法的这种性质,RAG 成为增强生成模型输出的最流行的方法。

2024-07-09 15:09:23 937

原创 本地大模型运行工具、开源CRM等5个火爆项目

GitHub 一周热点汇总第20期(2024/04/21-04/27) ,本周期内其实最热的还是Llama3,但是上周刚刚入选,就换成Ollama了。来看看这一周内火爆的5个项目吧。

2024-07-09 15:08:27 619

原创 20K star!搞定 LLM 微调的开源利器

在人工智能领域,大型语言模型(LLM)微调(Fine-Tuning)是当下最热门的话题之一。总体来说LLaMA Factory 是一个非常优质的工具,在LLM微调中帮助用户节省了大量的精力。这些模型拥有惊人的语言理解和生成能力,但要微调和部署它们以适应特定任务,往往需要大量计算资源和专业知识,代码调试还得有深厚的技术功底。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。

2024-07-08 09:00:00 938

原创 Agent与大模型的差异:深入解析与未来展望

在人工智能的浩瀚星空中,Agent(智能体)与大模型(深度学习模型)犹如璀璨星辰,各自闪耀却又相互辉映。然而,许多人对于这两者的界限仍感模糊,误以为Agent仅是大模型的一种应用形态。实则不然,它们在多个维度上展现出了鲜明的差异与互补性。

2024-07-08 08:00:00 617

原创 本地大模型运行工具、开源CRM等5个火爆项目

GitHub 一周热点汇总第20期(2024/04/21-04/27) ,本周期内其实最热的还是Llama3,但是上周刚刚入选,就换成Ollama了。来看看这一周内火爆的5个项目吧。

2024-07-08 07:45:00 744

原创 本地大模型运行工具、开源CRM等5个火爆项目

GitHub 一周热点汇总第20期(2024/04/21-04/27) ,本周期内其实最热的还是Llama3,但是上周刚刚入选,就换成Ollama了。来看看这一周内火爆的5个项目吧。

2024-07-05 15:06:54 712

原创 国产大模型价格战背后的战略考量

在当前的科技浪潮中,国产大模型市场正经历一场前所未有的价格战,阿里云、字节跳动、百度、科大讯飞等业界巨头纷纷调整策略,从价格下调到部分服务的免费开放,这一系列动作不仅加剧了市场竞争,也引发了业界的广泛讨论:大模型的降价究竟意味着什么?其背后的企业战略又是如何布局的?价格战背后的理性思考面对价格战,百度智能云事业群总裁沈抖曾强调,评估大模型的价值不应仅局限于价格,而应综合考虑其在不同工作负载下的性能表现。

2024-07-05 11:58:10 1297

原创 3K star!想了解AI搜索实现,可以看看这个开源项目

llm-answer-engine 构建了一个比较完整的AI增强搜索,覆盖到了目前主流的技术实现,所以如果对这个方向有关注,那么可以参考和学习一下其内在的实现逻辑。多模型融合:项目支持集成多种AI服务商的大型语言模型,如OpenAI GPT系列,为用户提供丰富且准确的答案来源。高性能架构:运用Groq作为底层向量数据库,确保了在大规模数据环境下快速有效地检索和生成答案。

2024-07-05 11:57:22 931

原创 7K star!Text2SQL还不够?试试RAG2SQL的开源工具

整体来说,Vanna 框架,让我们无需太多关心Prompt的构建、组装与优化,就可以快速实现一个基于Text2SQL方案的交互式数据库对话机器人,且具备更高的正确率。目前在一些使用是还是会存在正确率不够的情况,可能是RAG的信息不足的问题,但生成速度和体验上还是非常不错的。在Text2SQL领域,Vanna引入RAG的概念是一个不错的尝试,希望将来可以发展的越来越完善。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。

2024-07-05 11:52:40 800

原创 跟随“图灵奖”得主揭开ChatGPT的秘密

无论您是编程领域的探索者,还是对互联网科技抱有浓厚兴趣的朋友,这本由享誉全球的AI泰斗——姚期智院士领衔编著的《人工智能》教材,无疑是您踏入这一前沿领域不可或缺的入门宝典与权威参考!🌟权威匠心:本书由荣获计算机科学界至高荣誉——图灵奖的姚期智院士亲自操刀,他不仅是中国科学院的璀璨明星,更是现任清华大学交叉信息研究院的领航者。姚院士的深厚学术造诣与前瞻视野,确保了本书内容的权威性与前瞻性。🔧系统架构。

2024-07-04 15:09:45 593

原创 对话式 AI 工具到头了?该考虑改变了

人工智能工具正准备从根本上改变我们与技术互动的方式。与其他新技术一样,设计师准备塑造这些工具。人工智能工具存在问题,但我们有能力改进它们。我建议将心理模型从一对一的聊天转变为协作画布。这可以消除许多障碍并使用户更加精确和高效。让我们彻底改变现状,创建让用户和人工智能顺利并肩工作的工具。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2024-07-04 15:06:38 932

原创 全新神经网络架构等5个火爆项目

GitHub 一周热点汇总第21期(2024/05/05-05/11) ,本周最火的项目是KAN,在其论文推出后掀起了一轮热度,让人们看到了AI能力再次提升的机会,你觉得它能取代MLP吗?先来看看这一周内火爆的5个项目吧。

2024-07-04 15:05:24 546

原创 外网爆火!真正内行人必看的大模型神书!

🌟 刚刚于四月初闪耀登场,这部书籍在亚马逊平台上已收获满满好评,被誉为解锁LLM大模型应用的实战宝典,其中文版震撼登陆,引领潮流!📘 深度剖析,17章精华汇聚,引领您深入Transformer的奇幻之旅!从理论基石到实战前沿,无一不精,无一不细。🔍 全面覆盖,从理论精髓到实战攻略:1️⃣ 洞悉前沿技术,轻松驾驭复杂语言处理难题。2️⃣ GPT vs BERT,两大Transformer模型巅峰对决,深入解析优劣势。

2024-07-03 11:54:40 825

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除