- 博客(36)
- 收藏
- 关注
原创 AI绘画美女指令大全,5个技巧让你的画作惊艳四座,美得令人窒息
你是不是曾梦想过自己也能创作出如画美景般的美女形象,却苦于手边的画笔无法达成心中所愿?在这个科技飞速发展的时代,AI绘画技术已经悄然走进了我们的生活,让每一个普通人都能成为艺术大师。你可能会问,AI绘画真的能做到如此惊艳的效果吗?今天,我们就一起来揭示这背后的秘密,分享5个技巧,让你的画作美得令人窒息。
2024-09-26 11:51:40 737
原创 Midjourney高清指令:3个技巧让你的AI绘画更清晰细腻,惊艳众人
别担心,今天我就带你一起探究如何利用Midjourney的高清指令,让你的AI绘画作品更加惊艳,吸引所有人的目光。别停留在理论上,赶紧打开Midjourney,亲自试验一下这些指令,看看你能创造出怎样的惊艳作品!原因很简单,分辨率越高,细节表现越丰富,绘画效果自然更加细腻。Midjourney提供了一些高级指令可以帮助你调整纹理和细节,让你的作品更加精美。Midjourney提供了丰富的调色选项和光照效果,可以让你的作品更加生动。通过设置特定的调色板,你可以控制画作的整体色调,让作品看起来更协调。
2024-09-26 11:39:58 711
原创 AI绘画:Stable Diffusion 终极炼丹宝典:从入门到精通
现阶段,AIGC(人工智能生成内容)领域主要有两大热门趋势,Stable Diffusion因其开源免费的特性和高度灵活的定制性而备受青睐,尤其吸引那些热衷于探索和创新的人群。在互联网大厂中,AIGC 已经展现出强大的应用潜力。无论是内容创作、智能客服,还是数据分析、代码生成,AIGC 都大显身手。此外,众多科技企业也在积极孵化 AIGC 项目,互联网巨头纷纷推出相关岗位,不论是技术还是产品、运营、设计,争相占领这一技术高地。(boss直聘AIGC相关高薪岗位)在AI绘图领域,
2024-09-13 10:39:24 668
原创 一文看懂开源许可证:大语言模型和向量数据库入门指南
开源许可证是 AI 中协作开发和创新的基石,定义了开源软件访问、使用和分发的边界。ASF 主要以开发广泛使用的软件项目如 Apache Hadoop 和 Apache Kafka 而闻名,它提供了一个开放和去中心化发展的框架,并采用宽松的许可模型。社区参与有助于维护开源生态系统内的互信、透明度和共识,促进创新和增长,同时保持开源软件的完整性。假设一家提供开源软件的公司突然关闭源代码或使用具有更多限制的许可证,那么利用最后一个开源版本代码的企业就不得不承担维护代码和开发新功能的重担。
2024-08-02 17:51:09 557
原创 大模型应用落地:如何选择合适的 Embedding 模型?
OpenAI 的创新工具 Sora,则在文本到视频的生成领域展现了非凡能力,与 Dall-E 在图像生成领域的成就相似,Sora 仅需用户输入文本提示,即可借助强大的 LLM 生成对应的视频内容。该模型不仅在排名上表现抢眼,而且以其较小的体积适合在有限资源的设备上运行,此外,模型卡片提供的博客和论文链接也增加了其透明度和可信度。至于多模态文本-视频的 RAG 应用,则采取了类似的策略,先将复杂的视频内容简化为可处理的文本描述,经 Embedding 转化后执行文本查询,最后输出相关的视频片段作为检索成果。
2024-08-02 17:49:21 808
原创 RAG 的尽头是 Agent?
Naive RAG(基于检索的增强生成)应用主要是在整合自身知识库的基础上,提升大型模型的性能,以产出更精准、即时和丰富的行业内容或定制化信息。信息转换:{“英文关键词”: [“bicycles”, “invention”, “timing”], “中文关键词”: [“自行车”, “发明”, “时间”]}。用户输入示例:“请用2000字的篇幅详细说明,我的问题是,自行车是什么时候发明的?因此,我们的大模型应用也将从 RAG 迈向 Agent,可以说,Agent 是 RAG 发展的必然归宿。
2024-08-02 17:42:32 879
原创 RAG 开发四大痛点及解决方案
收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。在最初的 RAG 方法中,比较类型的问题表现尤为不佳。观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
2024-07-31 10:09:16 708
原创 基于LLM的搜索排序
滑动窗口重排序次数的影响:表中的方法(3)(4)显示进行多次重排序可能会提高nDCG@10,但会损害nDCG@1排序性能(例如,nDCG@1下降了3.88)。滑动窗口的方案简单,不过笔者认为从全局来看,该方案不太公平,因为不同段落之间的排序未必存在偏序传递关系:图中p4和p5未必比p6和p7更优。对第二个问题,文章采用蒸馏技术,以在更小的专用排序模型中模仿ChatGPT的段落排序能力。文章的方案是最后一个,将一组段落输入到LLM,每个段落都有一个唯一的标识符(例如,[1],[2],等)。
2024-07-30 11:26:43 729
原创 解锁LLM应用潜能:提示工程的39种方法与应用全解析!
大型语言模型(LLMs)在许多不同的自然语言处理(NLP)任务上表现出了显著的性能。提示工程在提升LLMs已有能力方面发挥着关键作用,使其在各种NLP任务上取得了显著的性能提升。提示工程需要编写自然语言指令,即提示,以结构化的方式从LLMs中提取知识。与以往的最先进(SoTA)模型不同,提示工程不需要根据给定的NLP任务进行广泛的参数重新训练或微调,而是仅依赖于LLMs的内嵌知识。此外,LLMs的爱好者可以通过基本的自然语言对话交换或提示工程,智能地提取LLMs的知识,使得越来越多的人即使没有深厚的数学机器
2024-07-30 11:23:34 735
原创 什么是机器学习
而有了机器学习,你只需要给电脑大量的猫和狗的图片,告诉它哪些是猫,哪些是狗,然后它自己就能“学习”到这些特征,下次再给它一张新图片,它就能猜出来这是猫还是狗了。最近几年,人工智能领域的“大模型”火得一塌糊涂,比如OpenAI的GPT-4,百度的文心一言、阿里的通义千问等,这些模型拥有超强的学习和推理能力,能生成自然语言、回答问题、作诗写歌、生成创意图片。强化学习就像是你在玩一个复杂的网络游戏,没有别人来教你具体该怎么做,但是每次你做出一个操作,游戏都会给你反馈:要么得分(奖励),要么扣分(惩罚)。
2024-07-30 10:58:10 360
原创 赶超 GPT-4o,最强大模型 Llama 3.1 405B 一夜封神,扎克伯格:开源引领新时代
为了实现这种规模的训练并在短时间内达到预期的效果,研究团队优化了整个训练堆栈,在超过 16000 个 H100 GPU 上进行训练,这也是第一个在如此大规模上训练的 Llama 模型。通过监督微调、拒绝采样和直接偏好优化等方法,在预训练模型基础上进行多轮对齐,构建聊天模型,Llama 3.1 405B 也能够更精确地适应特定的使用场景和用户需求,提高实际应用的表现。简单来说,超大杯 Llama 3.1 405B 是 Meta 迄今为止最强大的模型,也是全球目前最强大的开源大模型,更是全球最强的大模型。
2024-07-29 11:16:36 774
原创 AI+技术 | 一文读懂以LLM为核心的AI Agent的架构指南
控制端处于核心地位,大脑模块承担记忆、思考以及决策制定等基础工作,感知模块则负责接受和处理来自外部环境的多样化信息,如声音、文字、图像、位置等,最后,行动模块通过生成文本、API调用、使用工具等方式来执行任务以及改变环境。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
2024-07-29 10:49:44 741
原创 AI应用 | 【AI+工业】LLM(大型语言模型)在工业领域中的十个应用
同样在 6 月,Cognite 推出了 Copilot 产品,利用 LLM 的自然交流能力,将其作为通用的低代码接口,连接到其解决方案的最先进功能,从而为更多的一线工人、数据科学家、设施管理人员和高管提供了通过他们喜欢的媒介与关键信息进行交互的能力。虽然即使是当今最强大的 LLM(如 GPT-4 和 Claude)有时也会犯错,但如果利用适当的软件支架来引导他们的注意力,他们对世界的一般知识就能为操作员、经理和工程师提供快速、无需判断的理智检查,或对关键决策提供第二意见(见图4)。
2024-07-29 10:33:20 860
原创 科普贴:什么是大模型?快速了解大模型基本概念
随着技术的不断进步,大模型将在未来的智能社会中扮演更加重要的角色,为人类社会带来更多的可能性。想象一下,如果你的大脑能够记住整个图书馆的所有书籍,并且能够理解每本书的内容,那么你就拥有了类似大模型的能力。大模型是人工智能领域的一种机器学习模型,它们通过学习大量的数据,获得了类似于人类理解语言、图像和声音的能力。那么,什么是大模型呢?我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下。
2024-07-29 10:29:30 973
原创 大模型微调实战
最后,当专家要解决新任务时,他会先参考简化版的“知识点手册”,找到与任务相关的关键知识,然后用“解码手册”把这些知识转化为具体的行动指令。首先,我们给这位专家配备两本“秘籍”:一本是简化版的“知识点手册”(对应低秩矩阵A),另一本是对应的“解码手册”(对应低秩矩阵B)。也就是说,我们在微调时,只更新这两本秘籍里的内容,而不去碰专家脑子里其他成千上万的知识点。我们使用modelscope下载的数据集模型文件都在缓存文件夹中,为了方便读取和微调,我们把它移动到ChatGLM3文件夹中。
2024-07-27 10:44:09 629
原创 一文了解AI Agent
作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下。AI Agent就像有了超能力的小助手,不管是帮你打扫卫生,解答疑问,还是在复杂的工厂里帮忙干活,它们都能自己做判断、做事情。
2024-07-27 10:28:43 2254
原创 从零开始学习大模型
随着技术的进步,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及视频。了解当前主流的大模型,如GPT系列、BERT、Transformer等,学习它们的基本架构和工作原理。学习机器学习的基本概念、算法和模型,如线性回归、决策树、随机森林、支持向量机等。学习如何处理和准备数据,以适应大模型的需要,包括数据清洗、标注和增强等技术。学习模型优化技术,如模型压缩、量化、蒸馏等,以提高模型的效率和性能。
2024-07-27 10:06:20 324
原创 万字长文剖析城市大模型:认知、应用、展望
理想的,我们还是希望有一个政策知识库,它不是简单的一堆文本的文件夹,而是一个有知识结构的库,具备实时更新、智能检索、语义理解等功能。它通过自主学习,掌握了挖掘、建房屋、收集、打猎这些基本的生存技能,还通过自我驱动,不断探索着这个神奇的世界,去到不同的城市,路过一片片海洋,一座座金字塔,它甚至还会自己搭建传送门。广义的城市大模型的落地实施,需要行业主管部门进行顶层设计和统筹规划,以确保行业共性知识库的合规性,并推动建立一个可扩展、可协同的行业大模型技术架构,同时,探索可持续的运营与服务模式。
2024-07-27 09:59:57 969
原创 最强大模型 Llama 3.1-405B 架构设计剖析
接着,利用人工标注数据通过 DPO 模型调整LLM参数,DPO 实质上是一个二分类任务,它从<Prompt,Good Answer,Bad Answer>的三元数据中学习,调整模型参数以促使模型输出 Good Answer,避免输出 Bad Answer。这样就完成了一个后训练迭代周期。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
2024-07-25 12:21:17 2257
原创 大模型“算”出青岛未来
2024年5月底,在青岛市算力发展大会上,青岛市工业和信息化局发布的《青岛市人工智能产业创新发展行动计划(2024—2026)》提出:青岛将实施算力设施“强基”、算法模型“铸魂”、数据要素“提质”、核心产业“固链”、创新平台“领航”、产业生态“聚力”、场景应用“赋能”七大行动,将大模型作为重点推进方向。”张文政将海尔、海信、青啤这些企业比作圆心,在它们的“圈子”里有数以万计的攸关方,而“圆心”们打造的大模型产品几乎具备一呼百应的能力,谁与之相关,谁就能获得精准的大模型赋能。
2024-07-25 12:10:40 715
原创 中小企业,AI大模型喊你“快上车”,定制企业专属‘模型’
最近在国内的8个矿井发生了同一件新鲜事——煤矿工人不用下井,而是在地面上作业,不仅工作环境更舒适,而且极大地减少了安全事故。覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,减轻煤矿工人的工作强度,华为云盘古矿山大模型游刃有余。在银行,排队办理业务的人为什么少了?因为华为云盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练,根据客户的问题,为柜台工作人员自动生成流程和操作指导,所以将原来需要平均5次的操作缩减至1次,办结时间缩短5分钟以上。
2024-07-25 12:02:40 964
原创 一文让你搞懂什么是AI大模型!
通用大模型技术快速发展,但很多传统行业推进得并不快。对企业而言,大模型应用需要综合考虑专业性、数据安全、持续迭代和综合成本等多种因素。针对这些现实情况,腾讯集团提出重点发展行业大模型的理念。本文基于一线大量实践反馈,做出系统归纳总结,呈现行业大模型发展真实情况,厘清关键争议和困惑问题。真正解决用户需求、距离场景和数据更近的企业,将拥有大模型的未来。
2024-07-23 17:43:29 1027
原创 如何快速构建个人 AI 知识库?
相反,如果资料是完整的文章,具有较强的连贯逻辑,则应尽量增大切块尺寸,以避免将一个连贯的段落切割得支离破碎,影响上下文的连贯性。更强大的是,一条笔记可以链接到另一条笔记,形成知识图谱的关联逻辑。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。正如我之前提到的,它的集成度非常高,从模型的搜索和下载,到加载和对话,所有功能都集中在一个包内。
2024-07-23 17:14:00 754
原创 RAG 企业级应用落地框架细节差异对比
在模型微调过程中,我们采取了分步骤的策略:起初使用公开可用的通用问答数据集进行初步微调,随后利用特定领域的问答数据进行进一步微调,最终使用经过人工精确标注的高质量问答数据来进行细致的微调。作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。这三个步骤表面上看似乎并不复杂,然而在 RAG 从构建到实际部署的整个流程中,包含了众多精细且复杂的工作环节,这些落地细节是最具挑战的工作。
2024-07-23 15:24:17 665
原创 浅谈大模型RAG架构落地的十大挑战
Prompt 创作远超于问题与检索材料的直接整合,它要求根据生成模型的独特性,采取定制化的表述策略与附加指导。为了约束大模型潜在的泛化偏差,确立一个恒定的“角色框架”显得尤为关键,比如:明确指示大模型“扮演该领域的权威学者”,或“仅限于利用提问与关联素材进行精要概述与总结”,从而在各种情境下维持回答的精准度与相关性。在此基础上,大模型必须展现出高度的整合能力,使得最终的输出结果不仅在逻辑链条上紧密相连,而且在观点与事实的呈现上保持高度一致,这一过程对大模型的综合推理与衔接能力提出了严峻考验。
2024-07-15 13:59:55 817
原创 快手刘育良,教你如何训练超大规模集群下的大语言模型
再者,由于模型尺寸巨大和数据量庞大,随之带来的是巨大的计算量,基本上现在表现良好的大模型都需要 1e24 Flops 级别以上的计算量。在前面,我们讨论了通信对计算效率的影响。即便我们实施了分桶策略,我们发现由于网络抖动等原因,DP 的通信和 PP 的通信仍有小概率发生 overlap,导致多流打入单网卡的现象,进而引起网络拥塞。如果将刚才提到的 scaling law 的横轴从计算量换成计算卡时,那么我们的目标就是通过提高训练效率来减少总体的训练时间,进而增加 scaling law 的斜率。
2024-07-15 10:47:55 827
原创 LLaMA-Factory 让大模型微调变得更简单!!
他们打造的 LLaMA-Factory,集成了顶尖的训练效率技术,让用户能轻松通过网页界面 LLAMABOARD,无须编码,即对上百个语言模型进行个性化微调。别担心,技术的进步就在眼前,随着模型优化,这一等待时间即将成为过去。微调过程完毕后,你可前往指定的输出目录(output_dir),在其中详尽审视训练日志,这些记录涵盖了关键指标,比如:训练损失与验证损失,助你全面了解模型学习的进展与性能。而经过微调训练得到的大模型,其部署和调用方式则与其他预训练大模型保持一致,确保了使用的便捷性和通用性。
2024-07-13 17:05:21 502
原创 人人都能听懂的大白话 Transformer 技术原理,错过再等一年!
解码器依托编码器提供的深入洞察,负责生成所需的输出,无论是将句子翻译成另一种语言、生成一个精确的摘要,还是写代码。自注意力机制为每个单词生成了三个特殊的向量:“查询(Query)”(询问我需要什么信息)、“键(Key)”(标示我有什么信息)和 “值(Value)”(实际的含义和上下文)。然后,通过比较每个单词的 “查询” 向量与其他所有单词的 “键” 向量,自注意力层评估了各个单词之间的相关性,并计算出注意力得分。通过考虑句中其他单词提供的上下文,自注意力机制为每个单词创建了一个新的、更丰富的表示。
2024-07-13 11:21:02 633
原创 AI大模型时代,35岁+程序员都去哪了?
然而,随着这股浪潮的汹涌,人们开始关注那些35岁以上的程序员,在这个快速变化的时代中,面临着怎样的挑战和机遇?该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。,开启了自己的创业之旅。
2024-07-13 11:07:21 924
原创 大模型应用的6种架构模式,你知道几种?
对于用户的 Prompt 提示词,Agent 会基于大模型先做规划(Planning),拆解成若干子任务,然后对每个子任务分别执行(Action),同时对每一步的执行结果进行观测(Observation),如果观测结果合格,就直接返回给用户最终答案,如果观测结果不合格或者执行出错,会重新进行规划(Replanning)。这样的架构模式非常适合复杂的问题解决场景,在这种场景中,问题的不同方面需要不同的专业知识,就像一个由专家组成的小组,每个专家负责处理更大问题的一个方面。二是防火墙,它为大模型提供了保护层。
2024-07-13 11:00:51 2311
原创 京东AI产品经理给大家的建议,让你少走三年弯路
在最后的落地环节,需要开始考虑到如何融合双方产品,包括融合后的产品定位、融合的时间节奏、团队间的分工协作,考虑到融合后对用户可能造成的影响,我们将整体的工作划分为三期:第一期主要从SDK层面融合,用户几乎无感知;同时,也保持了学习的习惯,一直在沉淀AI产品的方法论。我在学生期间主修方向是机械工程和风险管理,之前是没有AI相关经历的,但当时我判断未来AI会在更多的行业有应用落地,所以在毕业论文的选题上,选择了AI+风险管理的方向,恰好在实习时朋友推荐了京东AI产品的岗位从而加入了京东。
2024-06-28 10:54:25 501
原创 AI时代谁最可能成为成功的产品经理?
如果你还是一个未毕业的在校生,其实想要成为一个AI产品经理最直接的方式就是找对应的实习,实习的要求相对是最低的,然后通过实习经验作为筹码,校招时找对应的AI产品经理岗位。如果校招时无法找到完全对口的AI产品经理,也可以退而求其次找对应的AI咨询或者AI解决方案工作,后期转AI产品经理也是比较对口。传统的互联网产品经理不懂技术是可以成为一名优秀的产品经理,但是对于AI产品经理来说完全不懂技术,只具备产品经理应有的沟通能力、协调能力、项目管理能力等是很难成为一名优秀的AI产品经理的。
2024-06-28 10:28:40 769
原创 大语言模型(LLM)最佳学习路线、代码、论文,全汇总!产品经理、程序员、转行必看!
AI趋势势不可挡,风口来了!无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套资料涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。
2024-06-27 14:59:12 709
原创 想入行网络安全行业,别急,先看了这篇文章再说!
路线有了,下一步就是沿着这个路线框架去寻找合适的资料学习,找资料的方式也有很多,比如CSDN,比如知乎,再比如B站,都有很多人在分享自己的学习资料,但我觉得这里存在的很大一个问题就是不连贯、不完善,大部分免费分享的教程,都是东一块西一块,前言不搭后语,学着学着就蒙了,这是我以前自学的亲身感受。安全产品方向:产品都是部署在网络上的,所以想入门产品,首先要入门的是网络基础(思科华为华三都可以),在一个需要调试安全策略,所以需要懂基本的安全知识和原理,总结下来,安全产品入门需要 网络基础+基础攻防。
2023-08-19 15:25:25 106 1
Stable Diffusion 新手入门教程,安装使用及模型下载
2024-06-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人