AI
文章平均质量分 91
AI相关
yule.yang
这个作者很懒,什么都没留下…
展开
-
使用Spring AI 和 LLM 实现数据库查询
在 LLM 的帮助下质疑数据库需要对元数据进行一些努力,并且对数据库包含的内容有一个粗略的了解。AI/LLM 不适合创建查询,因为 SQL 查询需要正确性。需要一个相当大的模型来获得所需的查询正确性,并且需要 GPU 加速才能进行生产性使用。设计良好的 UI,用户可以在其中拖放结果表中的表列,这可能是满足要求的不错选择。Angular Material Components 很好地支持拖放。原创 2024-06-13 13:32:19 · 1310 阅读 · 3 评论 -
MLOps 体系结构模型
从我们的用例来看,金融机构没有足够的专家从头开始构建专业的 MLOps 平台,但由于法规和额外的财务限制,它也不想投资端到端托管的 MLOps 平台。然而,根据该机构管理层的说法,由于最近宣布的银行法规和安全要求,这一过程是不可接受的。此外,与市场上的竞争对手相比,计算结果的交付速度太慢,在财务上是不可接受的。如果公司已经拥有所需的专家和训练有素的团队来设计和构建 ML 平台,那将是一个不错的选择。的解决方案是一个不错的选择,因为模型训练和模型服务的基础设施资源是无限的。一个生产就绪的平台;原创 2024-04-08 16:57:44 · 700 阅读 · 0 评论 -
实现RAG:使用LangChain实现图检索查询
该术语在当今的技术领域中使用得很多,但它的实际含义是什么呢?以下是来自不同来源的一些定义:“检索增强生成(RAG)是优化大型语言模型输出的过程,因此在生成响应之前,它会参考训练数据源之外的权威知识库。” — AWS“检索增强生成(RAG)是一种利用从外部来源获取的事实,提高生成式人工智能模型的准确性和可靠性的技术。” — 英伟达“检索增强生成(RAG)是一个人工智能框架,通过将模型建立在外部知识来源上,以补充法学硕士对信息的内部表示,从而提高法学硕士生成的响应的质量。” — IBM研究院。原创 2024-04-08 16:47:31 · 994 阅读 · 0 评论 -
详解多模态 AI
2022 年 11 月,OpenAI 推出了。它只用了几天时间就以其前所未有的能力席卷了世界。生成式人工智能革命已经开始,每个人都在问同一个问题:下一步是什么?当时,ChatGPT 和许多其他由大型语言模型 (LLM) 提供支持的生成式 AI 工具旨在处理来自用户的文本输入并生成文本输出。换句话说,它们被认为是单模态的人工智能工具。今天,如果我们要回答一个问题,下一步是什么?最好的答案可能是多模态学习。这是正在进行的人工智能革命中最有希望的趋势之一。原创 2024-03-25 18:52:00 · 1617 阅读 · 0 评论 -
隐私保护 AI 的演变:从协议到实际实现
与其说是结论,不如说是强调在机器学习中采用高级安全方法的重要性和紧迫性。为了在人工智能安全和安保方面取得有效和长期的成果,人工智能开发界与法律和政策机构之间应协调努力。在制定规范、道德、标准和法律方面建立信任并建立积极主动的合作渠道,对于避免技术和政策部门的反应反应和可能无效至关重要。政策制定者应与技术研究人员密切合作,探索、预防和减轻人工智能的潜在恶意应用。人工智能研究人员和工程师应认识到其工作的双重用途性质,考虑滥用的可能性,并允许这些考虑影响研究重点和规范。原创 2024-02-20 18:52:48 · 1053 阅读 · 0 评论 -
伯克利研究院推出Ghostbuster用于检测由LLM代笔的文本
Ghostbuster的架构,用于检测人工智能生成文本的最先进的新方法像 ChatGPT 这样的大型语言模型写得非常好,但事实上,它们已经成为一个棘手的问题。学生们已经开始使用这些模型代写作业,导致一些学校禁止 ChatGPT。此外,这些模型也容易产生带有事实错误的文本,因此谨慎的读者可能想知道生成人工智能工具是否被用来代写新闻文章或其他来源,然后再相信它们。教师和读者可以做些什么以应对?现有的检测人工智能生成文本的工具有时在处理与训练数据不同的数据时表现不佳。原创 2024-02-08 15:12:24 · 961 阅读 · 0 评论 -
2024年10大软件开发趋势
随着 2024 年的到来,技术进步和不断变化的市场需求正在推动软件开发领域继续呈指数级增长。对于组织和工程师来说,及时了解这些模式不仅有用,而且是保持残酷和有效的基础。在本文中,我们研究了预计将在 2024 年产生巨大影响的关键编程改进模式。2024年计算机编程通用标准作为 2024 年 IT 业务特征的整体编程改进方法将进一步结合人工智能和 ML 进步、区块链的使用和多运行时微服务。AR 和 VR 的广泛使用同样将继续塑造业务。此外,软件工程师将更加强调网络保护和经济编程改进。原创 2024-01-29 19:43:12 · 1898 阅读 · 0 评论 -
全面解析开源大语言模型:BLOOM
BigScience 大型开放科学开放获取多语言模型(简称 BLOOM)代表了语言模型技术民主化的重大进步。BLOOM由来自39个国家的1200多名参与者共同开发,是全球努力的产物。该项目由 BigScience 与 Hugging Face 和法国 NLP 社区合作协调,超越了地理和机构的界限。它是一个开源的、仅解码器的转换器模型,具有 176B 参数,在 ROOTS 语料库上训练,该语料库是 59 种语言的数百个来源的数据集:46 种口语和 13 种编程语言。下面是训练语言分布的饼图。原创 2024-01-25 20:05:06 · 3121 阅读 · 0 评论 -
BERT 模型是什么
BERT(代表 Bidirectional Encoder Representations from Transformers)是 Google 于 2018 年开发的开源模型。这是一项雄心勃勃的实验,旨在测试所谓的 Transformers(一种创新的神经架构,由谷歌研究人员在 2017 年的著名论文《注意力是你所需要的一切》中提出)在自然语言 (NLP) 任务上的性能。BERT成功的关键在于其变压器架构。在 Transformer 出现之前,对自然语言进行建模是一项非常具有挑战性的任务。原创 2024-01-08 20:25:17 · 1449 阅读 · 0 评论 -
什么是检索增强生成 (RAG)
RAG,即检索增强生成,是一种将预训练的大型语言模型的功能与外部数据源相结合的技术。这种方法将 GPT-3 或 GPT-4 等 LLM 的生成能力与专用数据搜索机制的精确性相结合,从而形成一个可以提供细微响应的系统。本文更详细地探讨了检索增强生成,提供了一些实际示例和应用,以及一些资源来帮助您更多地了解 LLM。RAG 可以使用来自外部来源的内容来生成准确的摘要,从而节省大量时间。例如,经理和高级管理人员是忙碌的人,他们没有时间筛选大量报告。原创 2024-01-08 20:08:32 · 1991 阅读 · 0 评论 -
在 PyCharm 中使用 Copilot
此外,要在 PyCharm 中使用 GitHub Copilot,您必须有效订阅 Copilot。在 PyCharm 中安装 GitHub Copilot 后,您现在可以将其用作项目的扩展。此外,它很容易安装在不同的 IDE 平台上,您还可以为特定编程语言启用 GitHub 插件。此外,按照以下步骤,您可以轻松地在 PyCharm 中安装 GitHub Copilot。此外,在 IDE 上使用 GitHub Copilot 时,您可以使用一些快捷方式。原创 2024-01-07 22:34:26 · 7353 阅读 · 0 评论 -
8 个最流行的机器学习工具
每个人都需要工具。建筑工人、水管工、电工——你能想到的都有。工具是每个工匠工具箱的必要组成部分,包括机器学习从业者。机器学习从业者需要工具来帮助他们快速构建、训练和部署机器学习模型。每年都会出现大量新的机器学习工具,以帮助简化这一过程并推动该领域的发展。要保持在该领域的前沿,您至少要知道这些工具是什么,它们如何提供帮助,它们的关键特性、优势和劣势,以及一些理想的用例。在本文中,我们将讨论这些主题,然后比较每个工具,以便您知道如何为您的项目选择最佳工具。原创 2024-01-04 19:32:48 · 1478 阅读 · 0 评论 -
你的 VSCode 上 还没有 GitHub Copilot ?看这里
GitHub 正在通过其 Copilot 扩展套件快速生产革命性的开发人员生产力工具。它增加了我在编程中的乐趣,并减少了我花在令人麻木的任务上的时间。花一些时间使用 Copilot 工具尝试上面的用例,我想你会惊讶于它对你的效率和幸福感的影响。你很有可能会爱上它。原创 2023-12-29 12:48:43 · 2033 阅读 · 0 评论 -
如何使用 PyTorch 训练 LLM
使用PyTorch训练语言模型(LLM)需要经过数据准备、模型构建、损失函数和优化器定义、模型训练、模型评估、模型保存和加载等步骤。在部署模型时,需要考虑运行环境、推理速度、可扩展性和安全性等因素。通过不断地实验和改进,可以提高模型的性能和准确性,从而更好地应用于自然语言处理任务中。原创 2023-12-28 15:43:36 · 1303 阅读 · 0 评论 -
ChatGPT 和生成式 AI 年度回顾:16个精彩瞬间
ChatGPT 的自定义说明首次在 2023 年 7 月的测试版中推出,仅针对 ChatGPT Plus 订阅者。这使得 Plus 用户可以提供持续的指导和偏好,以形成 ChatGPT 在对话中的响应,而不必对每个提示重复说明。该特性通过合并您希望 ChatGPT 在每次生成响应时考虑的首选项或规范,使 ChatGPT 更加强大。GPTs,或自定义 AI 模型,代表了一种新方法,任何人都可以为特定的用例创建定制的 ChatGPT版本,而无需编码。原创 2023-12-27 17:16:33 · 1081 阅读 · 0 评论 -
矢量(向量)数据库 Top 5
随着人工智能的不断发展,矢量数据库在塑造数据检索、处理和分析的未来方面的作用无疑将越来越大,有望为各个领域提供更复杂、更高效和更个性化的解决方案。这就是矢量数据库发挥作用的地方,为这些人工智能驱动的应用程序提供了一个高度优化的环境。领先的向量数据库,如 Pinecone,提供 Python、Node、Go、Java 等多种编程语言的 SDK,确保开发和管理的灵活性。随着数字时代将我们推进到一个以人工智能和机器学习为主导的时代,矢量数据库已经成为存储、搜索和分析高维数据矢量的不可或缺的工具。原创 2023-12-26 19:42:55 · 1804 阅读 · 0 评论 -
在ClickHouse数据库中启用预测功能
对于每个给定的预测,我们只考虑最后 10 行。因为我们试图将整个数据集拟合到一个具有 5 个条柱的直方图中,该直方图是通过 histogram(5)(fare_amount) 函数调用指定的,并且数据集中的项目数量不是正态分布的,所以我们的条柱高度不一定相等。随着时间的推移,每家公司都有不同的动态,这使得这个问题变得更加困难,因为我们现在没有单一的数据系列,而是多个数据。这是 t+1 的时间序列预测,这意味着模型正在查看时间片中所有先前的功耗值,并尝试预测下一步,在本例中,它试图预测第二天的功耗。原创 2023-12-21 14:08:23 · 1974 阅读 · 0 评论 -
每个开发人员都应该知道的六个生成式 AI 框架和工具
生成式人工智能的格局正在迅速发展,HuggingFace、LangChain、LlamaIndex、Llama2、Haystack 和 SingleStore Notebooks 等框架和工具处于领先地位。这些技术为开发人员提供了将 AI 集成到其项目中的丰富选择,无论他们从事的是自然语言处理、数据分析还是复杂的 AI 应用程序。原创 2023-12-19 20:03:13 · 1289 阅读 · 0 评论 -
2024 年 8 个顶级开源 LLM(大语言模型)
选择开源 LLM 的公司将可以访问 LLM 的工作原理,包括它们的源代码、架构、训练数据以及训练和推理机制。这种透明度是审查的第一步,也是定制的第一步。由于每个人都可以访问开源 LLM,包括它们的源代码,因此使用它们的公司可以针对其特定用例对其进行自定义。原创 2023-12-19 15:27:50 · 35553 阅读 · 0 评论