自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(284)
  • 收藏
  • 关注

原创 AI 编程助手【第三弹】 | 智普华章CodeGeeX

智普华章CodeGeeXhttps://codegeex.cn/CodeGeeX是智普华章科技有限公司推出的一款免费开源AI编程助手,该工具基于130亿参数的预训练大模型,可以快速生成代码,帮助开发者提升开发效率。CodeGeeX支持多种IDE与编程语言,提供代码自动生成和补全、代码翻译、自动添加注释、智能问答等AI功能。基础功能代码自动生成和补全CodeGeeX可以根据自...

2024-07-14 11:25:36 336

原创 AI 编程助手【第二弹】 | BaiduComate vs FittenCode

百度文心快码BaiduComatehttps://comate.baidu.com/zhBaidu Comate(智能代码助手)是基于文心大模型,结合百度积累多年的编程现场大数据和外部优秀开源数据,打造的新一代编码辅助工具。拥有代码智能、场景丰富、创造价值、广泛应用等多重产品优势,可实现“帮你想、帮你写、帮你改”的场景应用形态。提升编码效率,释放“十倍”软件生产力。基础功能智...

2024-07-14 11:17:56 1145

原创 AI 编程助手【第一弹】 | 通义灵码 vs MarsCode

theme: github 在AI发展迅速的今天,作为帮助提高各行各业生产力的得力助手之一,AI编程助手已经展示了它们在编程方面的能力。那么,经过了一段时间的发展,我们是否很关心,它们究竟进化到了什么阶段,可以完成哪些任务,以及最重要的——它们究竟能不能替代程序员做一些基础的工作? 不是GitHub Copilot用不起,而是免费的更具性价比。本文将介绍面上热度比较高的5个不...

2024-07-14 11:08:33 1906

原创 大幅降低模型训练成本的神器SkyPilot

theme: github SkyPilot 是一个用于在任何云上运行 LLM、人工智能和批处理作业的框架,可最大限度地节约成本,提供最高的 GPU 可用性和托管执行。简介SkyPilot,由加州大学伯克利分校的 Sky Computing 实验室主导研发的一个开源框架,用于在任何云上无缝且经济高效地运行 ML 和数据科学批处理作业。它的目标是让云比以往任何时候都更容易使用,...

2024-04-30 18:51:14 502

原创 一个文本大模型的自我修养

theme: juejin 如何辨别一个人工智能模型是否优于另一个模型?通过人为主观的认知是远远不够的,最科学的方法是通过基准测试量化自然语言的数值指标,而且很幸运现在已经存在数百个公允的基准测试让我们能客观找到优秀的模型。排名的漩涡不管是开源还是闭源的大模型,基本上每次发布都会类比同等参数量级,表明自己在很多或者一些方面优于其它模型,比如下面两张图给到的Gemma和Clau...

2024-04-30 10:42:55 412

原创 如何使用 Google Gemma 大模型将自然语言转为 SQL?(二)

书接上文如何使用 Google Gemma 大模型将自然语言转为 SQL?(一)。训练模型(微调)1. 安装必要的依赖库py!pip3 install -q -U bitsandbytes==0.42.0!pip3 install -q -U peft==0.8.2!pip3 install -q -U trl==0.7.10!pip3 install -q -U ac...

2024-04-27 20:47:16 437

原创 如何使用 Google Gemma 大模型将自然语言转为 SQL?(一)

theme: github 使用 Google 的 Gemma 模型对 SQL 数据库进行自然语言查询。在本指南您将了解如何利用 Google Gemma 模型的强大功能,使用自然语言查询 SQL 数据库。本教程将逐步引导您设置一个功能强大、直观且用户友好的 SQL 查询系统。开始之前在正式微调训练之前,需要先完成下面的工作。1. 训练数据集https://huggi...

2024-04-27 20:45:28 317

原创 Meta Llama 3: 突破开源语言模型的新境界

在人工智能飞速发展的今天,大型语言模型(LLM)成为了业内瞩目的焦点。近期,Meta公司发布了其顶级开源语言模型Meta Llama 3,凭借卓越的性能和创新技术,再次突破了开源模型的发展极限。一、性能表现领跑业内Meta Llama 3发布了8B和70B两个参数规模版本,在多项权威基准测试中表现出色,无论是通用语义理解能力、知识问答,还是高阶指令遵循和编程挑战,其性能均遥遥领先于...

2024-04-25 12:30:17 300

原创 新一代AI模型"微小"身材大能量:Phi-3家族扬威记

theme: github 人工智能领域一直被大型语言模型的"体型歧视"所支配——越庞大越好,这是多年来模型开发的主流共识。直到最近,微软研究团队推出的Phi-3系列小型语言模型(SLM)才扭转了这一趋势,用精简高效的"微小"身材展现出超乎想象的大能量,掀起了AI界的新风潮。传统观念被打破:"小"也可以很"能"规模定律(Scaling Law)一直是训练大型语言模型的准绳——...

2024-04-24 20:13:56 302

原创 你还不知道基础设施即代码(IaC)?

theme: github什么是基础设施即代码(IaC)基础设施即代码(Infrastructure as Code,IaC)是一种通过编码的方式来管理和供应IT基础设施的做法。与手动建设和配置基础设施不同,IaC利用可编程的配置文件来描述和部署所需的计算资源、网络、存储等基础设施组件。IaC的主要特征包括:基础设施作为代码管理: 基础设施的规范和配置以代码的形式存在,可以进...

2024-03-21 09:55:29 455

原创 Flexera 2024 年云计算使用的分析

theme: github 根据Flexera最近发布的2024年云计算使用报告,可以观察到云计算的发展趋势和挑战。这篇文章将根据这份报告,对云计算在2024年的使用进行详细分析。 1. 多云和混合云的使用趋势 报告显示,多云和混合云已被广大企业接纳,其中89%的企业都在使用。这表明组织正越来越依赖云技术,而非单一的本地数据中心。多云和混合云的使用有助于提高数据的安全性...

2024-03-21 09:32:46 505

原创 通过Ollama 使用Gemma 模型

theme: githubGemma 模型的出身要运行Gemma模型,需要将ollama版本升级到>0.1.26,通过运行ollama的安装。由于Gemma模型(2b和7b)的大小,其质量将严重依赖于训练数据。从kaggle参考中我们可以读到,它们是在6万亿个令牌上训练的,包括:网络文档:多样化的网络文本确保模型接触到广泛的语言风格、主题和词汇。主要是英语内容。代码:...

2024-02-29 15:42:57 755

原创 Google Gemma :一个足够小在笔记本电脑上运行的AI模型

theme: githubGemma 介绍2024年2月21日,Google发布了最新的开放模型Gemma。是其为推动AI创新的开发者和研究者社区而构建的。Gemma 模型与Gemini共享技术和基础设施组件。并且其设计以Google人工智能原则 为核心。Google Gemma的两个版本:20亿参数:这个版本非常适合资源有限的用户,仍然能够执行许多任务。70亿参数:这...

2024-02-29 15:16:48 500

原创 Sora OpenAI:从文本生成震撼视频的AI模型(二)

theme: github Sora OpenAI,打通虚拟和现实的壁垒,用三个关键词概括它,“60s超长长度”、“单视频多角度镜头”和“世界模型”。????Sora 为什么重要,它有哪些应用?Sora 是人工智能和视频生成领域的重大进步,因为它展示了对语言、视觉感知和物理动态的深刻理解。它还展示了人工智能为娱乐、教育、艺术和交流等各种目的创造引人入胜、身临其境的内容的潜力。...

2024-02-17 22:32:35 267

原创 Sora OpenAI:从文本生成震撼视频的AI模型(一)

theme: github Sora OpenAI,打通虚拟和现实的壁垒,用三个关键词概括它,“60s超长长度”、“单视频多角度镜头”和“世界模型”。????︎前言想象一下,你可以根据简单的文字提示制作一段精彩的视频,比如 "一个人带着一只狗在月球上行走"。听起来不可能,对吗?现在不一样了,OpenAI 最新推出的人工智能模型 Sora 可以从文本中生成震撼人心的视频。 ...

2024-02-17 22:31:41 458

原创 如何用DLLE-3画出一只从叶子中诞生的龙

你可能觉得画一只叶子龙很简单,但其实并不是这样的。让我们一起来看看如何创作出一幅让人惊叹的作品。按照以下步骤,你不仅在创作艺术,你还在创造历史。步骤1:选择叶子 - 不只是一片绿色的叶子首先,你需要选择一片叶子。但是,不要随便选一片。你需要找到一片特别的叶子,一片能讲述古老森林和被遗忘土地的故事的叶子。这片叶子不仅仅是你的画作的一部分,它是画作的灵魂。 Prompt: A ...

2024-01-26 14:52:16 595 2

原创 2023年上半年追大模型的,下半年都比较受伤。

《金沙江创投主管合伙人朱啸虎访谈》读后有感,2023年上半年追大模型的,下半年都比较受伤。1. 珍爱生命,落地场景远离大模型(太卷)千万别在大模型赛道上直接跑,小心大模型提供商降维打击(比如GPTs),远离它的同时,利用它抓住客户,实现用户数据抢先闭环,这可能是最好的防守。2. 创业公司的机会在垂直场景大模型最终还是大厂的机会,创业公司就应该聚焦在销售、营销等自己擅长的...

2024-01-26 10:25:38 297

原创 一文搞懂Langchain Document Loader(二)

theme: orangeTransform Loaders:将数据从特定格式加载到文档格式转换加载器(Transform Loaders:)就像上文提到的的TextLoader一样 - 它们将输入格式转换为我们的文档格式。LangChain中有越来越多的转换加载器,包括但不限于以下几种:CSVEmailHTMLMarkdownMicrosoft Word/PowerPo...

2023-10-31 17:33:55 1172

原创 一文搞懂Langchain Document Loader(一)

theme: orange前言像 GPT-3 这样的语言模型已经在大量数据上进行了训练,包括数百 GB 和数十亿个单词。因此,它们具有扎实的知识基础,使它们在历史和科学等领域表现出色。然而,这些模型确实有局限性。一旦它们在训练中达到了某个程度,除非可以访问互联网,否则它们无法吸收任何新信息。此外,它们无法访问私人和企业文件中的大量数据。要解决这个问题,理解“索引”的概念至关重要。这...

2023-10-31 14:09:45 650

原创 一文搞懂 Langchain Models (四)

theme: orange 接上文???????????? 一文搞懂 Langchain Models (三)。 提示模板(Prompt Templates )在构建动态的、面向用户的应用程序时,一般不会对提示进行硬编码。我们需要能够在提示模板中使用用户输入来构建提示。LangChain 提供了构建这些提示模板和动态插入输入的类。提示模板允许您传入变量值以动态调整传递给LLM的内容...

2023-10-31 12:28:12 152

原创 一文搞懂 Langchain Models (三)

theme: orange 接上文《????????????一文搞懂 Langchain Models (二)》。Chat Models聊天模型使用LLM(大型语言模型)进行操作,但具有不同的接口,使用“消息”而不是原始文本输入/输出。LangChain 提供了与这些模型轻松交互的功能。在聊天模型中,支持三种类型的消息:SystemMessage(系统消息) - 这设置了LLM的行为...

2023-10-31 12:13:09 151

原创 一文搞懂 Langchain Models (二)

theme: orange 接上文???????????? 一文搞懂 Langchain Models (一)。大语言模型(LLMs)介绍实际上,大型语言模型(Large Language Models)操作起来相当简单。你可以提供一个用自然语言的输入给大语言模型:text北京有哪些著名景点?然后模型将返回一个文本:text北京的著名经典有故宫、雍王府、颐和园等La...

2023-10-31 11:03:36 100

原创 一文搞懂 Langchain Models (一)

theme: orange 在这篇文章中,我们来探索下LangChain中的“模型”。从本质上讲,模型使得处理不同的语言或嵌入服务变得容易,因为它们提供了一个统一的接口。这意味着无论您是使用OpenAI还是Hugging Face,您都可以通过相同的方式与“模型”进行交互,从而使开发和迭代变得更加简单。Model I/O任何语言模型应用程序的核心要素都是模型。LangChai...

2023-10-31 10:09:37 223

原创 基于AIGC构建本地知识库问答 - 文本切割粒度考量

粗粒度的文本被检索出来之后给大模型参考,大模型总会被文本中的无关信息干扰; 而细粒度的文本,检索出来的信息可能不全,缺少上下文信息,导致大模型没法给出正确答案。那么在工程中如何平衡切割文本的长短呢?一、背景使用AIGC构建本地知识库的其中一个步骤就是切割文本(chunk),其中一个核心的参数便是控制文本切割的粒度,这直接关系到Q&A环节的回答质量。粗粒度的文本被检索出来...

2023-10-30 20:04:44 241

原创 计算机视觉 GPT-4V 它来了!

GPT-4V(GPT-4Vision)(GPT-4V)是由OpenAI开发的一种多模型。GPT-4V允许用户上传一张图片作为输入,并提出关于该图片的问题,这种任务类型被称为视觉问题回答(VQA)。 GPT-4V自9月24日起推出,并将在OpenAI ChatGPT iOS应用和网络界面中提供。一、前言OpenAI 正在扩展其在人工智能(AI)领域的视野,推出了 GPT-4V 模型...

2023-09-28 20:43:50 1709

原创 还没搞懂嵌入(Embedding)、微调(Fine-tuning)和提示工程(Prompt Engineering)?...

theme: orange 嵌入(Embedding)、微调(Fine-tuning)和提示工程(Prompt Engineering) 是AIGC 模型的核心功能,合理运行这些功能,能实现一些复杂和意向不到的应用。前言Prompt和Embedding是AIGC模型的核心功能,语言处理应用。例如,它们可以用于聊天机器人、语言翻译、摘要生成、文本分类等。Fine-tuning技...

2023-09-27 09:36:04 2278

原创 序幕:AIGC 进入“平民化”时代

theme: orange 2022年是AIGC(AI-Generated Content)爆火出圈的一年,不仅被消费者追捧,而且备受投资业界关注,更是被技术和产业界竞相追逐。2023,千帆竞逐...一、 第四次技术革命1)18 世纪60 年代,英国率先发展并完成了第一次工业革命,在随后的一个多世界里成为了世界霸主;2)19 世纪60 年代,完成了资产阶级革命或改革的美、德、...

2023-09-27 09:15:01 104

原创 如何使用Streamlit快速创建仪表盘?

上文有快速带大家了解streamlit,因为工作需要,这两天尝试构建了仪表盘,也就是咱们常说的Dashboard,本篇文章将教你如何使用 Streamlit 快速创建一个简单的仪表盘。前言Streamlit 可以帮助你轻松创建自定义的数据可视化、互动图表和表格,还能让你通过网络浏览器与他人共享你的作品。它提供了一种简单直观的方法来构建你的网络应用,无需使用 HTML、CSS 或 J...

2023-09-07 22:59:55 143

原创 Streamlit快速入门指南

theme: orange Streamlit是一个Python库,允许您创建交互式的数据科学和机器学习Web应用程序。Streamlit介绍Streamlit是一个Python库,允许您创建交互式的数据科学和机器学习Web应用程序。使用Streamlit,您可以快速轻松地创建自定义Web应用程序,让用户与您的数据和模型进行交互。Streamlit旨在简单直观,专注于通过...

2023-09-06 23:23:51 788

原创 快速开始 Mybatis TypeHandler

theme: orange MyBatis TypeHandler是MyBatis框架中的举足轻重的组件之一,用于处理Java对象和数据库中的数据类型之间的转换。MyBatis TypeHandler 介绍MyBatis TypeHandler是MyBatis框架中的一个重要组件,用于处理Java对象和数据库中的数据类型之间的转换。在MyBatis中,每个Java类型都需要对...

2023-09-06 15:42:08 88

原创 如何分析识别文章/内容中高频词和关键词?

theme: orange 要分析一篇文章的高频词和关键词,可以使用 Python 中的 nltk 库和 collections 库或者jieba库来实现,本篇文章介绍基于两种库分别实现分析内容中的高频词和关键词。nltk 和 collections 库首先,需要安装 nltk 库和 collections 库。可以使用以下命令来安装:shellpip install ...

2023-09-01 17:00:19 1217

原创 一文搞懂生成式AI(一)

theme: orange 生成式AI模型可以进行对话、回答问题、写故事、生成源代码以及创建几乎任何描述的图像和视频。下面将介绍生成式AI的工作原理,它的应用以及为什么它的能力比你想象的要有限,本文将向您介绍生成式AI及其在流行模型(如ChatGPT和DALL-E)中的应用,最后我们还将探讨这项技术的局限性。前言生成式AI是一种人工智能,它根据从现有内容中学到的模式创建新的内...

2023-09-01 09:58:49 538

原创 【LLM】快速开始 LangChain

theme: orange LangChain是一个软件开发工具包,它通过将组件链接在一起并公开简单统一的API,简化了大型语言模型和应用程序的集成。本篇文章将会简要介绍,让各位开发者对其有一个整体的认识。前言如果你是一名软件开发人员,努力跟上有关大型语言模型的最新热点,你可能会感到不知所措或困惑,就像我一样。似乎每天我们都会看到一个新的开源模型的发布,或者一个商业模型提供商...

2023-08-31 21:00:08 211

原创 【提示工程】询问GPT返回Json结构数据

theme: orange 众所周知,我们可以通过构建的Prompt获取期望的内容,但是通常都是以自然语言返回的,假如我们想得到结构化的数据,比如Json,XML那么怎么办,这篇文章给你一个思路。理所当然的想法要实现询问大模型后返回结构化的数据,首先能想到的是可以通过在提示末尾添加以 JSON 格式提供您的响应来进行一些“提示工程”,从而获得字符串化的 JSON。问题是这些响...

2023-08-31 20:35:17 1986

原创 2023 混合云产业全景图

7月25-26日,由中国信息通信研究院、中国通信标准化协会联合主办的第十届可信云大会在京顺利召开。大会重磅发布了云计算白皮书(2023年)、《混合云产业全景图(2023)》、中国算力服务研究报告、中国云计算发展指数报告等研究成果,公布了最新一批可信云评估结果及最佳实践案例。7月25-26日,由中国信息通信研究院、中国通信标准化协会联合主办的第十届可信云大会在京顺利召开。大会重磅发布了云...

2023-07-28 18:34:57 175

原创 指南 | OpenAI API对PDF进行总结提炼

前言本文将针对信息过载阅读搜索难的问题,展示如何利用OpenAI API高效地自动总结PDF,从而提高阅读效率和节省时间。包含详尽的操作教程、实际案例及最佳实践,旨在确保准确且高效地进行文档摘要。另外,本文还将深入探讨运用AI技术进行PDF总结的优势,如提高生产力、节省时间等,同时分析了在实际应用中可能遇到的局限性和挑战。通过本文,可帮助您简化阅读过程,提高处理大量信息的能力,从而提升...

2023-06-15 10:17:42 3198

原创 OpenAI API升级:新GPT-3.5 Turbo和GPT-4助力AIGC应用大放异彩

theme: orange前言北京时间2023年6月13日,OpenAI宣布对其领先的生成型AI模型GPT-3.5 Turbo和GPT-4进行一系列更新,以提高工作场所的人工智能能力。这些改进包括引入全新的函数调用功能、增强的可引导性、GPT-3.5 Turbo的扩展上下文,以及修订的定价结构。这些更新旨在为开发人员提供一个丰富的工具箱,以创建复杂、高性能的AI应用程序,满足现代工作环...

2023-06-14 16:59:27 1599

原创 探索人工智能新纪元:Pre-Training 快速指南,轻松上手

theme: orange 预训练 Pre-Training 已被证明是当前人工智能范式中最重要的方面之一,大型语言模型,要转变为通用引擎,需要预训练。什么是预训练模型人工智能中的预训练至少部分受到人类学习方式的启发。我们不需要从零开始学习一个主题,而是将现有知识转移和重新用途,以理解新想法和应对不同任务。 在AI模型中,类似的过程也在发生。首先在某个任务或数据集上训练...

2023-05-10 23:33:45 692

原创 你不知道的Redis Search 以及安装指南

theme: orange本文正在参加「金石计划」 这篇文章是为了使用Redis Search 的向量搜索功能提前做的环境准备工作。即讨论如何在准备生产的 linux 环境中安装 RediSearch 和 RedisJSON 模块。什么是RediSearch?根据RediSearch的官方文档 RediSearch是这样描述的。RediSearch为Redis提供二...

2023-04-20 18:21:40 2027

原创 OpenAI Embedding:快速实现聊天机器人(四)

theme: orange本文正在参加「金石计划」 接上文OpenAI Embedding:快速实现聊天机器人(三)如何使用Python实现embedding相似度搜索,这篇文章继续讲如何将搜索到的相似文本进行提炼,并最终得出问题的答案。提炼文本通过调用azure openai服务使用模型 text-davinci-003完成对文本的提炼,以得到最终的答案。pytho...

2023-04-19 09:18:12 1172

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除