LLM & AIGC
文章平均质量分 88
大模型、多模态、AIGC 工具分享
伊织Scope
写代码,发现、记录、整理,是职业也是爱好。
展开
-
EHRs - 电子健康记录
EHR的一个关键特征是,健康信息可以由授权的提供者以数字格式创建和管理,该数字格式能够与多个医疗保健组织的其他提供者共享。EHR旨在与其他医疗保健提供者和组织共享信息,如实验室、专家、医学成像设施、药房、急救设施、学校和工作场所诊所,因此它们包含所有参与患者护理的临床医生的信息。虽然EHR确实包含患者的病史和治疗史,但EHR系统的构建超越了提供者办公室收集的标准临床数据,可以涵盖患者护理的更广泛视角。有了EHR,您的组织可以帮助我们的国家建设一个更健康的未来。原创 2024-04-30 20:40:02 · 165 阅读 · 0 评论 -
开源医疗大模型排行榜: 健康领域大模型基准测试
开源医疗大模型排行榜: 健康领域大模型基准测试一、引言二、数据集、任务和评估设置1、MedQA2、MedMCQA3、PubMedQA4、MMLU 子集 (医学和生物学)三、洞察与分析四、提交你的模型以供评估五、下一步是什么?扩展开源医疗大模型排行榜六、致谢七、关于开放生命科学 AI八、引用原创 2024-04-30 20:30:03 · 617 阅读 · 0 评论 -
RAG & SFT
2024-04-30(二)原创 2024-04-30 16:39:26 · 34 阅读 · 0 评论 -
MinIO
MinIO有能力在任何地方部署 - 公有云或私有云,裸金属基础设施,编排环境,以及边缘基础设施。部署和注册的商业许可证的用户,可以免除AGPL v3.0许可限制,还可以购买技术服务和获取商业授权获得7 x 24小时的商业服务,在中国您可以拔打4008-566-339与我们联系。的文件是公开的,您需要注意在演示和测试期间不要上传重要文件和隐私文件,因为其他人可以访问并且我们会定期删除测试数据。要了解更多如何连接到。运行了MinIO集群的测试服务器. 任何上传到。每个产品的官网都挺有意思的,以后在这里记录下。原创 2024-04-30 10:57:28 · 189 阅读 · 0 评论 -
评估LLM
一、LLM 基准测试LLM 排行榜二、评估指标1、传统指标2、非传统指标2.1 基于嵌入的方法2.2 其他基于语言模型的指标2.3 LLM 辅助方法GPTScoreG-Eval3、可能的陷阱三、评估基于LLM的应用1、选择评估指标2、评估 评估方法3、构建您的评估集四、工具1、OpenAI 评估2、Ragas五、挑战六、结论原创 2024-04-29 11:04:43 · 594 阅读 · 0 评论 -
TruLens
一、关于 TruLensHow it works二、安装三、快速使用Get DataInCreate Vector StoreBuild RAG from scratchSet up feedback functions.Construct the appRun the app原创 2024-04-28 21:11:10 · 926 阅读 · 0 评论 -
RAGFlow
RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。上面这个例子中,您只需输入 http://IP_OF_YOUR_MACHINE 即可:未改动过配置则无需输入端口(默认的 HTTP 服务端口 80)。5、在你的浏览器中输入你的服务器对应的 IP 地址并登录 RAGFlow。你的改动会在下次系统重启时被重置。栏填写和你选择的大模型相对应的 API key。文件当中列出来的环境变量的值与。原创 2024-04-30 23:15:00 · 471 阅读 · 0 评论 -
Ragas
一、关于 Ragas二、安装🛡️三、快速使用 🔥Open Analytics 🔍四、References五、生成综合测试集文档数据生成六、使用您的测试集进行评估数据Metrics 指标评估七、监控生产中的 RAG需要监控的方面原创 2024-04-28 20:18:01 · 565 阅读 · 0 评论 -
LlamaIndex 的过去、现在和未来
这就是为什么我非常兴奋地与 Jerry 交谈,我们一起讨论了该项目是如何开始的、框架背后的核心概念、帮助你理解法学硕士并用你自己的数据增强它们的心智模型、团队的愿景了解该项目以及您如何帮助并加入该运动!随着越来越多的人感兴趣,该项目不断发展,现在 LlamaIndex 提供了各种围绕数据注入、索引和查询的工具,以及用于评估、输出解析和令牌使用优化的支持模块。这就是 LlamaIndex 的检索和综合框架的泛化发挥作用的地方,其中包括顶级语义搜索的想法只是一个例子。原创 2024-04-28 19:39:04 · 612 阅读 · 0 评论 -
RAG Survey
摘要一、INTRODUCTION二、RAG概述A. Naive RAGB. Advanced RAGC. Modular RAGD. RAG与微调三、 检索A. 检索来源1) 数据结构2) 检索粒度B. 索引优化C. 查询优化D.嵌入E. Adapter四、 生成A. 语境控制B. LLM微调五、RAG 增强过程A. 迭代检索B. 递归检索C. 自适应检索VI、 任务与评估A. 下游任务B. 评估目标C. 评估方面D. 评估基准和工具七、讨论与未来展望原创 2024-04-28 16:21:47 · 1069 阅读 · 0 评论 -
使用 torchtune 微调 Llama3
由于我们的默认配置启用完整的 bfloat16 训练,因此上述所有命令都可以在具有至少 24 GB VRAM 的设备上运行,事实上,QLoRA recipe的峰值分配内存应低于 10 GB。对于 LoRA 微调,最终检查点将包含合并的权重,并且将单独保存(小得多的)LoRA 权重的副本。此任务衡量模型在回答问题时的真实倾向,并衡量模型在一个或多个真实响应和一个或多个错误响应后的问题上的零样本准确性。让我们采用上一节中的 LoRA 微调模型,看看我们可以评估其在我们关心的任务上的性能的几种不同方法。原创 2024-04-24 11:03:24 · 971 阅读 · 0 评论 -
Mamba - 可替代 Conda 的 Python 包管理工具
一、关于 Mamba二、安装 Mamba1、全新安装(推荐)(Miniforge2、现有`conda`安装(不推荐)3、Docker 镜像4、Conda libmamba 求解器三、安装 Micromamba1、使用操作系统包管理器Homebrew2、从 Mamba-org releases 安装1)自动安装(推荐)2)自我更新3)手动安装Linux 和 macOSWindows3、Nightly builds4、Docker 镜像5、从源代码构建6、Shell 补全原创 2024-04-29 08:15:00 · 522 阅读 · 0 评论 -
torchtune
一、关于 torchtune什么是 torchtune?关键概念 Configs、Recipes设计准则二、安装三、微调模型1、下载模型2、选择recipe3、修改配置4、训练模型原创 2024-04-24 10:11:09 · 1124 阅读 · 0 评论 -
Spring AI
Spring AI关于 Spring AI使用Spring CLISpring Initializr添加 Milestone 和 Snapshot Repositories依赖管理为特定组件添加依赖项Embeddings ModelsChat ModelsImage Generation ModelsVector Databases示例工程原创 2024-04-23 11:56:25 · 987 阅读 · 0 评论 -
Haystack
关于 Haystack提供 NLP项目所有阶段的功能Building blocks组件 Components管道 Pipelines代理 Agents基本使用 - RAG原创 2024-04-26 12:45:00 · 890 阅读 · 0 评论 -
Feature Store - 小记
原始数据的访问,构建特征,组合特征到训练数据,生产中计算、提供和监控特征。2023-11-29(三)原创 2023-11-29 12:30:21 · 256 阅读 · 0 评论 -
Llama3
关于 Llama3下载方式一:网站申请许可方式二:通过 Hugging Face快速开始推理预训练模型指令调整模型其他问题型号卡License问题原创 2024-04-19 11:12:07 · 1127 阅读 · 2 评论 -
Meta Llama 3 简介
要点我们对 Llama 3 的目标最先进的性能模型架构训练数据扩大预训练规模指令微调与 Llama 3 一起建造系统级责任方法大规模部署 Llama 3Llama 3 的下一步是什么?立即尝试 Meta Llama 3原创 2024-04-19 11:08:50 · 1473 阅读 · 0 评论 -
DuckDB - 小记
关于 DuckDB特点使用场景DuckDB与SQLite对比SQL 示例LangChain + DuckDB原创 2024-04-20 16:15:00 · 908 阅读 · 0 评论 -
LlamaIndex 组件 - Evaluating
一、Evaluating 概览概念Response 评估问题生成Retrieval Evaluation集成使用模式二、使用模式(反应评估)1、使用`BaseEvaluator`2、使用`EvaluationResult`3、评估响应的可信度(即幻觉)4、评估查询 + 响应相关性5、问题生成6、批量评估7、集成深度评估 (使用DeepEval)三、使用模式(检索)1、使用`RetrieverEvaluator`2、构建评估数据集将其插入`RetrieverEvaluat原创 2024-04-18 10:15:00 · 706 阅读 · 0 评论 -
LlamaIndex 组件 - Querying
一、查询概览查询管道二、Retriver1、概念2、使用模式3、开始使用4、高级API4.1 选择Retriver4.2 配置检索器5、低级组合 API三、检索器模块1、索引检索器2、综合Retriver指南2.1 高级检索和搜索2.2 自动检索2.3 知识图检索器2.4 组合Retriver2.5 托管Retriver2.6 其他Retriver四、Retriver模式1、矢量索引2、概要索引3、树索引4、关键字表索引5、知识图谱索引6、文件摘要索引五原创 2024-04-17 10:15:00 · 2144 阅读 · 0 评论 -
LlamaIndex 组件 - Storing
一、储存概览1、概念2、使用模式3、模块二、Vector Stores1、简单向量存储2、矢量存储选项和功能支持3、Example Notebooks三、文件存储1、简单文档存储2、MongoDB 文档存储3、Redis 文档存储4、Firestore 文档存储四、索引存储1、简单索引存储2、MongoDB 索引存储3、Redis索引存储五、Chat Stores1、简单聊天商店2、Redis聊天商店六、键值存储七、保存和加载数据1、持久化数据2、加载数据中3原创 2024-04-17 16:15:00 · 847 阅读 · 0 评论 -
LlamaIndex 组件 - Indexing
一、索引概览概念二、每个指数如何运作1、摘要索引(以前称为列表索引)查询2、向量存储索引查询3、树索引查询4、关键字表索引查询三、使用VectorStoreIndex1、将数据加载到索引中1.1 基本用法1.2 使用摄取管道创建节点1.3 直接创建和管理节点处理文档更新2、存储向量索引3、可组合检索四、文件管理1、插入2、删除3、更新4、刷新5、文件追踪五、LlamaCloudIndex + LlamaCloudRetriever1、使用权2、设置3、原创 2024-04-16 17:00:00 · 1322 阅读 · 0 评论 -
LlamaIndex 组件 - Loading
一、概览加载Transformations将所有内容放在一起抽象二、文档/节点概览1、概念2、使用模式文件节点三、定义和定制文档1、定义文档2、自定义文档2.1 元数据2.2 自定义id2.3 高级 - 元数据定制1)自定义LLM元数据文本2)自定义嵌入元数据文本3)自定义元数据格式2.4 概括2.5 高级 - 自动元数据提取四、使用节点自定义ID五、元数据提取使用模式资源六、简单目录阅读器1、支持的文件类型2、用法2.1 从子目录读取2.2 加载文原创 2024-04-16 17:15:00 · 727 阅读 · 0 评论 -
LlamaIndex 组件 - Prompts
一、关于 Prompts1、概念2、使用模式概览3、示例指南二、使用模式1、定义自定义提示2、获取和设置自定义提示2.1 常用提示2.2 访问提示2.3 更新提示2.4 修改查询引擎中使用的提示2.5 修改索引构建中使用的提示3、[高级]高级提示功能3.1 部分格式化3.2 模板变量映射3.3 函数映射原创 2024-04-15 15:11:38 · 947 阅读 · 0 评论 -
LlamaIndex 组件 - Models
一、使用LLM1、概念2、使用模式3、关于tokenize 的注释4、LLM 兼容性跟踪4.1 付费 LLM API4.2 开源LLM5、模块二、使用LLM 作为独立模块1、文本完成示例2、聊天示例三、在 LlamaIndex Abstractions 中自定义 LLM1、示例:更改基础 LLM2、示例:更改输出token的数量(对于 OpenAI、Cohere、AI21)3、示例:显式配置`context_window`和`num_output`4、示例:使用 Huggin原创 2024-04-15 14:45:45 · 873 阅读 · 0 评论 -
LlamaIndex 文档3
一、使用 LLamaIndex 构建全栈 Web 应用程序的指南1、Flask 后端基本 Flask - 处理用户索引查询Advanced Flask - 处理用户文档上传2、React 前端获取文档.tsx查询索引.tsx插入文档.tsx所有其他前端优点3、结论二、使用 Delphic 构建全栈 LlamaIndex Web 应用程序的指南1、我们正在建设什么2、架构概览3、系统要求4、Django 后端4.1 项目目录概述4.2 数据库模型4.3 Django 忍者原创 2024-04-15 11:28:58 · 877 阅读 · 0 评论 -
LlamaIndex 文档 2
一、构建 LLM 应用构建LLM 应用的关键步骤二、使用LLM可用的LLM使用本地LLMPrompts三、加载数据(提取)Loaders1、使用 SimpleDirectoryReader 加载2、使用 LlamaHub 的 Readers3、直接创建文档转换 Transformations1、高级转换 API2、较低级别的转换 API将文档拆分为节点3、添加元数据4、添加嵌入5、直接创建并传递节点四、LlamaHub使用模式内置连接器:SimpleDirector原创 2024-04-15 11:12:05 · 1043 阅读 · 0 评论 -
LlamaIndex 文档1
关于 LlamaIndex🚀 为什么要进行上下文增强?🦙 为什么使用 LlamaIndex 进行上下文增强?👨👩👧👦 LlamaIndex 适合谁?入门🗺️生态系统社区相关项目高级概念检索增强生成 (RAG)RAG 中的阶段每个步骤中的重要概念装载阶段索引阶段查询阶段把它们放在一起安装和设置从 Pip 快速开始安装重要提示:OpenAI 环境设置从 Pip 进行自定义安装从源安装如何阅读这些文档在你开始之前这些文档的结构入门教程 (OpenAI)下载原创 2024-04-14 12:15:03 · 369 阅读 · 0 评论 -
Chroma
关于 Chroma安装基本使用服务1、启动/连接服务2、使用 python http-only client创建 client心跳 heartbeat重置 resetCollections 使用详解创建 Collections改变距离函数将数据添加到 集合查询集合选择返回的数据使用Where过滤器按元数据过滤按文档内容过滤使用逻辑运算符使用包含运算符 (`$in`和 `$nin`)更新集合数据从集合删除数据Authentication基本Authenticat原创 2024-04-12 21:19:19 · 1034 阅读 · 0 评论 -
MindSQL
关于 MindSQL安装代码调用📁 项目代码结构其它原创 2024-04-11 17:14:58 · 642 阅读 · 0 评论 -
BabyAGI
关于 BabyAGI使用说明使用步骤Docker 容器中使用支持的模型Llama警告原创 2024-04-11 14:22:54 · 715 阅读 · 0 评论 -
LangGraph
关于 LangGraph安装快速使用与LCEL 交互条件边Cycles设置工具设置模型定义代理状态定义节点定义图表使用流媒体流式节点输出流式 LLM Tokens何时使用操作指南异步流式 Tokens持久化人机交互可视化图表“时间旅行”示例ChatAgentExecutor:带函数调用代理执行者规划代理示例反思/自我批评多代理示例网络研究通过模拟评估 Chatbot多模式示例表链文档状态图`__init__``.add_node``.原创 2024-04-05 15:45:00 · 1004 阅读 · 0 评论 -
Lepton AI - Elmo 小记
Elmo 是一个基于人工智能技术的辅助工具,可以实时、自动地识别和总结用户正在访问的网页内容,不仅支持与 PDF 对话、与 YouTube 视频交互等功能,还提供翻译、搜索引擎、笔记本等多项功能,帮助用户更高效地利用互联网资源。而 LeptonAI 云平台提供了CPU、GPU和存储资源,开发者可以把创建的AI模型部署到这里,就能提供公开对外的AI服务。Elmo 由 Lepton AI 公司发布,Lepton AI 由贾扬清创建,目标是简化 AI 模型的部署。2024-04-10(三)原创 2024-04-10 18:05:54 · 462 阅读 · 0 评论 -
Unstructured - 提取非结构化数据
模块化功能 和 连接器形成一个内聚系统,简化了数据提取和预处理,使其能够适应不同的平台,并有效地将非结构化数据转换为结构化输出。每个连接器都是针对特定平台(例如 Azure、Google Drive 或 Github)量身定制的,并附带独特的命令和依赖项。如果您只计划解析一种类型的数据,您可以通过注释掉其他数据类型所需的一些包/要求来加快构建映像的速度。我们正在发布 Chipper 模型的测试版,以在处理高分辨率、复杂文档时提供卓越的性能。应下载适合您的架构的相应映像,但如果需要,您可以使用。原创 2024-04-10 15:47:20 · 668 阅读 · 0 评论 -
LangChain - 回调函数
LangChain - 回调函数回调函数概览回调处理程序基本使用 StdOutCallbackHandler在哪里传递回调在什么情况下使用这些选项?异步回调 (AsyncCallbackHandler自定义回调处理程序自定义链的回调函数将日志记录到文件多个回调处理程序标签 tagsToken counting跟踪集成原创 2024-04-10 13:59:23 · 293 阅读 · 0 评论 -
LangChain - Agents
LangChain - Agents一、概览1、关于代理2、工具 tool3、工具包 toolkits4、代理执行器5、其他类型的代理运行时6、基本使用二、代理类型 agent_types1、行动代理1.1 zero-shot ReAct1.2 结构化输入 ReAct1.3 OpenAI 函数1.4 对话型1.5 带搜索的自问自答1.6 ReAct 文档存储2、计划和执行代理会话(Conversational)使用聊天模型OpenAI Functions Agent原创 2024-04-10 11:32:16 · 794 阅读 · 0 评论 -
LangChain - Memory
一、内存记忆 ( Memory )入门聊天消息历史 (ChatMessageHistory)ConversationBufferMemoryUsing in a chain保存消息历史二、如何为 LLMChain 添加记忆三、对多输入 Chain 添加记忆四、向代理添加记忆五、向代理添加由数据库支持的消息记忆六、会话缓存内存 ConversationBufferMemory在链中使用七、会话缓冲窗口记忆 ( Conversation buffer window memory )在链原创 2024-04-09 18:40:22 · 902 阅读 · 0 评论 -
LangChain - Chain
1、概览为什么我们需要链?2、快速入门 (Get started) - Using `LLMChain`多个变量 使用字典输入在 `LLMChain` 中使用聊天模型:3、异步 API4、不同的调用方法`__call__`调用仅返回输出键值 return_only_outputs只有一个输出键 run只有一个输入键5、自定义chain6、调试链 (Debugging chains)7、从 LangChainHub 加载8、添加记忆(state)9、序列化将chain 保存到原创 2024-04-09 17:37:51 · 771 阅读 · 0 评论 -
LangChain - 向量存储
一、基本操作 (FAISSSimilarity search通过向量进行相似性搜索 (Similarity search by vector)二、异步操作 (Qdrant异步创建向量存储相似度搜索通过向量进行相似度搜索三、最大边际相关搜索 (MMR)四、集成原创 2024-04-08 18:06:39 · 897 阅读 · 0 评论