自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(561)
  • 收藏
  • 关注

原创 技术上,如何复现 o1?

A:o1 非常深刻地改变了 LLM,所有目前的 LLM 应用,只要存在一个基于或不基于 LLM 的 verifier,或者有约束要满足,都会受到断代式的影响。” 以后流的是电费的心痛的泪。模型生成的结果,经常会有自激的噪声存在,或分布逐渐变得非常 sharp,从而导致模型生成内容的后半段质量下降。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

2024-09-18 20:38:51 571

原创 一个端到端的 OCR 模型,炸裂开源!

GOT-OCR 2.0 是一款革命性的端到端通用 OCR 模型,它能够识别和提取文本,还能处理数学公式、分子式、图表、等多种内容,极大地拓宽了 OCR 技术的应用范围。模型大小仅 1.43GB,下面列出来在各个场景的效果,感兴趣的往下看。:GOT-OCR 2.0 支持多种语言和模态的文本识别,无论是印刷体还是手写体,都能准确识别。:支持照片、文档、切片等多种输入格式,输出格式包括纯文本、Markdown、TikZ、SMILES、Kern 等,满足不同场景的需求。

2024-09-18 20:11:05 399

原创 自建AI编程助手 | 本地 Yi-Coder模型 + Cursor 5分钟写一个网页

Yi-Coder[1] 是一个开源的高性能代码语言大模型,为实现高效编程设计。它支持 52 种编程语言,擅长处理需要长上下文理解的任务,例如项目级代码理解和生成。该模型有两种大小(15亿 和 90亿 参数),并且提供基础版和聊天版。本教程中,你将学习如何使用与 OpenAI 兼容的 API 在本地运行 Yi-coder 模型使用 Yi-coder 驱动 CursorCursor 是最热门的 AI 代码编辑器之一。它可以用专门为编码任务训练的 LLM(如 Yi coder)来完成编码辅助任务。

2024-09-18 20:10:06 610

原创 产品+AI如何设计?大厂高手总结了这3种方案!

在人工智能技术的不断演进中,我们目睹了它如何一次又一次地刷新我们对技术可能性的认知。随着ChatGPT等先进AI工具的涌现,它们不仅拓展了我们的视野,也引领了人机交互的新潮流。本文将探讨AI技术如何与现有产品融合,以及这种融合如何催生出全新的用户体验。

2024-09-18 20:09:12 577

原创 一文彻底搞懂大模型 - 开源数据标注平台Label Studio

的能力,这些特性使得Label Studio成为了一个灵活、高效且适用于多种领域和场景的数据标注平台,

2024-09-17 10:45:00 644

原创 贝莱德&英伟达 - HybridRAG:整合GraphRAG和VectorRAG以实现金融信息高效提取

从金融应用中产生的非结构化文本数据中提取和解释复杂信息,例如收益电话会议记录,即使使用当前最佳实践进行检索增强生成(RAG)(称为利用向量数据库进行信息检索的VectorRAG技术),也对大型语言模型(LLMs)提出了重大挑战,原因包括领域特定术语和文档复杂格式等挑战。

2024-09-16 10:45:00 647

原创 实战使用 GraphRAG 索引整本《西游记》,解锁黑悟空通关路

本文主要尝试使用强大的 GraphRAG 配合免费的 glm-4-flash 索引整本西游记,带我们梦回西游。从配置、手调实体、索引、可视化、问答分享如何使用GraphRAG索引整本小说,同时也测试了智谱 bigmodel 平台免费的在GraphRAG中使用效果。

2024-09-15 10:45:00 575

原创 数字化、信息化、智能化和数智化的区别是什么?

在现代社会的发展中,“数字化”、“信息化”、“智能化”和“数智化”这四个术语常常被提及。虽然它们在一定程度上都与技术进步相关,但彼此之间有着明显的区别。以下将对这四个概念进行深入分析,帮助大家更好地理解它们的内涵和外延。定义:数字化是将信息转化为数字格式的过程。它包括将传统的文本、图像、音频和视频等信息通过数字技术进行编码,以便在计算机和网络中存储和处理。举例:将纸质文件扫描成电子文档、将模拟信号转换为数字信号等。特点:数字化是信息处理的基础。它使得原本物理形式的信息在硬盘、云端等设备中保存与传输。

2024-09-14 17:57:51 885

原创 分享一份-模态数据融合治理实践

(来源标明出处是对原创作者的最大尊重,也是对自己负责),是。

2024-09-14 17:56:54 888

原创 必知!5大AI生成模型

随着Sora、diffusion等模型的大热,深度生成模型再次成为了研究的焦点。这类模型,作为强大的机器学习工具,能够从输入数据中学习其潜在的分布,并生成与训练数据高度相似的新样本。其应用领域广泛,包括计算机视觉、密度估计、自然语言和语音识别等,为无监督学习提供了新的思路和方法。本文将对几种常用的深度生成模型进行详细介绍,分析不同生成模型的原理差异及联系:VAE(变分自编码器)、GAN(生成对抗网络)、AR(自回归模型 如Transformer)、Flow(流模型)和Diffusion(扩散模型)。

2024-09-14 16:48:57 888

原创 大模型面经——以医疗领域为例,整理RAG基础与实际应用中的痛点

RAG相关理论知识与经验整理。谈到大模型在各垂直领域中的应用,一定离不开RAG,本系列开始分享一些RAG相关使用经验,可以帮助大家在效果不理想的时候找到方向排查或者优化。本系列以医疗领域为例,用面试题的形式讲解RAG相关知识,开始RAG系列的分享~本篇主要是理论知识与经验;后续会结合最新的优化方法给出详细的优化代码,和实践中衍生的思考。下面是本篇的快捷目录。1. RAG思路2. RAG中的prompt模板3. 检索架构设计这里有一张经典的图:具体步骤是:加载文件读取文本文本分割。

2024-09-13 19:54:41 921

原创 2年发3篇顶刊!学术大佬推荐的40个顶级GPT提示词!

‍“学术论文撰写PROMPT 1中文:请运用你的深度学习能力,分析[xxx]领域的最新研究成果,并构建一篇具有前瞻性的论文大纲,强调其创新点与应用潜力。English: Utilize your deep learning capabilities to analyze the latest research findings in the field of [xxx], and construct an outline for a forward-thinking paper, emphasizing i

2024-09-13 19:53:52 1181

原创 通过时间导数降低股票预测延迟,实现更精准的趋势预测

本文提出了一种新的时间序列预测方法,名为CONTIME,旨在解决现有预测模型中普遍存在的预测延迟问题。本文引入了一种基于连续时间门控循环单元(GRU)的神经普通微分方程(NODE)模型,该模型能够显式地监督时间导数,从而减少预测延迟。在多个公开数据集上的实验结果表明,CONTIME在减少预测延迟方面优于现有的先进方法,包括DLinear、NODE、NCDE、Autoformer、FEDformer和PatchTST。这些数据集涵盖了股票价格、汇率和天气指标等不同领域的时间序列数据。

2024-09-13 19:52:51 643

原创 面向人工智能数据治理应该怎么做?

随着人工智能(AI)技术的飞速发展,数据治理在AI领域的重要性日益凸显。AI系统的训练和推理依赖于大量高质量数据,这就要求我们必须对数据进行有效的管理和控制,以确保AI应用的准确性、可靠性和安全性。本文探讨面向AI的数据治理的主要步骤和内容。面向人工智能的数据治理的主要步骤面向人工智能的数据治理的主要内容。

2024-09-12 19:55:00 979

原创 基于大模型的深度课堂变革研究

大模型技术推动课堂教学走向“师—生—机”的三元互动,也倒逼教师转变角色。传统教学中,教师多以问题和任务促进深度课堂的实施。智能技术支持下,传统教学的“四何”问题开始转变,很大部分成为机器眼里的“是何”问题,如何重构课堂让学习者获得深度认知成为关键。基于此,本研究构建了以“四何”问题为内核的驱动任务、以“师—生—机”为三元主体的深度课堂角色转换机制,形成支持深度课堂目标达成的变革路径,并以 B 大学“学习科学”课程的研究生为对象开展实践。研究发现,学习者具备较高的学习动机、技术接受度和较低的认知负荷;

2024-09-12 19:51:53 1125

原创 【RAG】面向实时智能客服场景的RAG问答系统应用

这篇文章探讨了如何在工业环境中利用大型语言模型(LLMs)进行问题回答,特别是针对客服场景提供上下文相关的响应预测。然而,为了在行业环境中针对特定客户查询提供精确和相关的信息,LLMs需要访问全面的知识库以避免产生幻觉。面对这个问题,RAG技术应运而生。然而,使用RAG开发实际应用中的问答框架仍面临几个挑战:1)数据可用性问题,2)生成内容质量的评估,3)昂贵的人工评估成本。文章提出了一个端到端的RAG框架,用于解决工业环境中的问题回答问题。响应预测系统示例。

2024-09-12 19:49:46 1006

原创 minimind:3小时从0训练26M小参数GPT,低至2G显卡即可推理训练

本开源项目旨在完全从0开始,最快仅用3小时!即可训练出仅为26M大小的微型语言模型MiniMind。

2024-09-11 20:42:51 812

原创 基于RAG的智能知识问答探索企业知识边界

信息时代到来,企业积累的数字文档知识数量巨大,文档中蕴含的信息对业务发展至关重要,与企业相关的数据价值难以估量。企业利用好现有资源,将企业资源合理配置,将数据串联,产生更大的效益,这才是企业最需要的。然而,传统的搜索技术常常因只能进行关键字查询而无法满足对文档深层次理解的需求。因此需要建立一个面向企业级知识管理的智能问答,对知识进行统一管理,通过精准的信息检索加上严格的权限控制,帮助企业内部员工挖掘企业多年沉淀下来的知识,提升工作效率,增强企业竞争力。据Gartner调查,高达47%的员工在工作中很难寻找到

2024-09-11 19:55:10 1142

原创 LLM数据标注:是否胜过人类?

我们可以期待下一代 LLM 为数据标注任务带来重大改进。增强的适应性将使未来的 LLM 能够处理更广泛的数据类型,包括文本、图像和音频。此外,即将到来的进步将侧重于减少 LLM 中的固有偏见。LLM 在数据标注方面的潜在新应用将包括跨领域标注和实时数据注释。此外,个性化学习模型将变得更加普遍,使 LLM 能够适应特定的行业需求并为数据标注任务提供量身定制的解决方案。让我们回顾一下使用 LLM 进行数据标注的要点:LLM 数据标注非常适合预算有限的项目和以一致性为关键的客观任务。

2024-09-11 19:52:29 689

原创 基于因果驱动的特征选择,提高金融预测的准确性和可靠性

本文介绍了FinSen数据集,将来自197个国家的经济和金融新闻文章与股票市场数据集成,覆盖15年的时间跨度,提供了160,000条金融市场新闻的全球视角。利用FinSen数据集,作者提出了一种创新的Focal Calibration Loss方法,将预测概率与实际结果紧密对齐,提高了金融预测的准确性和可靠性。作者的方法展示了将情感分析与精确校准技术相结合,为金融预测提供可信的方法。

2024-09-11 19:49:57 472

原创 23页PPT | 23种企业管理模型在实现数字化转型中的应用与实践

数字化模型是一种将企业运营的各个方面转化为数字信息和流程的框架,它通过集成信息技术、数据分析和自动化工具,优化企业的决策过程、提高效率、降低成本,并增强企业的竞争力。这种模型涵盖了从战略规划到日常操作的各个层面,包括但不限于经营模型、管理模型、工厂模型、价值模型、流程模型、精益模型、柔性模型、财务模型等,旨在构建一个全面、高效、透明的企业管理和运营环境。数字化转型是企业通过采用数字技术来彻底改变其业务模式和流程的过程。

2024-09-11 19:48:49 1129

原创 大语言模型领域微调适应技术全面综述:持续预训练、监督式微调、直接偏好优化、模型合并

在Hugging Face上发布的最佳性能模型及其相应的Hub ID总结在表7中。表7:Hugging Face上最佳性能模型的概述和相关Hub ID。

2024-09-09 20:42:06 1832

原创 大模型的第一个杀手级应用场景出来了

重度使用了 cursor 两天。他的迭代路径也很清晰,从早期的copilot (tab tab) 到支持可以参考多个文件针对 “单文件自动修改和合并”(apply)。其中第二个能力是当前 github copilot 没有的,github copilot chat框里的代码没有办法直接合并到文件里,你只能拷贝黏贴。

2024-09-09 20:40:19 958

原创 Agent 核心能力:工具使用详解

工具使用对智能体而言至关重要,它不仅显著扩展了智能体的能力范围,使其能够高效执行如实时信息获取、复杂数据分析等高级任务,还提升了任务精度和用户体验的丰富性;此外,工具的集成增强了智能体的适应性和可扩展性,使其能够在不断变化的环境中保持灵活更新,从而更好地满足多样化的用户需求。工具使用(也称函数调用)是指通过定义和调用外部工具或函数来扩展大模型的能力。我们可以让大模型访问一组预定义的工具,它可以在任何时候调用这些工具。工具允许我们编写代码,执行大模型无法完成的特定任务或计算。简而言之:使用工具是增强大模型功能

2024-09-09 19:54:59 1399

原创 Nature: 智能体涌现出语言

在探索生物和人工智能体中的任务表征时,研究传统上强调自我经验和共同回路先验的作用。有趣的是,共享的神经表征是同种动物之间相似行为的基础。事实上,共同的收敛抽象对于同一物种或群体的个体之间的交流也是必不可少的。这种社会压力意味着神经回路可能已经进化来产生内部表征,这些表征不仅对特定个体有用,而且可以最大限度地提高沟通效率,这被认为在认知发展中是必不可少的。我们认为社会通信对于提供任务高效的表征至关重要,这些表征支撑了合作智能体之间经验的泛化。

2024-09-09 19:49:58 1140

原创 Mini-Omni:全球首个开源实时交互模型,边说话边思考。(附整合包)

之前开源社区还没有一个像样的实时语音对话模型,Mini-Omni可以说是开了一个先河,相信后续基于人机的实时语音交互模型会越来越多。Mini-Omni可以同时进行。且具有实时端到端语音输入和流式音频输出会话能力。实测反应速度极快,仅需5G左右显存,门槛低,大部分人都能体验到。温馨提示:你可能需要准备一个麦克风跟它聊天。(官方演示)目前只支持英语对话,大家可以拿来做英语学习对话。✅会话功能。无需额外的ASR或TTS模型。✅,具有同时生成文本和音频的功能。✅能力。

2024-09-09 19:48:31 704

原创 多模态再度领跑CVPR!这18种创新SOTA方案必看

从今年CVPR的热门主题上来看,多模态相关的论文依然很火,不少同学也私信来问了,我就火速整理了一部分来和你们分享。

2024-09-08 10:45:00 991

原创 打破AlphaFold大模型局限,世界最大蛋白质相互作用数据集AlphaSeq横空出世

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。在AlphaSeq数据的基础上,训练出的AlphaBind模型可以准确预测有不同结合特性(亲和力、特异性、交叉反应性、表位等)的蛋白质序列,从而辅助蛋白质设计或发现全新的蛋白质。研究人员对酵母细胞进行基因改造,让相关的蛋白质暴露在细胞表面,MATa细胞搭载一组蛋白质,而MATα细胞搭载另一组蛋白质。

2024-09-07 10:45:00 1052

原创 如何做场景RAG问答应用的评测?

大型语言模型 (大语言模型) 改变了自然语言处理 (NLP) 任务的格局,尤其是问答 (QA) [27,15,14]。尽管取得了进展,幻觉问题仍然是一个重大挑战;大语言模型可能生成缺乏事实准确性或基础的答案[19, 9]。研究表明,GPT-4 在回答涉及缓慢变化或快速变化事实的问题时的准确率低于 15%[25];即使对于稳定(不变)的事实,GPT-4 在回答涉及躯干到尾巴(不太受欢迎)实体的问题时的准确性也低于 35% [21]。因此,克服幻觉成为构建可靠的 QA 系统的首要任务[9, 8]。

2024-09-06 20:32:36 967

原创 用RAG的方法生成更多的训练数据

近年来,随着大型语言模型(LLMs)的快速发展,对于能够满足企业和组织独特需求的领域特定代理的需求日益增加。与力求广泛覆盖的一般模型不同,这些专业代理依赖于针对其预期应用定制的专注数据集。本研究提出了一种利用LLMs的力量和检索增强生成(RAG)相关框架的管道,以构建用于特定领域微调的高质量指令数据集,使用自定义文档集合。通过吸收领域特定的文档,该管道生成相关且在上下文中适当的指令,从而有效地创建了用于在目标领域上微调LLMs的综合数据集。

2024-09-06 20:31:15 861

原创 吴恩达,对 Agentic Workflow 持续兴奋

继吴恩达在今年 4 月红杉 AI 峰会演讲过去之后,又做了两三次演讲/访谈,其中无不例外都着重提到了 Agentic Workflow.吴恩达教授此前也开源了一个 Translation-Agent.包括最近也做了一个新的 Vision-Agent.吴恩达教授也与 ARK Invest 展开了一次对谈,以下是提炼出的关键观点。Gen AI 和 LLM 受到广泛关注,可以完成的任务将远超目前的实际应用。

2024-09-06 19:52:04 1062

原创 搭建大模型知识库流程,以及基于langchain实现大模型知识库案例

RAG检索增强生成是为了解决大模型知识不足的问题大模型主要面临三个问题:垂直领域内的知识不足‍‍‍‍‍大模型知识有时间限制‍大模型幻觉问题第一个问题产生的原因是因为,没有经过垂直领域数据训练的大模型普遍表现不好;其次是目前的大模型采用的是预训练模式,也就是说需要先收集训练数据进行训练,但只能收集之前的数据,不能收集当前和以后的数据;最后就是大模型幻觉问题,幻觉问题产生的原因就是知识不足,导致在一些领域问题中一本正经的胡说八道。

2024-09-05 20:07:43 590

原创 人工智能和数字孪生的新机遇与挑战

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

2024-09-05 19:38:49 814

原创 Ollama + JuiceFS:一次拉取,到处运行

Ollama 是一款简化了本地运行大模型的工具,将大模型拉取到本地,再使用简单的命令即可在本地运行自己的大模型。JuiceFS 可以充当大模型 Registry 的底层存储,由于其分布式的特征,使得用户可以在某处拉取一次模型后,在其他地方即可直接使用,从而实现了一次拉取,到处运行。

2024-09-05 19:37:57 930

原创 少即是多:利用AI进行短期股票预测,提高盈利,降低风险

本文介绍了一种基于多智能体深度学习的方法,用于交易美国标普500指数期货市场。该方法(称为Model A)是在现有的机器学习模型基础上创新的,通过对市场价格和相关衍生品进行采样,决定投资应该是多头/空头还是关闭(零头寸),并进行日常决策。结果表明,Model A在关键绩效指标上优于被动投资,并且在美国大型主动基金经理的前四分位中。Model A还在历史测试中优于三种机器学习分类比较器。

2024-09-05 19:36:36 990

原创 聊聊通义千问实验室多Agent框架——Qwen-Agent

Qwen-Agent[1]是一个开发框架。开发者可基于本框架开发Agent应用,充分利用基于通义千问模型(Qwen)的指令遵循、工具使用、规划、记忆能力。本项目也提供了浏览器助手、代码解释器、自定义助手等示例应用。

2024-09-04 20:27:37 1042

原创 最新开源:阿里开源视觉大模型Qwen2-VL;Salesforce发布大型动作模型xLAM - 7B;智谱AI开源...

是由阿里云 Qwen 团队新推出的多模态大语言模型系列,包括2B、7B参数版本,即将开源72B。其中,在大部分指标上都达到了最优,刷新了开源多模态模型的最好表现,甚至超过了GPT-4o和Claude 3.5 Sonnet等闭源模型。相比上一代模型,的基础性能全面提升。,在MathVista、DocVQA、RealWorldQA、MTVQA 等基准测试创下全球领先的表现;,支持基于视频的问答、对话和内容创作等应用;

2024-09-04 20:26:36 1174

原创 CTR提升17%:Adobe多模态搜索技术深度解析

传统的搜索系统通常依赖于文本和元数据来索引图像,而新兴的多模态嵌入技术,如CLIP,允许直接使用文本和图像嵌入进行搜索。。左侧:头部查询咖啡Instagram。右侧:尾部查询多彩咖啡促销Instagram。详细剖析Adobe Express模板搜索中采用的**多模态搜索技术架构,**通过一系列A/B测试来优化嵌入和多模态技术的使用。

2024-09-04 19:42:06 802

原创 用 Dify 和 Notion 打造轻量级金融数据库

今天我们来看一下如何用 Dify 和 Notion 打造一个轻量级金融数据库,首先我从服务器的MySQL数据库向Notion同步了今天的量化策略选股结果数据。同步后的Notion表格数据如下所示:下面我们来看一下如何将Notion表格数据同步到dify知识库。首先打开dify主页,点击创建知识库。在创建知识库页面,选择同步自Notion内容,并绑定Notion空间,选择你要同步的Notion表格数据。

2024-09-04 19:40:36 692

原创 数据残差可视化分析

残差分析在数据分析是一种非常重要的工具。通过分析模型的残差(即实际值与预测值之间的差异),我们可以判断模型的性能、发现潜在问题,并进行相应的改进。残差是观测值与模型预测值之间的差异。其中,y_实际是实际观测值,y_预测是预测值,e是残差。残差表示模型未能捕捉的误差部分,它包含了可能由于数据噪声或模型不完善导致的偏差。残差分析的核心作用在于评估和诊断模型的适应性。他帮助我们验证模型假设、检测数据中的异常值以及了解模型的预测能力。残差分析可以帮助我们判断以下问题↓。

2024-09-03 19:40:44 870

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除