- 博客(942)
- 收藏
- 关注
原创 FinRL-DeepSeek:将DeepSeek融入强化学习提升股票组合收益
本文提出了一种结合强化学习和大型语言模型(LLM)的风险敏感交易代理。扩展了条件风险价值(Conditional Value-at-Risk Proximal)的近端策略优化(CPPO)算法,增加了由LLM生成的风险评估和交易建议信号。在纳斯达克100指数基准上进行回测,使用FNSPID数据集的金融新闻数据。应用DeepSeek V3、Qwen 2.5和Llama 3.3语言模型。
2025-02-18 14:05:35
444
原创 Qwen爆改为DeepSeek,再复现R1!
对于目前很火的Deepseek,最近有准备LLM面试的学员问需要重点掌握哪些东西,给大家的建议是这块最重要的是deepseek v3和r1的技术报告,建议大家去精读一下,其中MLA注意力,MTP,GRPO,冷启动数据,这些是重点。前言Deepseek使用更低的成本追赶OpenAI的效果关注Deepseek也有一年多了,当时Mixtral-8x7B模型刚出来,我写了一篇分析其MoE架构的文章。Deepseek不久后推出了他们第一版Deepseek MoE模型,他们的工作人员看到文章加了我的微信;
2025-02-18 11:29:33
442
原创 DeepSeek-R1 + RAG搭建本地知识库
*为确保本地知识库的高效搭建,需先准备DeepSeek-R1模型、相关文档/数据集及部署工具(如Ollama),,同时选择并配置文本嵌入模型,最后收集/整理文档并确保其唯一标识符和文本内容,************?****大型语言模型(LLMs)虽然功能强大,。********如何使用DeepSeek-R1 + RAG搭建本地知识库?******
2025-02-17 14:06:35
1268
原创 5个问题,理性看待DeepSeek带来的影响
1、为何DeepSeek如此受欢迎?除了大家所熟知的通过算法优化把训练和推理价格打下来了、开源属性、国产之光大模型、各路媒体不遗余力的宣传扩大其效应,其中还有一个更重要的原因,他发布的时间点很好。他是第一个把复现MoE、o1作为开源发出来了,胜在做的早,发布时间得当,引爆了大家的眼球。但是现阶段DeepSeek还不是最好的,受限于资源有限,只能把有限的资源放在最亮眼的地方,但后续有没有精力去做得更好未知,其未来进步空间还很大。2、为什么DeepSeek的方法没有在大厂出现?还是一个公司聚焦的问题。
2025-02-17 14:05:36
491
原创 微信接入DeepSeek-R1的功能升级现状及技术潜力
微信正在打造的智能搜索不单是功能叠加,而是重新定义获取信息和享受服务的方式。未来可能在四个方向突破:• 让微信内容自成体系更专业• 跨不同场景的无缝协同服务• 每个人的AI助理都能量身定制• 建立安全透明的使用机制通过开放开发平台引入更多创新应用,未来可能形成"微信智能操作系统",彻底改变人们使用手机的习惯。就像给手机装上一个既懂聊天又懂办事的超级大脑,让日常生活和工作效率都得到质的提升。
2025-02-17 13:46:48
707
原创 手把手教程!本地部署DeepSeek + 知识库
如何用DeepSeeK和AnythingLLM搭建本地知识库系统!别着急,我会以Windows为主,顺便把Mac的操作也补充一下,手把手教你从头到尾搭建整个系统,保证你跟着做,分分钟拥有属于自己的本地知识库。
2025-02-15 11:49:59
1760
原创 刚刚,DeepSeek又开源R1部署最佳实践!
嘿,大家好!这里是一个专注于AI智能体的频道~DeepSeek刚刚又发补给了,补给4件套。包含2个配置项,不要设置system prompt + temperature 设置为0.6。还有大家比较期待的官网的,接入搜索的R1的prompt设计及最佳用法!以及如何缓解R1系列模型绕过思考的解决办法。在DeepSeek 官网版本,没有使用系统提示词,而是为文件上传和网络搜索设计了两个特定的提示词以获得更好的用户体验。并且temperature设置为 0.6。
2025-02-15 11:08:14
596
原创 百度与OpenAI“默契”开放大模型背后,暗藏哪些AI技术突破的玄机?
AI大厂之间的“默契”,总是超越了竞争本身,形成一种既对抗又合作的微妙平衡。2月13日凌晨,OpenAI宣布GPT-5即将到来,并将全面免费开放(Pro用户将获得更高阶智能的版本),立刻引发了全球关注。而在同一日,百度也宣布文心一言将于4月1日0时起全面免费,所有PC端和App端用户均可体验文心系列最新模型,包括超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。OpenAI与百度“同步”并非局限于“免费”。
2025-02-14 11:41:40
1031
原创 AI时代下的新思考,企业数智化转型:部门调整、职能重新定义、角色重塑
现在AI的重要性经过这两年的发酵不用多说,如果你的企业还没拥抱AI,早晚等死,所以无论你是科技公司还是传统性质企业,在企业内部如何更好的融入AI,如何更高效的降低成本并提高生产性是所有企业面临的一个话题。今天主要跟大家聊聊,传统性质企业在AI新时代的浪潮下,企业该如何进行数智化转型,如何更高效的转型,IT部门在其中应该扮演什么新角色。
2025-02-13 11:30:44
662
原创 打工人逆袭!DeepSeek+Kimi双AI神器3分钟生成PPT,卷死同事就靠它
AI提效并非空谈,DeepSeek与Kimi的结合堪称职场人士的福音。借助这一组合,用户能够轻松实现PPT自由,再也不必为制作PPT而烦恼。
2025-02-13 11:23:29
980
原创 想入门深度学习?建议你从这篇综述开始,它能帮助你构建一个全面且深入的深度学习知识体系!
每年都有大量学生投身深度学习领域,无论是本科生还是研究生。对于初学者而言,构建对领域的宏观认知至关重要。这有助于他们明确研究方向,开展有针对性的学习,并发现论文的创新点。这本综述堪称构建深度学习知识体系的理想之选,更值得一提的是,它在24年10月1日迎来了最新一次的更新!《理解深度学习》一书以权威而明晰的笔触,呈现了深度学习的全景图,囊括了所有核心议题及最前沿的探索与理念。它不仅从宏观视角阐释了深度学习的本质与演进历程,更以易于消化的方式,汇聚了丰富而关键的资讯。
2025-02-11 14:01:44
277
原创 Deepseek的本地部署-1(AI进阶篇)
(下载资源在文末,还是建议使用手机客户端)Deepseek,这个在2025年过年期间引爆整个社交网络的究竟是什么?当然不只是中文互联网,连大洋彼岸的美国也都在问,这个Deepseek是何方神圣。不知道大家还记不记得当年ChatGPT刚刚问世的时候,几乎所有人觉得,这就是AI的未来,甚至开始恐慌AI替代人类的时代已然到来。如果我能穿越到过去,可能就有人会问了:博主博主,ChatGPT确实很厉害,但是需要翻墙充钱,有没有更加简单又好用的大语言模型。
2025-02-11 14:00:20
1230
原创 钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹
阿里系第一个吃上“螃蟹”的出现了——已经全面接入DeepSeek系列模型。现在,用户在钉钉上创建AI助理的时候,可以直接选择DeepSeek系列的等模型!与此同时,钉钉还针对性地发布了全新模板,可以帮助用户一键创建、发布基于DeepSeek模型的AI助理。
2025-02-07 17:44:23
1094
原创 柯基数据产品线全面接入DeepSeek V3/R1,解锁企业智慧新生态
近期DeepSeek再掀AI热潮,企业如何借势突围?是否还在为如何接入DeepSeek或者接入后如何赋能各业务场景而发愁?如何让企业沉淀的海量知识成为企业的“智慧大脑”,从而驱动业务高效运转?企业强合规和循证溯源要求,如何解决DeepSeek的幻觉(一本正经的胡说八道)问题?柯基数据**“知识增强企业级智能知识平台”DeepSeek V3/R1**,重磅来袭、欢迎洽谈!以**“知识图谱+大模型”合规、高效、智能**的知识管理!图:“知识图谱+大模型”驱动的企业级多模态智能知识平台。
2025-02-07 17:39:44
1016
原创 DeepSeek百万年薪招AI人才
这个春节期间,DeepSeek 无疑是风头最劲的 AI 应用。近日,DeepSeek 背后的公司深度求索又爆出以百万年薪招募顶尖 AI 人才。消息一出,迅速引发全网热议。微博上,#DeepSeek 发布招聘年薪百万# 话题迅速冲上热搜,评论区被 “别人家公司”、“现在转行 AI 还来得及吗” 等羡慕声刷屏。DeepSeek 的招募主要面向大模型算法、AGI(通用人工智能)研究、高性能计算等领域的顶尖人才。
2025-02-06 18:23:50
667
原创 深入解构DeepSeek-R1!
中国计算机学会青年计算机科学与技术论坛(CCF YOCSEF)近期组织了一场研讨会,邀请了复旦大学教授、清华大学刘知远长聘副教授、清华大学教授以及上海交通大学戴国浩副教授四位专家,从不同角度深入解析了 DeepSeek-R1 的技术突破与未来影响。R1 的推理模型架构突破要理解 R1 的突破,我们要从 o1 类推理模型开始说起。邱锡鹏认为,当前人工智能领域正面临着一个重要转折点。此前,Ilya 称“这一变化主要源于数据增长的停滞。
2025-02-05 13:53:02
1184
原创 Qwen2.5-Max 超越了 DeepSeek-V3
Qwen2.5-Max 语言模型是Qwen系列中最新的也是最先进的版本,推动了AI性能的边界。尽管它拥有令人印象深刻的性能,但它不像其前辈那样是开源的。然而,它可以通过阿里巴巴云上的API和Hugging Face上的UI进行访问。对于那些寻找类似ChatGPT界面的人来说,有一个免费使用的选项,可以通过本帖脚注中的链接访问。
2025-02-05 13:41:34
1190
原创 知识图谱与ai agent的演变
知识图谱(KG)的发展与人工智能(AI)代理的进步紧密相连。从它们的静态起源开始,知识图谱已经发展到包括动态、时态和事件驱动的范式,每个范式都为AI系统解锁了新的能力。本文探讨了它们的演变以及大型语言模型(LLM)如何融入这些进步。简而言之,所有知识图谱的演变都是关于时间的。静态图谱静态知识图谱是基础结构,其中实体和关系是固定不变的。例如,WordNet、Freebase和Kinship将实体表示为节点,将关系表示为不可变的三角关系(例如,主语-谓语-宾语)。
2025-01-28 11:15:00
705
原创 大模型|DeepSeek发布R1推理模型并开源
ELIZA代码复现与历史意义美英研究团队成功复现了被认为是世界上第一台电子聊天机器人的ELIZA的原始代码。ELIZA由MIT教授Joseph Weizenbaum于1960年代设计,其代码在2021年被MIT档案管理员偶然发现。这款程序采用Lisp语言编写,通过简单的请求/响应机制,模拟治疗师与用户的对话方式。尽管功能简单,ELIZA成为当时技术爱好者的热门工具,标志着人机交互的早期探索。研究人员克服了原始代码适配过时操作系统的挑战,开发了新环境并补充了遗漏的函数。
2025-01-28 09:15:00
1849
原创 手把手教学--小程序接入AI大模型背景介绍 在过去的几年中,人工智能技术尤其是大规模预训练模型(俗称AI大模型)取得了显
在过去的几年中,人工智能技术尤其是大规模预训练模型(俗称AI大模型)取得了显著的进展。这些模型因其强大的学习能力和通用性,能够处理从自然语言处理到计算机视觉等多种任务,已被广泛应用于各个行业。对于开发者而言,将AI大模型接入小程序能够显著提升应用的智能化水平,提高用户体验和业务价值,这次接入的是星火大模型。
2025-01-27 09:15:00
661
原创 带你用 Java 接入一个无限免费使用的大模型
本次使用的是智谱 AI,诞生于清华大学实验室,提供了许多出色和强大的大模型,支持上下文对话、图像生成和视频生成等等。我们先访问智谱 AI 的控制台(),先登录再点击红框的“🔑”,有 API Key 的直接复制,没有点击右上角“添加新的 API Key”,有了 API Key,我们才能在代码中调用智谱 AI。
2025-01-27 08:30:00
902
原创 首份《人工智能安全指数报告》发布,Anthropic 获得最高安全评级,中国智谱上榜
2024年12月,未来生命研究所(FutureofLifeInstitute)发布了第一份《人工智能安全指数报告》(FLIAISafetyIndex2024),共80页。
2025-01-26 09:45:00
1063
原创 Windsurf Wave 2:构建全面的 AI 辅助开发链路
WindsurfWave2为开发者提供了强大的AI辅助开发能力,通过知识获取、存储和应用三大层次,打造了一个高效的开发生态系统。
2025-01-26 07:45:00
884
原创 大模型私有化部署实践(二):vLLM 分布式推理与性能优化前置
vLLM 是一个高性能、易扩展的大模型推理框架,专为生产环境中的大规模语言模型部署而设计。它通过创新的 PagedAttention 内存管理技术,显著提升了 GPU 的显存利用率,同时支持分布式推理,能够高效利用多机多卡资源。无论是低延迟、高吞吐的在线服务,还是资源受限的边缘部署场景,vLLM 都能提供卓越的性能表现。其简洁的 API 设计和灵活的部署方式,使得开发者能够快速集成并优化大模型推理任务,是私有化部署中不可或缺的利器。vllm官方中文文档。
2025-01-25 13:45:00
1316
原创 纯小白的大模型 Prompt 编写技巧
根据上一篇 《纯小白的大模型入门指南》文中介绍,编写一份好的 Prompt 至关重要,它会让大模型更好的理解你的意图。对大模型效果的调优,其中一项就是对 Prompt 进行合理优化。本篇结合实际案例,来谈一谈 Prompt 的优化技巧。提示词(Prompt)是输入给大模型(LLM)的文本信息,用于明确地告诉模型要解决的问题或完成的任务,也是大语言模型理解需求并生成相关、准确回答或内容的基础,是至关重要的。
2025-01-25 09:45:00
881
原创 如何本地搭建大模型!!!!
很多时候在思考 是否可以本地搭建ai大模型,然后把自己的代码喂进去,然后后续只需要传入数据文件配合配置式开发后台管理结合在一起 就可以自动生成后台管理(暂时用于后台管理)调研:Ollama。
2025-01-24 12:30:00
907
原创 全面指南!掰细了讲混合专家模型MoE的内部结构
混合专家模型MoE是一种能让大型语言模型(LLM)质量变好的技术。专家——现在每个前馈神经网络(FFNN)层都有好多个“专家”,每次可以用其中一部分。“专家”一般也是前馈神经网络。门控网络——它能决定把哪些tokens送到哪些专家那儿。在带混合专家模型MoE的大型语言模型的每一层,都能看到这些有点专门作用的专家:要知道,这里的‘专家’可不是像‘心理学’‘生物学’这种特定领域的专家哦。最多就是学学词语层面的语法信息:说得更细点儿,它们擅长处理特定情境下的特定词。
2025-01-24 07:15:00
853
原创 一行代码不用写,用 Autoflow + Gitee AI 搭建本地知识库问答机器人
AutoFlow是 PingCAP 开源的一个基于LlamaIndex和DSPy构建的 Graph RAG 知识库工具,可以让开发者快速构建一个对话式知识库聊天助手,现已在 GitHub 正式开源。在AutoFlow的0.4.0版本中,。马建仓看到本次更新后也是迫不及待上手实践,最终实现了一行代码没写,快速搭建出了一个基于本地知识库的问答机器人,那么下面就和马建仓一起开始吧!
2025-01-22 11:50:23
944
原创 AAAI‘25 | 融合分隔:协同专家混合模型用于数据稀缺环境下的药物-靶点相互作用预测
摘要药物-靶点交互(Drug-Target Interaction, DTI)预测在药物发现和临床应用等各种场景中至关重要。DTI 预测中广泛使用的输入数据有两种视角:内在数据代表药物或靶标的结构,外在数据代表药物或靶标与其他生物实体的关系。**然而,对于药物或靶点,输入数据的两个角度中的任何一个都可能是稀疏的,特别是对于那些不流行或新发现的药物或靶点。此外,特定交互类型的真实标签也可能很少。因此,我们提出了一个方法来解决输入数据和/或标签稀缺情况下的 DTI 预测。
2025-01-16 11:19:21
704
原创 AAAI 2025 | 北大提出基于大模型的动态权重评估方法,探索语法纠错系统的评估新范式
语法纠错(Grammatical Error Correction, GEC)模型旨在自动纠正自然语言文本中的语法错误,提升书面内容的质量和准确性。传统上,GEC 模型的评估运用了多种指标,这些指标可以分为需要参考文本的(reference-based)和不需要参考文本的(reference-free)两类。基于参考的评估指标,如 BLEU、ERRANT 和 M²,通过将模型生成的文本与正确的参考文本进行比较来评估语法纠正的准确性,并且在这一领域得到了广泛的应用。
2025-01-16 10:50:07
976
原创 关于神经网络的输入格式——数据集的处理。关于神经网络模型的结构说明
外部数据需要经过嵌入——Embedding转换成神经网络可以识别的向量格式的数据开发一个大模型或者说神经网络需要经过以下几个大致步骤:1. 数据集的处理2. 神经网络模型设计3. 神经网络模型训练可能很多人觉得神经网络模型很复杂,也看不懂啥是啥;比如说很多人还分不清pytorch和Transformer的区别,也看不明白Transformer的结构图是什么。所以,今天我们以Transformer架构为例,详细梳理一下神经网络模型的功能结构;
2025-01-16 08:15:00
594
原创 最新开源:Dispider 实现视频LLMs的主动实时交互!又一个媲美 o1 的“开源推理模型”来了!
论文链接:__项目地址:_Dispider 是一个新型的视频大语言模型(Video LLM),通过解耦的感知(Perception)、决策(Decision)和反应(Reaction)这三个模块,实现了与视频的实时交互。与传统的离线视频处理方法不同,Dispider 能够在视频流中提供连续和及时的反馈,适用于需要实时响应的场景。感知:实时视频监控和交互捕捉。决策:在适当的情况下提高主动互动。反应:与用户持续互动。
2025-01-15 11:10:26
793
原创 BIMEDIX2:基于多模态双语大模型生物医学专家 - 阿联酋MBZUAI&瑞典林雪平大学等
本文介绍了BiMediX2,一种采用统一架构的双语(阿拉伯语-英语)生物医学专家大型多模态模型(LMM),该架构整合了文本和视觉模态,以实现先进的图像理解和医学应用。BiMediX2利用Llama3.1架构,并整合了文本和视觉功能,以促进英语和阿阿拉伯语之间的无缝互动,支持基于文本的输入和涉及医学图像的多轮对话。该模型在包含160万份多样化医疗互动样本的广泛双语医疗保健数据集上进行训练,这些样本涵盖文本和图像模态,混合使用阿拉伯语和英语。
2025-01-15 11:03:38
681
原创 Github万星,开源强化学习交易框架
是一个开源的深度强化学习库,专为量化金融设计,旨在帮助用户开发自动化、智能化的股票交易策略。与其他通用DRL框架不同,FinRL 充分考虑了金融市场的独特性,提供了多种专为金融交易优化的功能和工具。:FinRL 提供了多种数据接口,支持从Yahoo Finance、Alpaca、JoinQuant等多个数据源获取金融数据。用户可以轻松地接入历史和实时数据,并进行清洗和特征工程。这一层的设计极大地简化了数据处理流程,让用户能够专注于策略开发。
2025-01-13 11:27:24
671
原创 211本硕二战腾讯大模型算法岗,已凉......
01本弱鸡 211 本硕,nlp,无论文有实习(老板没资源且放养),本科有 acm 经历(1 铜),面试 pcg 日常实习。02Q1:了解什么机器学习算法,讲一下原理?当时只记得实体识别用到了隐马尔可夫模型,讲了讲怎么怎么定义观测状态和隐藏状态、前向传播、解码和应用场景。Q2:讲一下 Bert 的结构和怎么训练的,怎么用 bert 做下游任务?八股,双向 transformer encoder 结构,预训练任务包括 MLM 和 NSP,详细讲了讲。
2025-01-13 11:22:41
1479
原创 Github揽获1.6K星!南大、腾讯发布VITA-1.5: 迈向GPT-4o级实时视频-语音交互
近年来,多模态大语言模型(MLLMs)主要聚焦在视觉和文本模态的融合上,对语音的关注较少。然而,语音在多模态对话系统中扮演着至关重要的角色。由于视觉和语音模态之间的差异,同时在视觉和语音任务上取得高性能表现仍然是一个显著的挑战。:在视觉-语言多模态模型的基础上,增加语音输入和输出能力,使其能够高效处理视觉、文本和语音任务。:避免使用独立的自动语音识别(ASR)和语音合成(TTS)模块与 LLM 级联的方案,显著提升交互时端到端响应速度。
2025-01-10 11:55:32
743
原创 图解深度学习 - 数据蒸馏和知识蒸馏
*深度学习模型就像是处理数据的筛子,包含一系列越来越精细的数据过滤器(也就是层)。******每一层都致力于从数据中捕捉有用的信息,并将这些信息传递给下一层,以便进一步的处理和表示。****它通过一系列层层相连的数据过滤器(即层layer),逐步对输入数据进行处理和精炼,**********,旨在从原始数据集中提取出更具代表性和有用性的数据子集;知识蒸馏则是一种模型压缩和知识迁移的方法,旨在将大型教师模型中的知识转移到小型学生模型中。**********数据蒸馏(Data Distillation)?
2025-01-10 11:17:25
2282
原创 下载10W+深度学习4大神书《深度学习科学》免费pdf下载
这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。帮助很多人得到了学习和成长。
2025-01-09 11:53:02
583
原创 LLM工作原理,很直观很好懂!
训练营学员继拿下腾讯美团字节sp后,百度经过加面,也给了sp offer,且签字费给到了其他大厂的两倍。本文将从基础开始讨论大语言模型(LLM)的工作原理:假设你只知道如何对两个数字进行加法和乘法。首先,作者 Rohit Patel 会从构建一个简单的生成式人工智能出发,逐步阐释理解现代 LLM 和 Transformer 架构所需的所有知识。本文将剔除机器学习中所有花哨语言和术语,将一切简单地表示为数字。本文主要内容:一个简单的神经网络这些模型是如何训练的?这一切是如何生成语言的?
2025-01-09 11:52:09
1106
原创 无需模仿,超越蒸馏!清华团队靠强化学习让 7B 模型打败 GPT-4o 数学推理
OpenAI o1 和 o3 模型的发布证明了强化学习能够让大模型拥有像人一样的快速迭代试错、深度思考的高阶推理能力,在基于模仿学习的Scaling Law 逐渐受到质疑的今天,基于探索的强化学习有望带来新的 Scaling Law.近日,清华大学 NLP 实验室联合上海 AI Lab,清华大学电子系及 OpenBMB 社区提出一种新的结合过程奖励的强化学习方法——
2025-01-08 11:20:21
998
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人