- 博客(974)
- 收藏
- 关注
原创 邀请码炒到5万元!Manus一夜爆火,创始人为中国90后
3 月 6 日凌晨,科技圈再度迎来一个不眠之夜——一款名为 Manus 的产品在网络上迅速走红,成为热议焦点。这款由中国团队 Monica 推出的全球首款通用型 AI Agent,引发了全网抢邀的热潮。(Manus 地址:https://manus.im/)更令人惊讶的是,Monica 创始人竟是 90 后中国青年。Manus,源自拉丁语中的“Mens et Manus”,意为“心智与手”,寓意将创意和知识转化为实际行动。
2025-03-06 20:20:23
352
原创 实测 Manus:首个真干活 AI,中国造(附50个用例 + 拆解)
我想放一个视频:摄于2025年3月5日晚10点: Manus 发布之际此刻,中国团队在通用智能体赛道上,迈出了实质性的第一步。2025,东方破晓。
2025-03-06 19:58:05
482
原创 手把手教你用LangChain自动写SQL做数据分析可视化
从数据库里拿到原始数据后,我们得给用户生成一个人类能看懂的自然语言响应。这就得利用语言模型的能力,把原始数据转换成容易理解的内容。我们可以写一个函数,它接收(用户问题)、schema(结构)、sql(SQL 查询)、datatemplate = """根据表结构、问题、SQL 查询和 SQL 响应,提供一个结构化的、人类可读的响应。仅提取响应中可用的字段,并正确格式化它们。{schema}问题:{question}SQL 查询:{query}SQL 响应:{response}
2025-03-06 11:39:33
648
原创 刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
机器之心报道强化学习先驱 Andrew Barto 与 Richard Sutton 获得今年的 ACM 图灵奖。人工智能学者,再次收获图灵奖!和。他们都是对强化学习做出奠基性贡献的著名研究者,Richard Sutton 更是有「强化学习之父」的美誉。Andrew Barto 则是 Sutton 的博士导师。自 1980 年代起,两位学者在一系列论文中提出了强化学习的主要思想,还构建了强化学习的数学基础,并开发了强化学习的重要算法。两人合著的《》一直是强化学习领域最经典的教材之一。
2025-03-06 10:43:15
390
原创 TimeKAN:基于KAN的时间序列预测模型
时间序列预测(TSF)在金融、能源管理、交通流量规划和天气预报等多个领域具有重要应用。近年来,深度学习技术,特别是基于卷积神经网络(CNN)、Transformer和多层感知器(MLP)的方法,极大地推动了TSF的发展。然而,现实世界中的时间序列往往具有非平稳性和复杂的模式,这使得准确捕捉历史数据与未来目标之间的联系变得极具挑战性。为了应对时间序列中复杂的时序模式,越来越多的研究开始关注利用先验知识将时间序列分解为更简单的组成部分,为预测提供基础。
2025-03-05 11:03:29
449
原创 AI编程神器Cursor,保姆级教程来了!
如果你使用过 VScode 编程,那么你应该很熟悉这个界面,因为它就是 VScode 界面;但如果你和我一样是小白,只为提高工作效率,那么接下来的比喻可能辅助你理解:想象一下你正在一个设备齐全的厨房做菜。
2025-03-05 10:23:29
915
原创 什么是神经网络?神经网络开发框架——PyTorch和架构Transformer的区别和联系
PyTorch就是工具,而Transformer就是理论;而理论指导工具。我们都知道大模型的本质是一个神经网络模型,因此我们学习大模型就是在学习神经网络模型;但了解了很多关于神经网络的理论,但大部分人对神经网络都没有一个清晰的认识,也就是说神经网络到底是什么?它长什么样?事实上所谓的神经网络本质上就是一个数学模型,里面涉及大量的数学运算;只不过其运算的主要数据类型是——向量,具体表现为多维矩阵。PyTorch和Transformer在神经网络的学习研究过程中,有两个东西是绕不过去的;
2025-03-04 11:45:36
971
原创 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
语言模型」是一种「人工智能系统」,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关的文本,应用于翻译、摘要、聊天机器人和内容生成等领域。
2025-03-03 11:26:11
960
原创 2025版最新大模型入门书籍推荐(非常详细)大模型零基础入门到精通,收藏这篇就够了
不少小伙伴都想要学习大模型技术,转战AI领域,以适应未来的大趋势,寻求更有前景的发展~~然而,在学习大模型技术这条道路上,却不知道如何进行系统的学习,所以本期书单就为大家奉献一场,从大模型理论基础到大模型工具应用,构建自己的LLM应用程序……应有尽有,如果你是AI小白,想要从入门开始学起,或者想要了解AI未来的发展趋势,也有相应的图书哦~~**▊《**张奇,桂韬,郑锐,黄萱菁 著。
2025-03-03 11:21:06
1873
原创 小白也能轻松理解的大模型入门锦囊!
*「微调(Fine-tuning)」**是给大模型提供特定领域的标注数据集,对预训练的模型参数进行微小的调整,使其更好地完成特定任务。通过微调,可以显著提升模型在特定任务上的性能。微调之后的大模型可以根据应用场景分为不同层次:通用大模型:类似于中小学生,具有广泛的基础知识,但缺乏专业性。行业大模型:基于特定行业的数据集进行微调。如金融证券大模型通过基于金融证券数据集的微调,可以得到一个专门用于金融分析和预测的大模型。这相当于大学本科生,具备了更专业的知识和技能。
2025-02-28 20:58:00
635
原创 千呼万唤始出来的 GPT 4.5,主打的只是一个“大”
GPT系列不是我们前沿的模型。一个月前你还很难想象OpenAI发布GPT的下一个大版本更新时,会这样说自己。但当2月27日OpenAI突然用一个直播发布了GPT4.5的时候,一切都已经发生变化。GPT的定位不再是OpenAI用来震撼外界的模型,而是一个逐渐退到舞台后方的“底座”;它的发布也不再是OpenAI引导行业叙事的大动作,而更多带上了防御的感觉;这是GPT目前“最大”的一款,也是它在舞台中心的最后一舞。OpenAI最初文档里的表述,后已删除。图源:推特。
2025-02-28 17:20:41
884
原创 GPT-4.5 Turbo提前泄露?Altman亲自暗示新模型要来,传言本周四上线
那以下这些PDF籍就是非常不错的学习资源。截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。另外,三星最近泄露的一些宣传材料可能表明,更多新的Copilot功能将很快公布,包括与Copilot和微软的Phone Link应用程序与三星Galaxy智能手机的更好集成。当然也有实用派的网友表示,我就要个4.5 Turbo就行了,我希望它不贵,性能又能够接近opus或者标准GPT-4,再加点像0125-turbo的指令遵循这种实用的功能。
2025-02-28 15:56:02
983
原创 ima + DeepSeek 3分钟搭建个人知识库,真的太香了,90%的人都不知道!(全网最全教程)
昨天有位朋友昨天跑过来私聊我,问我说有没有能“投喂”个人文件,搭建自己知识库的 AI 工具。并且还必须是要接入 DeepSeek-R1 深度思考大模型的,还必须是比较简单,对于没有经验的人来说能快速把个人的 AI 知识库搭建起来的。这位朋友说自己试了一圈,效果都不太好,有的是深度思考能力不行,有的是没有办法上传自己的本地文件,反正没找到一个好用的。找了一圈没找到,就跑过来问我了。我就立刻给他推荐了腾讯旗下的 AI 产品:ima。
2025-02-27 11:09:50
2110
原创 AI Agent框架全面对比,避坑指南请收好!
嘿,大家好!这里是一个专注于前沿AI和智能体的频道~随着AI Agent技术的快速发展,各大厂商和开源社区纷纷推出了自己的Agent框架。但面对众多选择,哪一个框架在企业级能力、Agent功能性和开发者体验方面取得了最佳平衡?今天,我们将对当前市场上的五大热门Agent框架进行深度对比分析,帮助你找到最适合企业级应用的最佳选择!
2025-02-27 10:17:01
995
原创 利用LLM重新审视金融情感分析
在当今数字化时代,社交媒体平台上的信息传播速度极快,影响力也日益增强。一条来自公众人物的推文就可能在几分钟内引发全球市场数十亿美元的资金流动。随着市场的发展,投资者群体的心理和行为对市场走势的影响愈发显著。投资者情绪通常反映在推特等社交媒体平台上,成为市场预期的代理指标。金融情感分析(FSA)旨在量化这些情绪,并将其分类为看涨(Bullish)、看跌(Bearish)或中性(Neutral),以预测市场走势。:例如,“看涨”标签可能意味着未来五天内价格小幅上涨 2%,也可能是未来一个月内大幅上涨 10%。
2025-02-27 09:50:40
959
原创 DeepSeek 开源周第二天:DeepEP 亮相,MoE 模型效率革命来袭!
今天是 DeepSeek 开源周的第二天,一个全新的开源项目 DeepEP 重磅亮相!这是专为 MoE(专家混合模型)设计的通信神器,直接让模型训练和推理效率起飞!准备好了吗?跟我一起探索这个 AI 新星吧!引言:开源周的狂欢,DeepEP 闪亮登场!就在昨天,DeepSeek 拉开了“开源周”的序幕,每天一个开源项目,简直是 AI 爱好者的狂欢节!今天的主角是 DeepEP,一个专为 MoE(Mixture of Experts,专家混合模型)设计的通信库。听起来是不是有点高深莫测?
2025-02-26 10:27:57
640
原创 大模型|Anthropic推出混合推理模型Claude 3.7 Sonnet
Anthropic公司推出最新AI模型Claude 3.7 Sonnet,该模型被定位为市场上首款“混合推理模型”,能够在即时响应与逐步思考模式之间切换,模拟人类的快速反应与深度思考。Claude 3.7 Sonnet集成了即时响应与扩展思考功能,并在编码任务上表现出色,尤其在SWE-bench Verified等基准测试中取得领先成绩。Anthropic还发布了代理式终端工具Claude Code,支持读取代码库、编辑文件及推送GitHub仓库,进一步增强了模型在开发领域的应用潜力。
2025-02-26 10:26:19
723
原创 致远互联践行“AI+”战略 助力央国企打造全链路AI能力
在国家大力推进“AI+”战略与数字化转型的背景下,央国企已基本完成基础办公业务的信创替代,逐步加速智能化升级。作为协同运营管理领域的领军企业,致远互联积极响应国家战略,提出以“”为核心,为央国企提供了,通过构建可成长、可复用的智能平台,助力央国企实现业务流程重构、管理效能提升与决策智能化突破,赋能其高质量发展。致远互联央国企AI一体化智能协同运营平台AI能力服务化基座致远互联以“
2025-02-26 10:22:35
613
原创 模力方舟推出 DeepSeek 大模型一体机,赋能企业智能化转型
今天,AI 技术的创新应用已经被广泛视为提升生产力、优化产业结构的核心路径。为此,,为不同规模企业与单位提供量身定制的智能硬件解决方案,助力智能化升级,推动行业数字化转型。
2025-02-26 10:15:44
920
原创 动手部署671B R1模型,详尽教程来了!
DeepSeek-R1 系列发布了 8 个开源模型,其中原生 DeepSeek 的只有 R1-Zero 和 R1,其他模型则是基于 DeepSeek 基础模型进行知识蒸馏,并采用 Qwen 或 LLaMA 架构的二次开发版本。本文动手部署了原生的 R1 版,当然受限于硬件条件限制采用了 2.51-bit 量化方案,并实际测试得出需要使用 4 块 H20 来进行部署 2.51-bit 量化的版本,需要 2 块 H20 来部署 1.58-bit 量化的版本。
2025-02-25 11:00:49
1086
原创 利用GraphRAG和数字孪生进行个性化教育:面向工业4.0劳动力发展的虚拟现实、增量式学习和零样本情感分析- 亚利桑那大学等
摘要随着云计算、机器学习和人工智能等第四次工业革命(4IR)技术的出现,虽然带来了便利性和生产效率的提升,但同时也给培训与教育带来了新的挑战,需要对现有员工进行再培训,并培养一支新劳动力。在已有劳动力短缺的情况下,这一庞大的劳动力再培训和建设努力旨在打造一支能够操作和维护这些4IR系统的高科技劳动力;需要更高的学生保留率和坚持度。这种学生保留和坚持的增加在培训来自边缘化社区(如代表性不足的少数群体,URM)的员工队伍时尤为重要。
2025-02-25 10:36:05
924
原创 阶跃同时开源视频生成+实时语音模型,我愿称之「多模态界的Deepseek」
你可能还不清楚,阶跃星辰这家创业公司成立还不到 2 年,这已经是他们发布的是第 11 款多模态模型。这 11 个模型涵盖了图片理解、视频理解、图像生成、视频生成、语音识别、语音复刻和生成所有的模态和类别。
2025-02-25 10:29:02
635
原创 【教程】基于DeepSeek-R1的个人AI知识库,全本地部署,可断网使用
从ChatGPT上线开始,我就有了一个想法,打造一个个人知识库,它可以充当我的第二大脑,记住我的尽量多的信息(包括隐私信息)。无论是我每天的琐碎事务,还是重要的决策和回忆,它都能存储并快速检索。当我问它“我去年5月做了什么?”时,它不仅能够从知识库中找到当时的记录,还能结合上下文和细节,帮助我回忆起那些可能遗忘的瞬间。但要实现这个想法,用在线服务肯定是不行的,我需要它完全本机运行。现在,有了可完全本机部署的deepseek-r1和bge-m3,加上界面优雅的Cherry Studio,是时候实现它了。
2025-02-24 11:38:43
1733
1
原创 DeepSeek助力科研:自动提炼,梳理文献,高效科研!赶紧收藏!
科研人员不再需要苦心孤诣地翻阅每一篇文献,DeepSeek将你从繁重的整理工作中解放出来,
2025-02-24 11:13:07
1081
原创 Grok3登上美区榜一!我们把它和DeepSeek对比了下:马斯克没瞎说
Grok3 DeepSearch 的路径可以在页面左侧一览无余。了解用户请求后,开始搜索、浏览 Reddit 讨论和帖子,然后搜索替代来源,为了信息的准确性,还要验证用户信息等。我们扒了一下它搜索的 52 个信源,涉及 ABC、NBC 等权威媒体以及 reddit 论坛,还有它的优势所在:社交平台 X 上的大量数据。在回答上,Grok3 给了两个「版本」。一个是直接回答,内容相对简单,主要是罗列关键要点,介绍下背景以及表格形式总结 X 网友评价。
2025-02-22 11:31:24
702
原创 全面评测Grok3,还是DeepSeek更适合中国人
马斯克号称Grok3是全球最聪明的AI,并且短时间内免费开放使用,直到他们的服务器崩溃。我第一时间对Grok3做了全面评测,让你们感受下Grok3的能力到底怎么样。先试下数学能力经典的数学问题9.11和9.9哪个大?以及简单的解方程,都完成得又快又准确。科学问题和常识性知识都轻松作答。生成的图片很清晰,也很逼真。而且目前没有其他生成图片平台的限制,就算是名人也可以生成,足以以假乱真。以后真的是不知道哪张图是真的,哪张图是AI生成的了!编程能力也可以的,速度还挺快,考虑也很全面。
2025-02-22 11:28:58
934
原创 DeepSeek如何评价最近很多医院私有部署DeepSeek用于临床科研?
最近很多医院宣传接入DeepSeek并用于诊疗,实际有什么挑战以及未来产学研应用有什么建议?我们来问一下DeepSeek。问题最近很多医院私有部署deepseek,并宣传用于诊疗。你是一名医学人工智能专家,怎么看这个现象以及医疗大模型在医疗监管伦理以及诊断循证方面的挑战。对于deepseek等大模型在医疗领域合适的落地场景以及如何推动医疗产学研有什么务实的建议?引用 6 个网页,12 篇公众号文章1. 全市率先!三峡医院推出基于本地部署DeepSeek智能应用2. 智慧医疗新突破!
2025-02-21 18:03:33
841
原创 Grok 3证明黎曼猜想,训练遭灾难性事件?数学家称不夸张,两年内AI将解出千禧年难题
一个函数f:Q→Q被称为aquaesulian函数,如果对于每个x,y∈Q,满足以下性质:f(x+f(y))=f(x)+y或f(f(x)+y)=x+f(y)。它就像大海中的灯塔,为数学领域的发展指明方向:很多数论和复变函数领域的工作都基于黎曼猜想为真这个前提,因此一旦证明了黎曼猜想,许多其他工作也会得到完整的证明。而这97轮对话,可以说构建出了一个极难的NP完全问题,其中一些实例在时间复杂度低于O(2^n)(即穷举搜索)的情况下是不可解的,也就是说,证明结论为P≠NP。注意,我们还将α重命名为x。
2025-02-19 10:46:48
1158
原创 马斯克:Grok-3 一周内发布!「聪明得吓人」
在最新的采访中,马斯克信心满满地宣布:同时马斯克还表示这个模型能够提出「而此前,马斯克就宣称xAI 将发布超越DeepSeek 的模型:看来AI 圈又要热闹起来了!
2025-02-19 10:26:53
291
原创 如何测量大模型是否过度思考?兼看最近GraphRAG及多模态RAG 进展
本文主要回顾了最近今天RAG的一些进展,包括GraphRAG,多模态RAG,这些都有一些往小了做的思路。另外,关于推理大模型的过度思考问题也是一个可解释的话题,但具体的结论,跟测试方式跟测试标注有关,这个是我们能够学到的点,如何建模一个评测任务。
2025-02-18 11:16:33
699
原创 免费不卡顿!解锁满血版DeepSeek R1的终极指南,还有超百款接入应用等你体验!
011. 直接用大厂集成了R1的产品就像腾讯宣布接入DS大模型一样,腾讯的AI助手元宝以及AI代码助手ima最近都接入了满血版的DeepSeek。很多大厂已经官宣把DeepSeek R1集成到自家产品里了,直接去用就行!比如:腾讯元宝:yuanbao.tencent.com/chat360纳米AI:bot.360.com天工AI:www.tiangong.cn这些产品都内置了R1的“深度思考”能力,直接用就完事了,省心省力!2. 通过云服务平台用纯净版R1。
2025-02-18 11:14:08
844
原创 在手机上也能本地运行DeepSeek了?!
最近科技圈上演了一出"速度与激情"大戏——当硅谷还在讨论ChatGPT各种“挤牙膏”时,咱中国人自己的本土团队,直接把AI战场搬到了异次元!一夜之间,中国AI大模型平地惊雷、横扫硅谷,迅速引爆全球科技圈。DeepSeek-R1不仅性能媲美OpenAI O1,更做到了,它的发布,让我们可以更好的使用开源大语言模型运行推理任务。不过,因为DeepSeek实在是太火了,导致大家总是会遇到的情况……今天我要给大家分享一个更有意思的事情——。硬生生把原本要机房供着的AI巨兽塞进了手机芯片!
2025-02-17 11:57:23
1630
原创 3个集成DeepSeek的神器,简直无敌!
DeepSeek R1模型在GitHub掀起了开源热潮,犹如一颗投入平静湖面的巨石,激起层层创新的涟漪。它的出现,为开发者们打开了新的思路之门。而LangBot平台更是一大亮点,它支持多平台的AI助手,宛如一位全能的智者,穿梭于不同平台之间。它巧妙地解决了团队沟通的难题,让信息传递更加顺畅无阻,助力团队迈向高效工作的新征程。在这个数字化时代,它无疑是推动工作效率提升的有力引擎,为各领域带来了全新的可能与活力。
2025-02-17 11:55:39
865
原创 Nature Communications | 多通道学习将结构层次集成到上下文相关的分子表示中
今天分享的是一篇发表在nature communications期刊上的论文:“Multi-channel learning for integrating structural hierarchies into context-dependent molecular representation”,本文介绍了一种创新的多通道学习框架,用于整合分子结构层次信息,生成上下文依赖的分子表示,以提升分子性质预测的准确性。1.介绍。
2025-02-15 10:52:25
927
原创 Cursor + MCP 查询数据库快速生成用户报告
在开始项目之前,我们需要进行一些初始化工作以确保项目的顺利进行。首先,我们需要创建一个新的 Next.js 项目。这条命令将会创建一个名为的新项目,并且会自动安装所有必要的依赖包。为了测试和开发,我们需要一个可用的数据源。推荐使用 Docker 来快速启动一个 MySQL 数据库实例,并添加一些测试数据。这可以通过以下步骤完成:安装 Docker 并启动 Docker 服务。使用 Docker 命令拉取 MySQL 镜像并启动一个容器实例。
2025-02-15 10:48:36
1483
原创 Qwen2.5-Max全面拥抱DeepSeek技术路线
Scaling Law(缩放定律)**。然而,无论是密集模型还是专家混合(MoE)模型,研究和工业界。**通义千问团队研发超大规模的**,一个经过超过,并进一步通过精心策划的。**稠密模型 or MoE模型__****来处理输入数据,优化计算资源使用,提高整体效率和效果。****大模型厂商相继,这就像当年移动互联网时代,****?**强化学习**(RLHF):通过收集人类对模型输出的反馈,并使用强化学习算法对模型进行优化。**********为什么拥抱DeepSeek技术路线?
2025-02-15 10:46:55
698
原创 免费领!亲测可用的DeepSeek本地部署方案,附清华团队使用手册
Ai 黑科技工具软件: 这些软件拥有强大的功能和创新的算法,无论是提升工作效率,还是满足个人兴趣爱好,都能为你提供独特的解决方案,让你在使用过程中感受到科技的魅力与力量。Ai 副业创业项目: 如果你正在寻找新的发展机会,我们的Ai副业创业项目或许能为你打开一扇新的大门。这些项目结合了当下热门的人工智能技术与市场需求,为你提供可行的商业模式和操作指南,助力你在创业的道路上迈出坚实的一步。Ai 智能硬件设备: 这些智能硬件设备在Ai绘画、Ai问答、Ai音频和Ai视频等多个领域发挥着重要作用,为用户提供了强大的计
2025-02-14 11:36:51
928
原创 DeepSeek从入门到精通教程,《DeepSeek图解10页PDF》从入门到精通教程,附免费PDF!
很多朋友已在本地搭建了DeepSeek,接下来最好了解下DeepSeek基本知识,懂一些基本原理,于是有了今天这个教程《DeepSeek图解10页PDF》,我原创的一个精简小册子。1 为什么要学习这个小册子?1)通俗讲解DeepSeek-R1的教程较少。R1刚发布两周左右,目前介绍DeepSeek部署的文章已有一些,但关于DeepSeek背后基本原理讲解的教程,目前平台相对匮乏。2)懂一些DeepSeek的基本原理非常重要。
2025-02-14 10:57:12
1710
原创 全网爆火!DeepSeek本地部署+支持联网,手把手教程!
之前给大家分享了DeepSeek本地部署的内容,有友友提到了想要使用联网功能,毕竟能联网才能获取最新的知识,大模型的回答也将更加精准。那我当然是,经过一番折腾,搞定!,它是一款开源浏览器扩展程序,可为你的本地AI模型提供侧边栏和可视化界面,允许你从任何网页与大模型模型进行互动。1、支持深度配合Ollama本地AI模型的Web UI(可视化界面),支持可视化交互操作2、支持本地部署大模型的联网搜索功能3、支持API大模型的接入和联网搜索功能4、支持Chrome、火狐、Vivaldi等多种浏览器。
2025-02-13 10:33:26
5724
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人