自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1002)
  • 收藏
  • 关注

原创 《2025年DeepSeek技术全景解析——重塑全球AI生态的中国力量》(附下载)

随着人工智能技术的飞速发展,DeepSeek凭借其强大的技术实力和创新模式,正在重塑全球AI生态。从开源策略到技术创新,从行业应用到全球影响,DeepSeek正在成为AI领域的重要力量。以下是对DeepSeek技术全景的核心洞察:技术创新与突破:DeepSeek通过混合专家架构(MoE)和强化学习(RL)等技术,实现了高性能与低成本的结合。其模型训练成本仅为行业头部模型的十分之一,推理能力却与OpenAI的GPT-o1相当。此外,DeepSeek的开源模式激活了全球开发者社区的力量,推动了技术创新。

2025-04-02 10:05:02 326

原创 Playwright MCP 实现自动表单填写

);

2025-04-02 10:03:43 188

原创 字节Trae与Cursor实战对决(附5大维度14个测评用例)

当我们打开一个文件夹后就可以看到中间提示的快捷功能,帮助我们更好上手操作这个ide,这对于初次体验者来说很友好,如下图:点击右侧对话框的Builder模式可以直接用自然语言进行对话,这对编程小白来说几乎零门槛,如图下图:另外Trae还提供Web预览功能,可以直接预览生成效果,不用再跳转到浏览器,如下图:对于Trae将。

2025-04-01 10:03:28 209

原创 AI工具篇:Cursor平替——字节跳动开发的全能助手Trae(附案例演示)

Trae是字节跳动推出的AI编程工具,,真正的AI工程师。核心功能亮点:• 国际版深度集成Claude-3.7-Sonnet(免费!)/国内支持DeepSeek-R1和Doubao-1.5• 支持自然语言生成/解释代码/build功能(类似Cursor的compose)• 内置知识库问答功能• 跨平台支持Windows/macOS由于”你懂的“原因,字节的Trae也分为国内版和国际版两个版本。国内版:https://www.trae.com.cn。

2025-04-01 10:02:09 860

原创 「沉思」实测:第一次,AI 自己把活干、把钱赚(附:10+场景实践)

时长01:14在实时演示中,主角 AutoGLM 登场,参与了《读者》的有偿征文,全自动赚金币。“帮我在小红书上找一找有哪些「非网红、排队少、评分高」的北京宝藏餐厅”我说。然后,,时长01:22Chrome 被自动打开,搜索、跳转、加载、一页页浏览,一条条复制引用,各种页面陆续弹出。十多分钟后,一份美食报告出现在我眼前。更令我惊愕的是,“福满园 10 年以前还行,去年怀旧又去吃了,质量严重下降。尤其是红烧带鱼!不知道是不是换厨子了。”,发现有争议观点后,想到去交叉验证。

2025-03-31 22:05:38 895

原创 Agent领域,最大的黑马出现了。

虽然今年我已经体验过很多 Agent 产品,但今天,还是被智谱新发布的 Agent 能力给震撼到了。兄弟们,我刚刚体验完智谱新发布的 Agent 产品:AutoGLM 沉思。此刻难掩内心的激动,这是我目前见过最好最实用的 Agent。智谱这家公司人如其名,做事风格真是太质朴太低调了,冷不丁的就发布一个里程碑式的特性。今年被称为 Agent 的元年,我隐隐感觉,国内的公司智谱可能是 Agent 领域最大的黑马。模型公司下场做应用,这已经是行业众人皆知的事情。

2025-03-31 22:03:34 864

原创 2万字实录来了!台大教授李宏毅一节课带你搞懂AI Agent

编者按:本文是台大教授李宏毅讲授AI Agent的爆火油管视频的文字稿。内容层层递进,是学习和理解AI Agent难得的好教材。由于原视频较长,为方便订阅读者们高效学习,智能超参数特地整理出来这节课的文字实录。原油管视频请访问本文最下面的原文链接。以下,enjoy:今天我们要讲的是AI agent,这是一个现在非常热门的话题。在课程开始之前,先讲一个免责声明,我知道你在各个地方可能都听过AI agent这个词汇,它是一个被广泛应用的词汇,每个人心里想的AI agent可能都不一样。

2025-03-29 11:49:05 759

原创 7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用

深夜重磅!阿里发布并开源首个端到端全模态大模型——,来了。仅靠一个,就能搞定文本、音频、图像、视频全模态,并实时生成文本和自然语音。堪称7B模型的全能冠军。你的iPhone搭载的很可能就是它!现在打开Qwen Chat,就能直接和它实时进行视频或语音交互:话不多说,先来看一波能力展示。在大街上同它视频通话,它能正确识别周围环境,按照你的需求为你推荐餐馆:,时长00:55走进厨房,它又化身“智能菜谱”,一步步指导你变成大厨:,时长01:16。

2025-03-29 11:29:59 817

原创 收藏!拆解CNN、RNN、Transformer、扩散模型、GAN与深度强化学习的变体与未来演进方向

本文深入探讨了深度学习领域中几类重要模型的变体研究与未来演进方向,涵盖卷积神经网络(CNN)、循环神经网络(RNN)及其变体(LSTM、GRU)、Transformer(BERT、GPT、Vision Transformer)、扩散模型、生成对抗网络(GAN)以及深度强化学习模型。

2025-03-28 11:56:28 899

原创 智慧农业 | 44页 | AI 智慧农业模型,赋能农业信息化建设,开启农业新时代

我国农业存在生产分散、规模小,现代农业经济组织发展滞后,融资困难,流通环节多、损耗大、成本高,信息不对称以及农产品缺乏有效分级体系等问题。与美国、荷兰、以色列等农业发达国家相比,在规模化、智能化、科技应用等方面存在差距。传统农业依赖人工管理,技术手段落后;现代农业虽有进步,但在数据管理和分析平台的智能化、灾害预警等方面仍需提升;智慧农业则能实现多样传感数据的采集、智能处理和远程控制等。智慧农业是农业未来趋势,应注重服务农业,而非替代农业,要以服务三农为宗旨,推动农业智慧化变革。

2025-03-28 11:40:12 1084

原创 一文搞懂什么是向量嵌入Embedding?

一起来开个脑洞,如果诸葛亮穿越到《水浒传》的世界,他会成为谁?武松、宋江、还是吴用?这看似是一道文学题,但我们可以用数学方法来求解:诸葛亮 + 水浒传 - 三国演义 =?文字本身无法直接运算,但是如果把文字转换成数字向量,就可以进行计算了。而这个过程,叫做“向量嵌入”。因为具有语义意义的数据(如文本或图像),人类可以分辨它们的相关程度,但是无法量化,更不能直接计算。例如,对于一组词“诸葛亮、刘备、关羽、篮球、排球、羽毛球”,我们可能会把“诸葛亮、刘备、关羽”分成一组,“篮球、排球、羽毛球”分成另外一组。

2025-03-27 11:30:04 312

原创 智能客服搭建实战篇

下面以一个企业数字化服务的咨询公司的智能客服为例,介绍To B智能客服如何搭建。广义上来说,To C企业的智能客服应用更广,尤其是在售前咨询和售后争议解决方面,在数量级、AI场景丰富程度、SOP流程上都有更广的空间,但由于过往经验的限制(主要是知识库数据隐私限制),目前仅以To B企业数字化服务的咨询公司的智能客服来举例说明。

2025-03-27 11:20:36 747

原创 利用大型语言模型增强知识图谱查询

采用知识图谱(KGs)作为结构化、面向语义的、数据表示模型,显著提高了跨不同领域的数据集成、推理和查询能力。这在现代场景中尤为真实,例如工业5.0,其中人类、智能设备和生产过程产生的数据的整合起着至关重要的作用。然而,由于技术复杂性,非专家用户使用形式查询语言管理、检索和可视化知识图谱中的数据可能很困难,从而限制了它们在工业环境内的应用。因此,我们引入了SparqLLM框架,该框架利用检索增强生成(RAG)解决方案来提升对知识图谱(KGs)的查询。

2025-03-25 15:43:47 1106

原创 基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知

LLM 本身只是一些神经网络参数, 就拿 DeepSeek-R1 来讲,模型本身存储了, 实际运行起来需要行业级别的服务器配置, 消费级别的个人电脑不能直接运行,实际还涉及到硬件适配,需手动配置环境,编写分布式推理代码,处理量化与内存溢出问题现在通过ollama可以在消费级别电脑部署,上面涉及到的问题ollama帮我们完成,同时还涉及模型的管理,推理服务构建ollama开源项目地址: https://github.com/ollama/ollama。

2025-03-18 10:47:36 703

原创 医院本地化部署DeepSeek:硬件配置与成本预估

根据学霸的“能力等级”,即 DeepSeek 系统的不同版本,硬件配置需求如下表:注:以上表格为个人观点,请以实际需求为准。具体费用请咨询硬件供应商。综上所述,医院在进行 DeepSeek 系统本地化部署时,应根据自身的实际需求和业务场景,选择合适的硬件配置版本,以实现高效的医疗信息化服务。同时,要充分考虑预算因素,合理规划资金投入,确保在满足医疗需求的前提下,实现成本效益的最大化。

2025-03-18 10:44:50 355

原创 DeepSeek智能数据治理整体方案

前几天听了一场AI助力数据治理方案的讲解,特把PPT主要内容整理如下,虽然看起来很兴奋,但是咱们仍然需要脚踏实地+志存高远,夯实高质量的数据资产知识库,否则仍然避免不了垃圾进,垃圾出的窘境。高质量的数据资产知识库说起来很容易,但这需要企业长期的坚持地积累,可真不是一件容易的事,不可能某某领导一句话在基础不牢的前提下,AI就可以立即实现数据治理的目标了。

2025-03-17 21:22:46 1025

原创 Paper Reading | ATA: 大模型在股票交易中更擅长利用图片信息

评估LLMs在动态、未见过的数值推理任务中的能力,特别是在与现实更接近的金融场景下,探究LLMs在代数推理(处理文本数值数据)和几何推理(处理可视化数值数据)方面的表现差异。

2025-03-17 21:18:50 871

原创 大模型技术工程师:抓住时代机遇,成为行业精英!

伴随AI大模型的火热,中国科技大厂们正在掀起一场「跑步AI化」的风暴。从顶层战略到业务线重构,AI无疑已成为大厂们押注未来的新故事。

2025-03-14 10:28:24 372

原创 10分钟搞定,DeepSeek+Ollama+AnythingLLM 本地部署完全指南,打造专属知识库。

1、列出本地可用的模型列表:ollama list2、启动模型:ollama runmodel_name3、查看模型信息:ollama showmodel_name4、删除指定模型:ollama rmmodel_name2 部署AnythingLLM2.1 下载安装打开官网地址:https://anythingllm.com/desktop,根据自己的系统选择下载的版本。默认路径安装,或者修改默认安装路径都可以。安装完成界面:点击完成自动跳转到AnythingLLM界面。

2025-03-14 10:25:47 398

原创 PsyDT:利用大模型构建具有个性化咨询风格的心理咨询师数字孪生体SoulChat2.0 - 华南理工等

利用LLMs对三种合成的对话数据与真实案例的相似度进行评估对比。相比于Smile和SoulChat1.0,SoulChat2.0提出的数据生成方法(PsyDT_Prompt),在所有话题上都能很好地构建高质量的数字孪生数据。同时,我们在谈话技术(提问探询、反馈与总结、问题解决和指导)、状态与态度(开放性和价值中立、情感控制)、关系建立、疗法技术应用这4个专业维度上对SMILECHAT、SoulChatCorpus、CPsyCounD以及我们建立的PsyDTCorpus进行了比较。

2025-03-13 10:32:25 1006

原创 从零看懂大模型:一篇让你彻底理解AI核心的“通关秘籍”

大模型不是魔法,而是新时代的“电力系统”。真正的赢家• 看清技术本质,不被参数规模迷惑• 聚焦场景价值,用最小成本验证需求• 保持认知进化,速度 > 技术迭代速度。

2025-03-12 11:14:10 954

原创 大模型扫盲系列——大模型实用技术介绍(上)

从公式知,输入是正的,则直接输出该值;如果输入是负的,则输出0。ReLU因其简单性和效率在深度学习中非常流行。它有助于解决梯度消失问题,加速了神经网络的收敛,并且计算简单。

2025-03-12 11:10:59 619

原创 100个AI岗位,00后就业首选AI赛道,应届大学生找工作收藏!零基础入门到精通,看这篇就够了!赶紧收藏!

自从2022年11月30日Gatchap发布,AI如同一股强劲的浪潮,带着危机席卷了各行各业,不仅重塑了商业模式和工作流程,更是颠覆了传统就业思维,同时带来了前所未有的就业新机遇。麦肯锡全球研究院发布的《工作的新未来》报告显示:“在2030年至2060年间,将会有50%的现有职业被AI取代。”算一下就5年时间了,取中是2045年,也只是20年后。AI市场规模持续扩大是必然趋势,这直接带动了AI人才需求的增长。无论是大型跨国企业还是初创公司,都在积极招募具有AI相关背景的人才来推动技术创新和业务优化。

2025-03-10 21:15:04 1595

原创 大语言模型(LLM)技术深度洞察:进展、问题、趋势,零基础入门到精通,看这篇就够了!赶紧收藏!

大型语言模型是一种旨在通过分析大量数据生成和理解类似人类文本的人工智能模型。这些基础模型基于深度学习技术,通常涉及许多层和大量参数的神经网络,使它们能够捕捉到它们训练的数据中的复杂模式。大型语言模型的主要目标是理解自然语言的结构、语法、语义和上下文,以便它能够生成连贯且上下文适当的响应或用相关信息完成给定的文本输入。这些模型在包括书籍、文章、网站和其他文本内容在内的多样化文本数据源上进行训练,这使它们能够对广泛的主题生成响应。

2025-03-10 21:06:13 1065

原创 QwQ-32B:更小尺寸,性能比肩全球最强开源推理模型

近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。这一次,我们探讨了大规模强化学习(RL)对大语言模型的智能的提升作用,同时推出我们。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外,我们还在推理模型中。

2025-03-08 11:04:04 1186

原创 阿里QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。自2023年8月以来,通义系列累计推出了从Qwen、Qwen1.5、Qwen2到Qwen2.5数十款大模型,覆盖5亿到千亿级别的参数规模,并开源了超200款模型,支持29种语言。开源的Qwen系列凭借卓越的性能,数次登顶国内外权威榜单,还多次冲上HuggingFace、Github热榜,成为开发者心中的「爆款」。此外,QwQ-32B不只是一个推理模型,还集成了先进的Agent相关能力。

2025-03-08 10:46:44 1072

原创 一个邀请码炒到5万元,Manus刷屏!记者实测:一句话就能写文章敲代码,DeepSeek这样评价→

△ 让Manus一夜“刷屏”的演示视频Manus到底是“何方神圣”?一起来看看——日前,来自中国的创业公司Monica正式对外发布通用型AI Agent产品Manus。据团队介绍,据悉,这是全球首款真正意义上的通用AI Agent。**官方宣称,Manus不仅仅是一个只会聊天的对话式AI工具,而是一个真正的自主智能体(Agent)。**从介绍来看,相较于目前的大模型产品,作为通用型Agent,Manus定位于一位性能强大的通用型助手,对于用户不仅仅是提供想法,而是能将想法付诸实践,真正解决问题。

2025-03-07 16:45:48 1235

原创 一夜之间火爆全网!又一个中国AI产品刷屏

并且,不同于此前各类功能相对简单的人工智能助手,Manus拥有具备超强学习能力和适应性的“数字大脑”,不再局限于单一任务,而是能够理解复杂指令、自主学习、跨领域协同,真正像人一样思考和行动。

2025-03-07 16:40:54 681

原创 邀请码炒到5万元!Manus一夜爆火,创始人为中国90后

3 月 6 日凌晨,科技圈再度迎来一个不眠之夜——一款名为 Manus 的产品在网络上迅速走红,成为热议焦点。这款由中国团队 Monica 推出的全球首款通用型 AI Agent,引发了全网抢邀的热潮。(Manus 地址:https://manus.im/)更令人惊讶的是,Monica 创始人竟是 90 后中国青年。Manus,源自拉丁语中的“Mens et Manus”,意为“心智与手”,寓意将创意和知识转化为实际行动。

2025-03-06 20:20:23 732

原创 实测 Manus:首个真干活 AI,中国造(附50个用例 + 拆解)

我想放一个视频:摄于2025年3月5日晚10点: Manus 发布之际此刻,中国团队在通用智能体赛道上,迈出了实质性的第一步。2025,东方破晓。

2025-03-06 19:58:05 1075

原创 手把手教你用LangChain自动写SQL做数据分析可视化

从数据库里拿到原始数据后,我们得给用户生成一个人类能看懂的自然语言响应。这就得利用语言模型的能力,把原始数据转换成容易理解的内容。我们可以写一个函数,它接收(用户问题)、schema(结构)、sql(SQL 查询)、datatemplate = """根据表结构、问题、SQL 查询和 SQL 响应,提供一个结构化的、人类可读的响应。仅提取响应中可用的字段,并正确格式化它们。{schema}问题:{question}SQL 查询:{query}SQL 响应:{response}

2025-03-06 11:39:33 1016

原创 刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto

机器之心报道强化学习先驱 Andrew Barto 与 Richard Sutton 获得今年的 ACM 图灵奖。人工智能学者,再次收获图灵奖!和。他们都是对强化学习做出奠基性贡献的著名研究者,Richard Sutton 更是有「强化学习之父」的美誉。Andrew Barto 则是 Sutton 的博士导师。自 1980 年代起,两位学者在一系列论文中提出了强化学习的主要思想,还构建了强化学习的数学基础,并开发了强化学习的重要算法。两人合著的《》一直是强化学习领域最经典的教材之一。

2025-03-06 10:43:15 671

原创 TimeKAN:基于KAN的时间序列预测模型

时间序列预测(TSF)在金融、能源管理、交通流量规划和天气预报等多个领域具有重要应用。近年来,深度学习技术,特别是基于卷积神经网络(CNN)、Transformer和多层感知器(MLP)的方法,极大地推动了TSF的发展。然而,现实世界中的时间序列往往具有非平稳性和复杂的模式,这使得准确捕捉历史数据与未来目标之间的联系变得极具挑战性。为了应对时间序列中复杂的时序模式,越来越多的研究开始关注利用先验知识将时间序列分解为更简单的组成部分,为预测提供基础。

2025-03-05 11:03:29 708

原创 AI编程神器Cursor,保姆级教程来了!

如果你使用过 VScode 编程,那么你应该很熟悉这个界面,因为它就是 VScode 界面;但如果你和我一样是小白,只为提高工作效率,那么接下来的比喻可能辅助你理解:想象一下你正在一个设备齐全的厨房做菜。

2025-03-05 10:23:29 1695

原创 什么是神经网络?神经网络开发框架——PyTorch和架构Transformer的区别和联系

PyTorch就是工具,而Transformer就是理论;而理论指导工具。我们都知道大模型的本质是一个神经网络模型,因此我们学习大模型就是在学习神经网络模型;但了解了很多关于神经网络的理论,但大部分人对神经网络都没有一个清晰的认识,也就是说神经网络到底是什么?它长什么样?事实上所谓的神经网络本质上就是一个数学模型,里面涉及大量的数学运算;只不过其运算的主要数据类型是——向量,具体表现为多维矩阵。PyTorch和Transformer在神经网络的学习研究过程中,有两个东西是绕不过去的;

2025-03-04 11:45:36 1004

原创 利用LLM Agent和知识图谱自动生成研报

我们将使用crewAI平台来定义和运行Agent。

2025-03-04 10:29:00 643

原创 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)

语言模型」是一种「人工智能系统」,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关的文本,应用于翻译、摘要、聊天机器人和内容生成等领域。

2025-03-03 11:26:11 1001

原创 2025版最新大模型入门书籍推荐(非常详细)大模型零基础入门到精通,收藏这篇就够了

不少小伙伴都想要学习大模型技术,转战AI领域,以适应未来的大趋势,寻求更有前景的发展~~然而,在学习大模型技术这条道路上,却不知道如何进行系统的学习,所以本期书单就为大家奉献一场,从大模型理论基础到大模型工具应用,构建自己的LLM应用程序……应有尽有,如果你是AI小白,想要从入门开始学起,或者想要了解AI未来的发展趋势,也有相应的图书哦~~**▊《**张奇,桂韬,郑锐,黄萱菁 著。

2025-03-03 11:21:06 2336

原创 小白也能轻松理解的大模型入门锦囊!

*「微调(Fine-tuning)」**是给大模型提供特定领域的标注数据集,对预训练的模型参数进行微小的调整,使其更好地完成特定任务。通过微调,可以显著提升模型在特定任务上的性能。微调之后的大模型可以根据应用场景分为不同层次:通用大模型:类似于中小学生,具有广泛的基础知识,但缺乏专业性。行业大模型:基于特定行业的数据集进行微调。如金融证券大模型通过基于金融证券数据集的微调,可以得到一个专门用于金融分析和预测的大模型。这相当于大学本科生,具备了更专业的知识和技能。

2025-02-28 20:58:00 652

原创 千呼万唤始出来的 GPT 4.5,主打的只是一个“大”

GPT系列不是我们前沿的模型。一个月前你还很难想象OpenAI发布GPT的下一个大版本更新时,会这样说自己。但当2月27日OpenAI突然用一个直播发布了GPT4.5的时候,一切都已经发生变化。GPT的定位不再是OpenAI用来震撼外界的模型,而是一个逐渐退到舞台后方的“底座”;它的发布也不再是OpenAI引导行业叙事的大动作,而更多带上了防御的感觉;这是GPT目前“最大”的一款,也是它在舞台中心的最后一舞。OpenAI最初文档里的表述,后已删除。图源:推特。

2025-02-28 17:20:41 917

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除