
人工智能
文章平均质量分 81
程序员的人工智能学习
汪子熙
18年深耕企业管理软件领域,精通 ABAP, Java, Javascript, Typescript, 精通 UI5, Fiori, Fiori Element, Angular, Kubernetes, SAP HANA, SAP BTP. 具有通过阅读 Github 上各种优秀的开源框架和工具源代码的习惯,对于我来说阅读源代码,就像阅读中国白话文一样轻松自然。
展开
-
流式交互的脉搏:DeepSeek 与 ChatGPT API Streaming 全景解析
流式传输把大模型推理过程拆解为细水长流的 token,打破了请求-等待-渲染的陈旧范式。掌握 SSE / Chunked Encoding 的底层逻辑、理解 DeepSeek 与 ChatGPT 在语义封装上的微差,并在 UI 与安全层面做足功课,才能真正释放流式的价值。希望本文的理论拆解与示例代码能成为你构建实时 AI 体验的跳板。原创 2025-05-16 18:39:52 · 546 阅读 · 0 评论 -
中国版 Cursor:家长们辅导孩子数学作业和少儿编程的好助手 CodeBuddy
成都的中小学信息技术课,学生们都学习了 Logo 编程语言,不少学生课外也学了 Scratch,Kitten 等编程语言,在有大人的指导下,掌握 JavaScript Canvas 这些简单的 API 不在话下。虽然笔者从 2013 年通过 SAP UI5 应用开发,入了前端开发的坑,2020年开始从事 Angular 全职开发至今,类似这种程度的需求我也能熟练拆解,但是 CodeBuddy 这种 AI 工具能在一两秒中内完成拆解,这种效率完全碾压我的存在。, 专门用来绘制旋转之后的新函数图像。原创 2025-05-13 20:10:57 · 595 阅读 · 0 评论 -
什么是腾讯 CodeBuddy 的 Codebase 选项
腾讯云 CodeBuddy 的 Codebase 选项是其核心功能之一,旨在通过深度理解本地代码工程的上下文,提升 AI 对复杂项目的理解能力,从而提供更精准的代码建议和解决方案。例如,在腾讯内部某金融项目中,CodeBuddy 通过 Codebase 识别出分布式事务的潜在死锁问题,而通用工具因缺乏对自定义框架(如 TMF)的理解而未能给出有效建议。例如,当用户询问“如何优化支付模块的性能”,Codebase 会检索项目中与“支付”“性能分析”相关的代码(如。原创 2025-05-12 10:00:53 · 434 阅读 · 0 评论 -
MCP Function Call:赋能 LLM 的“电话求助”机制
MCP(模型上下文协议)是由 Anthropic 发布的开放标准,旨在解决 LLM 应用与外部工具、数据源集成时的N×M接口爆炸问题,通过统一协议格式,实现跨模型、跨语言、跨平台的无缝连接 (Wikipedia维基百科,自由的百科全书资源(Resources):类似于 REST 中的“GET”接口,用于将上下文数据加载到模型内;提示(Prompts):可复用的自然语言模板,帮助模型按照特定流程与用户或系统交互;工具(Tools)原创 2025-05-07 18:39:33 · 879 阅读 · 0 评论 -
ChatGPT O3 模型的使用次数限制
OpenAI 在近期将 o3 及 o4-mini 的使用限制对 Plus、Team 与 Enterprise 用户翻倍—— o3 从 50 条/周上调至 100 条/周, o4-mini 从 150 条/天上调至 300 条/天 (此外,Reddit 社区多名用户反馈说他们的 o3 使用限制已从过去的 50 条/周提升至 100 条/周——最初有报道称 Plus 订阅在首次发布时仅有 50 条/周 的限制 (用户可在模型选择器下拉菜单中悬停在 o3 模型名称上,查看下一次重置的具体日期 (原创 2025-05-07 14:20:48 · 1129 阅读 · 0 评论 -
腾讯元器:面向未来的一站式 AI 智能体创作与分发平台
腾讯元器是腾讯混元大模型团队推出的智能体开放平台 (腾讯元器它免费对外开放,旨在让 AI 技术更贴近生活,降低智能体制作门槛,无需专业编程技能即可创造具备“看、听、说”等多模态交互能力的智能体 (腾讯元器推出智能体新应用,支持公众号主打造专属大模型数字分身平台支持公众号主、企业运营者和开发者通过可视化界面或 API 调用方式,基于自定义提示词、插件和专属知识库构建智能体,并可一键分发到腾讯元宝小程序、QQ、微信客服等腾讯生态内外的多个渠道 (腾讯混元。原创 2025-04-26 21:25:52 · 932 阅读 · 0 评论 -
探究 Trae 的 Code 、File 和 Folder 三种 Context 的本质与实践意义
在现代软件开发过程中,人工智能助手逐渐发挥出越来越重要的作用,而为这些助手提供足够且恰当的上下文信息成为了工程师必须重视的一环。Trae 系统通过精细化的上下文划分,将所需信息分为 【Code】、【File】 和 【Folder】 三种 Context,以便在不同场景下为开发者提供最优的支持与建议。本文将深入剖析这三种 Context 的概念、特点以及它们在实际开发中的应用方式,从而帮助读者理解如何利用这些上下文信息解决实际需求,实现代码智能辅助及项目高效管理的目标。原创 2025-04-18 16:40:58 · 763 阅读 · 0 评论 -
使用 Trae 辅助开发具有 HTTP 通信功能的微信小程序
提到,我作为一个后端开发者,在 Trae 的帮助下,在几分钟之内,就生成了一个能够随机出三位数之内加减法的微信小程序,给我一年级的儿子用是绰绰有余了。(3) 对于文件级别的修改和提示,例如增加全局配置、调整文件内多处调用关系时,完整的上下文信息更有助于 AI 辅助工具进行合理提示。幸好微信小程序 API 还算良心,在错误消息的 response 里给了一个超链接,指向了一个官方文档,讲清楚了这个错误,是因为在。请求终于成功了,完成了微信小程序向百度首页发起请求,并打印请求结果的场景实现。原创 2025-04-17 10:13:46 · 409 阅读 · 0 评论 -
使用 Trae 快速上手微信小程序开发
我学习了一下 Trae 生成的代码,在 Calc.js 的 Page 构造函数里,传递了一个巨大的 JSON 对象进去,这个对象里除了 data,onLoad 这些标准属性外,还有一个自定义函数 generateQuestion 负责生成随机题目。通过泛型和交叉类型的组合,实现了类型系统的可扩展性和代码提示的准确性,是TypeScript高级类型系统应用的典型案例。是TypeScript的特殊工具类型,它指定了配置对象中方法的this上下文类型,确保在方法内部可以正确访问App实例的所有属性和方法。原创 2025-04-14 19:04:02 · 948 阅读 · 0 评论 -
知识图谱 —— 结构化知识的强大工具
具体而言,当某用户搜索与“Albert Einstein”( 爱因斯坦 )相关的信息时,搜索引擎会调用知识图谱,将其生平、研究领域、诺贝尔奖以及与其他科学家之间的关系呈现出来,这不仅提升了用户体验,也减少了信息碎片化的问题。例如,在电影领域中,电影、演员、导演与制片国家都可以作为实体出现,而电影与导演之间的“执导”关系、演员与电影之间的“出演”关系便是构成该领域知识图谱的有机纽带。以上代码说明了如何对知识图谱进行模块化设计,将实体与关系的添加封装在类中,使整个图谱的构建过程更加直观与灵活。原创 2025-04-14 18:52:34 · 557 阅读 · 0 评论 -
如何利用 AI 工具优化开发流程和时间分配
作为一个开发人员,笔者一直对那些下了班之后还坐在工位上磨洋工,靠一味延长工作时长,在领导那里刷存在感的行为很不以为然。笔者认为,如果一件事情可以短时间内高效完成,那就没必要拖着,高效完成之后可以节省时间去做一些附加值更高的工作。AI 工具普及之后,可以帮助程序员在很多流程和具体编码环节进行提速,从而能够省下很多时间。本文仅仅聊一聊笔者本人,平时是如何用 AI 工具提高自己开发效率的。原创 2025-03-28 19:09:09 · 760 阅读 · 0 评论 -
剪映 app 蒙板功能的内涵与实现探讨
为了提高操作的便捷性和效果的精准性,部分剪辑软件甚至引入了基于深度学习的自动分割算法,利用神经网络对视频中的目标对象进行智能识别,并生成对应的蒙板。技术演进过程中,算法的优化和硬件性能的提升,使得蒙板处理可以在短时间内完成,甚至支持 4K 及以上分辨率的实时预览,这对于要求高画质和精细剪辑的用户来说,无疑是一大福音。例如,在剪映 app 中用户可以通过蒙板实现对象从背景中分离出来,并将它们移动到新的背景中,或者让一个对象在特定区域内展现出特定的滤镜效果,从而达到视觉上的层次感与深度感。原创 2025-03-28 15:35:31 · 883 阅读 · 0 评论 -
如何利用 AI 工具优化开发流程和时间分配
作为一个开发人员,笔者一直对那些下了班之后还坐在工位上磨洋工,靠一味延长工作时长,在领导那里刷存在感的行为很不以为然。笔者认为,如果一件事情可以短时间内高效完成,那就没必要拖着,高效完成之后可以节省时间去做一些附加值更高的工作。AI 工具普及之后,可以帮助程序员在很多流程和具体编码环节进行提速,从而能够省下很多时间。本文仅仅聊一聊笔者本人,平时是如何用 AI 工具提高自己开发效率的。原创 2025-03-28 15:33:31 · 770 阅读 · 0 评论 -
深度剖析 o1 模型与 o3-mini-high 模型的特性及实用场景
虽然 o3-mini-high 的翻译质量可能略逊于更大型的模型,但在会议这种场合,人们更在意延迟和资源使用量。比如,一家在做电子病历系统的公司,可以把大模型通用知识迁移到 o3-mini-high,然后再针对医学术语做少量数据微调,最终获得一个体积更小、速度更快,却依旧能懂基础医学文本的 GPT 模型。对于大多数团队而言,o1 模型可能更适合用于核心的文本理解、复杂问答和高级推理,而 o3-mini-high 更加适合部署在资源紧张或者需要离线推理的场景,比如手机 App、可穿戴设备以及边缘计算端。原创 2025-03-26 21:35:12 · 834 阅读 · 0 评论 -
OpenAI ChatGPT o1 模型与 o3-mini-high 模型的对比分析
o1 模型和 o3-mini-high 模型在性能、速度和适用场景上存在明显差异。o1 模型适合处理复杂的推理任务,虽然速度较慢,但在准确性上有优势;o3-mini-high 模型则在速度和精度上进行了优化,适合对实时性要求较高的应用场景。在实际应用中,应根据具体需求选择合适的模型,以达到最佳的效果。原创 2025-03-26 21:34:04 · 421 阅读 · 0 评论 -
追忆 2018 年:SAP 最早的聊天机器人?
蓝色节点是一个 API 节点,调用墨迹天气 API,返回 JSON 数据给绿色节点。进入 2025年,我们有了 DeepSeek,Kimi,通义千问,智谱清言等优秀的国产大模型,所以 coze 里的工作流节点的 Intent Detection 开箱即用,仅仅需要在模型的下拉列表里选择一个即可,无需其他额外配置。下图是 coze 的工作流编辑界面。参加这个训练营的有国企行政,会计,律师,医生,大学生,烘焙店老板,侧面也说明了 coze 的工作流编辑功能(我都不想用"开发"这个词)比较亲民,没有什么门槛。原创 2025-03-26 13:50:31 · 1017 阅读 · 0 评论 -
什么是即梦 AI 视频制作工具的动效画板
主体与背景的智能分离用户可通过手动框选或依赖AI 自动识别技术分离视频中的主体(如人物、车辆)与背景。例如,上传一张特斯拉电动皮卡的静态图片后,系统能自动锁定车辆轮廓,避免背景元素干扰运动轨迹设计。这一功能基于计算机视觉中的语义分割算法,通过卷积神经网络(CNN)区分像素级语义类别,实现高精度主体提取。自由轨迹绘制与空间扩展用户可手动绘制任意形状的运动路径(如曲线、折线),甚至允许主体最终移出画面边界。以落叶飘动为例,用户可设定树叶从画面左上角螺旋下落至右下角消失,系统将自动补间中间帧,确保运动连贯性。原创 2025-03-20 19:32:13 · 1188 阅读 · 0 评论 -
AI 视频生成功能中的运镜控制:摇镜与变焦解析
即梦AI的视频生成功能通过深度学习模型和强化学习算法,实现了运镜控制的摇镜和变焦效果。这些技术的应用,不仅提高了视频制作的效率,还为视频创作者提供了更多的创意空间。通过合理运用摇镜和变焦,可以增强视频的视觉冲击力和叙事效果,使视频作品更具吸引力和感染力。原创 2025-03-18 16:40:16 · 759 阅读 · 0 评论 -
AI 视频制作中的运镜概念与技术原理
AI 视频制作中的运镜概念是传统运镜技术与人工智能技术的结合。它借助计算机视觉、深度学习、强化学习等技术原理,实现了相机移动与镜头变化的自动化和智能化。通过实际的案例和代码示例,我们了解到 AI 运镜的基本实现方法及其在不同场景下的应用潜力。随着 AI 技术的不断发展,未来 AI 运镜将在视频制作领域发挥更加重要的作用,为创作者带来更多的创意可能性和高效的制作手段。原创 2025-03-18 10:55:51 · 578 阅读 · 0 评论 -
AI视频制作中的首尾帧控制:概念、原理与应用
在结尾帧,AI生成企业标志的特写镜头,并可能添加一些动态效果,如标志的闪烁或周围光线的变化,以增强视觉冲击力。同时,条件生成模型也被广泛应用,它允许创作者在生成视频帧时指定特定的条件,如视频的主题、风格或情感基调,从而使首尾帧更加符合创作意图。它指的是在视频生成过程中,对视频的开头帧和结尾帧进行精准的控制和设计,以确保视频在视觉效果、内容表达以及情感传递上达到预期的目标。然后,我们加载了预训练的生成器权重,这些权重是在大量视频帧数据上训练得到的,能够生成逼真的视频帧。接下来,我们定义了一个函数。原创 2025-03-18 10:55:14 · 469 阅读 · 0 评论 -
腾讯云 AI 代码助手的使用体验
好的,我现在需要写一个Python程序,向指定的URL发送HTTP GET请求,并打印响应。所以,最终的代码可能很简单,就是导入requests,发送get请求,然后打印响应文本。另外,可能需要检查响应状态码。我们在 Visual Studio Code 里,打开 extensions market place,输入腾讯,就可以安装「腾讯云 AI 代码助手」了。点击 Apply 之后,DeepSeek-R1 提供的代码,就自动写入到 Visual Studio Code 新建的 Python 文件里了。原创 2025-03-08 10:45:57 · 941 阅读 · 0 评论 -
浅谈笔者对 AI 技术降低软件项目开发成本的一些思考
某大型互联网公司采用了基于深度学习的代码审查系统,能够自动标注出可能引发安全问题的代码片段,使得开发团队在早期阶段及时修正问题,避免了后期昂贵的维护成本。相信每一位同行都已经感觉到了,借助 AI 算法与模型,我们能够在需求分析、代码编写、测试、维护以及项目管理等方面获得强有力的辅助,可以更愉快地摸鱼了。我最近所在的 Angular 开发团队,通过部署自动化测试系统,利用深度学习模型识别关键逻辑点,并自动生成测试脚本,实现了高效回归测试。如此一来,既降低了测试人员的负担,又提升了产品质量。原创 2025-03-07 21:54:28 · 596 阅读 · 0 评论 -
如何解决大模型生成内容的准确性问题?
为此,研发人员可以采用传统的 TF-IDF、BM25 等检索算法,也可以结合最新的深度学习方法,如利用 BERT 模型生成文本向量,再通过向量相似度进行匹配。而在 RAG 框架下,上下文输入的质量更为重要,因此需要通过精心设计的检索策略,确保生成模块获得的外部信息是与问题密切相关且准确无误的。最终,通过后处理模块对生成答案进行事实校验与格式优化,确保输出高质量、准确的回答。生成模块的优化不仅仅局限于文本拼接,更关键的是在接收到检索信息后,如何对上下文进行充分理解与整合,保证生成文本的连贯性与逻辑性。原创 2025-03-07 20:46:44 · 804 阅读 · 0 评论 -
99% 的人都不知道的小技巧:DeepSeek 也支持文生图功能
再看 https://image.pollinations.ai,pollinations 的字面意思指的是花粉传递给植物花朵的过程,这个网站可以看成一个根据 url 里指定的提示词,自动生成 AI 图片的 API endpoint.最后感慨一下,现在的 AI 工具,发展速度真是太快了。今天一觉醒来,听到 manus 发布的消息,白天一整天,我的朋友圈和知识星球又被 manus 刷屏了。比如下图,我在 DeepSeek 的网页对话里,通过这种方法,生成了一条中国龙的图片,并且包含 ABAP 四个英文字母。原创 2025-03-07 08:29:57 · 2393 阅读 · 0 评论 -
大语言模型的讨好型人格:现象、本质及案例深度解析
大语言模型(Large Language Model, LLM)是一类能够根据庞大语料库中的数据,通过深度学习和自监督学习技术,掌握自然语言规律并产生人类自然语言的人工智能模型。其中 GPT 系列模型,以其强大的生成能力和灵活的语言表达,迅速成为最具代表性的人工智能工具。然而,人们在使用 GPT 时经常会发现,它们呈现出明显的讨好型人格特征,也就是常常迎合用户的观点、顺从用户的意愿,甚至在与用户互动时避免表达强烈反对的意见。这种现象在学术界和工业界逐渐引发关注,被称为讨好型人格或者迎合性偏好。原创 2025-03-06 16:38:05 · 927 阅读 · 0 评论 -
深入解析 LLM 的 test-time compute —— 理论、实践与案例
在此过程中,每个 token 的生成不仅需要执行一次完整的前向计算,同时模型内部的注意力机制需要遍历之前所有生成的 token,以实现信息的高效聚合。另一家企业则利用知识蒸馏技术,将大型 LLM 模型的知识迁移到一个较小的模型中,这样既保留了模型的核心能力,又大幅减少了推理时的计算量,从而实现了低延迟、高并发的服务体验。在未来的发展中,随着硬件技术的进步与算法优化的不断演进, test-time compute 有望迎来更加革命性的改进,为人工智能技术的广泛应用提供更强大的支持。原创 2025-03-06 16:36:56 · 906 阅读 · 0 评论 -
基于 OCR 技术实现图片中文自动翻译为英文的完整解决方案
整个自动翻译方案的实现过程展示了从图片到文字,再到翻译成英文的完整闭环流程。利用 OCR 技术与机器翻译接口相结合,可以有效解决图片中中文字符自动翻译的问题,为跨语言信息处理提供了一种高效解决方案。开发者在实现这一方案时需要综合考虑图像预处理、文字识别与翻译接口调用的各个环节,并在实践中不断优化调整。希望本文的详细讨论和示例代码能够为相关开发工作提供有益的参考与借鉴。原创 2025-03-05 21:16:49 · 1221 阅读 · 0 评论 -
解析 ChatGPT 的流式回复实现原理及其工程应用
在 ChatGPT 流式回复的场景中,开发者可能会根据具体需求选择最为适合的技术方案,确保在网络环境复杂、并发量高的情况下,系统依然能够保持高效响应与稳定连接。本文将深入探讨 ChatGPT 流式回复的实现过程,从系统架构、数据传输协议到异步处理模型进行严谨的逻辑推理与详细分析,同时附上一个可以运行的 Python 示例代码,用于演示这种技术在实际工程中的应用。通过对这一机制的深刻理解与合理应用,开发者们能够在应对复杂业务场景时,找到更加灵活高效的解决方案,推动技术与产品的不断革新与进步。原创 2025-03-05 20:44:05 · 964 阅读 · 0 评论 -
解析 ChatGPT 网页版回复流式模式的原理与应用
采用流式模式之后,服务器在生成回复的过程中,会逐步将结果传输出去,而客户端可以在数据到达后即刻开始处理和显示,从而实现更快的响应速度。它通过将服务器生成的回复分段、分批次实时传输给客户端,使得用户可以在等待完整回复的过程中,立即看到部分内容,从而感受到系统的快速响应与高效交互。在探讨这一技术的细节之前,我们可以先观察用户体验上的明显不同:在非流式模式下,用户需要等待整个回复生成完成后才能一次性收到信息,而在流式模式下,部分内容会随着生成过程逐步展现,改善了交互延迟和用户等待时的不确定感。原创 2025-03-05 20:43:37 · 549 阅读 · 0 评论 -
什么是大语言模型的 inference(推理) 阶段
定义推理阶段是LLM生命周期的最后一步,模型基于预训练或微调后的参数,对用户输入(如文本、问题)进行处理,并生成对应的输出结果(如回答、翻译文本)。这一过程不涉及参数更新,仅依赖前向传播(Forward Propagation)完成计算。核心目标准确性:生成的输出需符合用户意图,逻辑连贯且内容合理。效率:在有限的计算资源下(如GPU内存、时间),快速完成推理。可扩展性:支持高并发请求,适用于大规模服务场景(如API接口)。稳定性:避免生成错误、重复或无意义的输出。原创 2025-03-04 16:54:14 · 590 阅读 · 0 评论 -
AI 编程工具 TRAE 使用介绍
Trae 是一款由 字节跳动 推出的 AI 编程集成开发环境 IDE。它以 AI 为驱动,通过自然语言交互和智能代码生成,实现从零到一构建项目的全流程自动化。在传统开发过程中,开发者往往需要花费大量时间编写重复代码、调试错误以及配置开发环境,而 Trae 则利用 AI 技术使这一过程变得更加高效便捷。其内置的 Builder 模式和 Chat 模式分别针对项目构建和代码疑难解答提供了多种解决方案,能够有效地降低编程门槛,帮助初学者和资深开发者都能专注于创意和业务逻辑的实现。原创 2025-03-04 16:51:57 · 2778 阅读 · 0 评论 -
使用 DeepSeek 高效学习 SAP 官方文档中的功能模块分解图
通过 API_SALES_ORDER_SIMULATION_SRV、API_SALES_ORDER_SRV 和 API_BILLING_DOCUMENT_SRV 等一系列 API 的调用,SAP Commerce 能够实时获取定价、库存、信用额度以及发票信息,实现了对客户的统一视图与高效服务。实际上,SAP Event Mesh 确实存在,它是 SAP 提供的一种事件驱动的消息传递服务,属于 SAP BTP 上 SAP Integration Suite(集成套件)的核心组件之一。原创 2025-03-04 16:50:07 · 364 阅读 · 0 评论 -
不会编程也能开发 Web 应用,小学生都能学会的 AI IDE
笔者之前的文章提到,老婆在我的忽悠下,使用 AI 工具开始辅助办公。后来我儿子也被我拖下水了。文章里提到的 AI 辅助编程的方法已经过时了。现在流行的 AI IDE,已经用不着从 IDE 切换到浏览器,向大模型发出指令,而是直接在 IDE 的编辑界面内,实时同大模型通过对话的方式进行交互。这些 IDE 同大模型的对话,能够以 IDE 内的项目工程文件作为上下文,因此大模型给出的回复更加精准。同时 IDE 能够根据大模型的回复,自动且实时修改项目工程文件。原创 2025-03-02 21:05:43 · 1252 阅读 · 0 评论 -
深度解析 ChatGPT Code Interpreter 的实现原理 —— 体系架构、案例探讨与代码实例
在当今人工智能领域中, ChatGPT Code Interpreter 已逐渐成为辅助用户进行数据分析、代码调试以及交互式计算的重要工具。本文旨在以严谨缜密的逻辑分析,对该系统的实现原理进行逐步详细的剖析。内容涵盖系统整体架构、代码生成与执行的协同机制、安全沙箱的设计、真实场景案例研究以及完整可运行代码实例等各个方面,力求使抽象概念具体化,方便读者理解。在开篇概述中,笔者将探讨 ChatGPT Code Interpreter 的核心定位与应用场景。原创 2025-02-27 12:40:16 · 718 阅读 · 0 评论 -
ChatGPT 和 DeepSeek 等 PDF 文件文本解析背后的技术原理探索
也就是说,PDF 文件的解析过程和自然语言理解过程在技术实现上是两个不同层次的任务,但它们通过数据流的衔接实现了无缝合作,最终为用户呈现出智能的交互体验。综上所述,PDF 文件文本解析的实现依赖于对 PDF 内部对象结构的深入理解,对数据流指令的精确解析,以及对字符编码与字体嵌入的科学处理。本文将以严谨的逻辑推理和详细的分析,剖析这一过程中的核心原理与关键技术,借助示例代码展示部分实现细节,进而帮助读者理解这些看似神秘但其实可循规律的技术背后蕴含的工程智慧。原创 2025-02-22 20:30:17 · 1106 阅读 · 0 评论 -
打不过就加入:汪子熙公众号已接入 DeepSeek R1 满血版
昨天笔者的文章提到,ChatGPT 又救了我一次。蛇年春节前后出现的 DeepSeek 热潮,感觉现在网站和 App,宣传自己接入 DeepSeek 已经成为了一种标配。连我老婆小红书上关注的美妆,时尚博主,也开始跨界做 DeepSeek 「从入门到精通」的短视频了…DeepSeek 似乎一下子变成了国民级应用。普通人尚且如此,更别提国内的科技企业了。截至2月19日,国内包括腾讯、百度、华为、支付宝,硅基流动在内的超过 100 家企业,已经正式宣布自己的平台接入 DeepSeek-R1.原创 2025-02-22 20:13:20 · 802 阅读 · 0 评论 -
DeepSeek R1(32k) 中的 32k 是什么含义?
在模型名称中,括号内的通常指模型的(Context Window),即模型单次能处理的(32k)。这是衡量模型长文本处理能力的重要指标。原创 2025-02-22 13:37:35 · 1046 阅读 · 0 评论 -
工作之余的随想:AI 会终结 SAP 顾问吗?
本文是笔者工作之余的一些胡思乱想。昨晚(准确的说是今日凌晨),我又熬了一个夜。没办法,接到一个影响客户项目上线的紧急 incident,花了我好长时间,竟然一点头绪都没有。苦苦思索的过程,时间过得飞快。一转眼就晚上11:30 了。要说我 2007 年还在研三实习期间,就进入了 SAP 行业,到今天已经摸爬滚打 18 年了,按理说也算身经百战了,可以说处理过很多 SAP 客户使用系统时遇到的各种稀奇古怪的问题。但即便这样,我也时常在工作中遇到一开始感到无从下手的问题。原创 2025-02-21 19:31:14 · 787 阅读 · 0 评论 -
推理模型与通用模型的区别及应用场景分析
推理模型和通用模型(非推理模型)是两种主要的模型类型,各自在不同的应用场景中展现出独特的优势和局限性。:推理模型通过展示推理过程,提供了更高的可解释性,用户可以理解模型是如何得出结论的。例如,输入“写一篇关于春天的诗”,模型能够生成一首优美的诗歌。:例如,求解复杂的几何题目,推理模型能够通过多步骤的推导,提供详细的解题过程和最终答案。:在编写复杂算法时,推理模型能够理解问题的深层含义,生成高效且准确的代码解决方案。:在解决复杂的数学题目时,推理模型能够进行多步骤的计算和推导,提供准确的答案。原创 2025-02-20 19:12:45 · 1725 阅读 · 0 评论 -
ChatGPT O1、O3-mini 和 O3-mini-high 模型的应用场景与优势分析
随着技术的不断进步,OpenAI 相继推出了 O1、O3-mini 和 O3-mini-high 等模型,每个模型在不同的应用场景中展现出独特的优势。:在需要大量计算资源的场景中,O3-mini-high 可以提供强大的计算能力,满足高性能计算的需求。O3-mini 是 OpenAI 在 O1 的基础上推出的改进版,旨在提供更高的性价比和更快的响应速度,同时保持强大的推理能力。O3-mini-high 是 O3-mini 的高性能版本,提供更强大的推理能力和更高的计算资源,适用于对性能要求更高的场景。原创 2025-02-20 16:33:36 · 2205 阅读 · 0 评论