
大数据与人工智能
文章平均质量分 87
专业介绍大数据是什么,能做什么,和传统的数据分析,大数据有什么区别,让你一步步深入了解大数据。
人工智能,当前最热门的话题,介绍常用的人工智能框架及使用。
xiangzhihong8
著有《React Native移动开发实战》1,2,3版本、《Kotlin入门与实战》1,2版本、《Weex跨平台开发与实战》、《React Native开发进阶》和《Flutter跨平台开发实战》和《Android应用架构实战》和《鸿蒙应用开发与实战》、《Vue3+TypeScrpt项目开发实践》即将出版
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用 Trae IDE 一键将 Figma 转为前端代码
智能体(Agent)是你在不同场景下的 AI 助手。自定义智能体后,你可以灵活配置提示词和工具集,快速完成复杂任务。在 AI 对话框右上角点击设置,选择智能体。点击+ 创建智能体。图片在配置面板中:(可选)上传智能体头像。输入智能体名称,例如:“Figma 助手”。(可选)填写提示词,示例:“根据用户提供的 Figma 链接,精准还原 UI 设计,生成响应式 HTML 前端页面代码。结构清晰,视觉细节与设计稿高度一致,禁止擅自修改设计内容。在工具-MCP部分仅勾选。在工具-内置。原创 2025-09-18 11:40:20 · 1082 阅读 · 0 评论 -
基于Elasticsearch Serverless的多模态商品搜索实践
即空间中两点之间的直线距离。距离越小,代表两个向量越相似。原创 2025-08-12 19:36:43 · 1028 阅读 · 0 评论 -
Spring AI 1.0 提供简单的 AI 系统和服务
Spring AI 1.0,一个全面的 Java 人工智能工程解决方案,在人工智能领域快速发展的影响下,经过重要的开发周期后现已可用。该版本包括许多对 AI 工程师至关重要的新特性。以下是一些最突出的特性的快速概述。在本文中,我们将逐步介绍这些概念。可移植的服务抽象,使开发人员能够轻松、熟悉、一致且符合习惯地访问各种聊天模型、转录模型、嵌入模型、图像模型等。原创 2025-07-28 21:46:59 · 786 阅读 · 0 评论 -
比 Vibe Coding 强 100 倍!字节 Trae 2.0 登场
7 月 21 日,字节跳动的 AI 编程助手 Trae 正式发布 2.0 版本,并逐步开放使用权限。这个版本新增了 SOLO 模式 —— 一个具备上下文工程能力的系统,可基于完整信息进行任务规划和执行,支持从代码编写到功能交付的端到端开发流程。字节跳动宣布,Trae 2.0 带来全新的视觉设计,并引入了核心功能 SOLO 模式。SOLO 不仅仅是一个智能的上下文工程师,它能做的远不止协助编写代码,更能思考、规划、构建并交付端到端的完整功能。原创 2025-07-25 10:24:54 · 808 阅读 · 0 评论 -
将 Figma 设计稿转化为前端代码
智能体(Agent)是你面向不同开发场景的编程助手。你可以创建自定义智能体,通过灵活配置提示词和工具集,使其更高效地帮你完成复杂任务。在 AI 对话框的右上角,点击设置图标,然后在菜单中选择智能体。界面上显示智能体页签。点击右侧区域的+ 创建智能体按钮。智能体配置面板已打开。配置该智能体:(可选) 上传智能体的头像。输入智能体的名称(例如:Figma 助手)。(可选) 配置智能体的提示词。参考提示词如下,你可以直接使用或根据需求制订提示词。原创 2025-07-23 10:03:11 · 1572 阅读 · 0 评论 -
180 天狠赚 5.7 亿,8 人团队全员财富自由,最大功臣是 Claude 和 Gemini
我花了大量时间构建自动化工作流,原创 2025-07-22 10:11:00 · 820 阅读 · 0 评论 -
Kimi K2 发布两天即“封神”,80% 成本优势追平 Claude 4
近日,国内大模型独角兽月之暗面发布并开源的最新一代 MoE 架构基础模型 Kimi K2,不断在海外掀起热议。有最新数据显示,推出不到两天,该模型在大模型 API 聚合平台 OpenRouter 的 token 使用量就超越了马斯克创立的 xAI。前不久,xAI 刚发布号称“全球最强 AI”的 Grok 4。据官方介绍,作为月之暗面首款开源发布的旗舰模型,Kimi K2 的总参数量达到 1 万亿(1T),激活参数为 32B,现已在 Kimi Web 端和 App 端中上线。原创 2025-07-21 18:03:36 · 1072 阅读 · 0 评论 -
如何使用Python做AI,推荐13个开源项目
学习人工智能,很多人第一步就被难住了:概念太多、资料太杂,真正能让你动手操作、学以致用的资源却很少。不过我们可以借助GitHub上的项目来学习Python与AI,效果立竿见影。通过这些项目,既掌握了理论知识,又通过实际编码把知识变成了能力。原创 2025-06-30 10:33:44 · 1366 阅读 · 0 评论 -
SongGeneration,腾讯AI Lab开源的音乐生成大模型
SongGeneration:腾讯AI Lab推出的AI音乐生成大模型,以其卓越的音质、音乐性和生成速度在音乐AIGC领域脱颖而出。基于LLM-DiT融合架构,SongGeneration在多个维度上超越了多数开源模型,部分指标甚至媲美商业闭源模型。它具备文本控制、风格跟随、多轨合成和音色跟随等功能,广泛应用于短视频配乐、游戏音效、虚拟人演出、商业广告及个人音乐创作等场景,助力AI音乐创作迈向“智能共创”的新阶段。原创 2025-06-21 10:03:34 · 2021 阅读 · 0 评论 -
Auto Think,快手开源的自动思考大模型
Auto Think是由快手Kwaipilot团队倾力打造的KwaiCoder-AutoThink-preview自动思考大模型。该模型专注于解决深度思考大模型中普遍存在的“过度思考”问题,创新性地提出了全新的自动思考模型训练范式,并基于传统强化学习算法(GRPO)研发了带有过程监督的强化学习方法Step-SRPO,显著提升了模型在复杂任务中的表现。原创 2025-06-08 09:52:07 · 701 阅读 · 0 评论 -
TrackVLA,银河通用推出的纯视觉端到端导航大模型
TrackVLA 是一款由银河通用倾力打造的产品级端到端导航大模型,它将视觉感知、语言理解、自主推理等核心能力融于一体。TrackVLA 依赖纯视觉输入,无需依赖预先构建的地图,即可在复杂环境中实现自主导航和灵活避障。它能够理解自然语言指令,并据此识别和跟踪目标,从而实现从环境感知到动作输出的全闭环控制。TrackVLA 的诞生,旨在赋予机器人更强的自主性和智能交互能力,推动机器人技术从实验室走向现实生活,成为人类可靠的伙伴。原创 2025-06-04 08:54:37 · 618 阅读 · 0 评论 -
AgenticSeek,开源本地通用AI Agent,自主执行任务
AgenticSeek是一款完全本地化的开源AI助手,作为Manus的开源替代品,专为保护用户隐私而设计。它能够在本地设备上执行多种任务,包括网页浏览、代码编写和复杂项目的规划,确保所有操作和数据均在用户的设备上完成。原创 2025-05-30 19:12:33 · 1058 阅读 · 0 评论 -
LMEval ,谷歌开源的统一评估多模态AI模型框架
LMEval 是谷歌推出的开源框架,旨在简化大型语言模型(LLMs)在不同提供商之间的评估过程。它支持多种模态(文本、图像、代码)和多指标的评估,兼容 Google、、Anthropic 等主流模型提供商,能够有效节省时间和计算资源。原创 2025-05-28 21:24:31 · 768 阅读 · 0 评论 -
Pocket Flow,开源的轻量级AI应用开发框架,仅用100行代码实现
Pocket Flow 是一个极为简洁的 LLM(大型语言模型)框架,仅用 100 行代码构建而成。它以轻量级、无依赖及无厂商锁定为特点,旨在帮助开发者快速实现基于 LLM 的应用程序。Pocket Flow 支持多 Agents、工作流及检索增强生成(RAG)等强大功能,极大提升开发效率,特别适合追求简单高效的开发者。原创 2025-05-25 10:32:38 · 579 阅读 · 0 评论 -
AgentCPM-GUI,清华联合面壁智能开源的端侧GUI智能体模型
AgentCPM-GUI 是由清华大学与面壁智能团队联合开发的一款开源端侧图形用户界面(GUI)代理,专为中文应用进行优化。通过对大规模中文安卓应用界面数据的预训练,AgentCPM-GUI 显著增强了对 GUI 元素的理解和定位能力。在中文 Grounding Benchmark 和 Agent Benchmark 上,该产品均达到了最先进的性能标准,成为首个针对中文应用进行精细优化的开源 GUI 代理。原创 2025-05-17 22:12:33 · 1564 阅读 · 0 评论 -
Xianyu AutoAgent,AI闲鱼客服机器人
Xianyu AutoAgent是一款专为闲鱼平台开发的智能客服机器人系统,旨在提供全天候的自动化服务。它具备多专家协同决策、智能议价和上下文感知对话等功能,能够管理轻量级的对话记忆,利用完整的对话历史为用户提供更自然的交流体验。原创 2025-05-13 22:26:02 · 1930 阅读 · 0 评论 -
LegoGPT,卡内基梅隆大学推出的乐高积木设计模型
LegoGPT 是由卡内基梅隆大学开发的一款创新性乐高积木设计模型,能够根据用户的文本提示生成结构稳固、可组装的乐高模型。该模型基于自回归语言模型和大规模乐高设计数据集进行训练,用户只需输入简单的文字描述,LegoGPT 就能逐步构建出物理稳定的乐高结构,确保设计的可行性和组装性。原创 2025-05-12 22:40:19 · 1242 阅读 · 0 评论 -
HunyuanCustom, 腾讯混元开源的多模态定制视频生成框架
HunyuanCustom是一款由腾讯混元团队开发的多模态驱动定制视频生成框架,能够支持图像、音频、视频和文本等多种输入方式。该框架专注于生成高质量的视频,能够实现特定主体和场景的精准呈现。原创 2025-05-09 22:40:48 · 1280 阅读 · 0 评论 -
DeepSeek-Prover-V2,DeepSeek推出的开源数学推理大模型
DeepSeek-Prover-V2 是由深度求索团队 DeepSeek 开源的一款专注于数学推理的超大规模语言模型。该模型分为两个版本:DeepSeek-Prover-V2-671B 和 DeepSeek-Prover-V2-7B,分别拥有6710亿和70亿参数。作为 Prover-V1.5 的升级版,DeepSeek-Prover-V2 结合了混合专家系统(MoE)架构,具备超长上下文处理和多精度计算的能力,能够将自然语言问题转化为形式化证明代码。原创 2025-05-05 07:39:47 · 1154 阅读 · 0 评论 -
ByeCode,AI无代码开发平台,拖拽式操作构建应用
ByeCode 是一款先进的 AI 无代码平台,旨在帮助企业迅速创建数字名片、网站、小程序、应用程序及内部管理系统,无需繁杂的编码或开发工作。ByeCode 采用直观的可视化界面和拖拽式操作,使得非技术用户能够轻松上手。同时,它深度整合了 AI 大模型,支持智能交互与数据分析功能。ByeCode 为企业提供了从构建到部署、管理以及应用分析的全面支持,助力企业高效实现数字化转型,提升运营效率与用户体验。原创 2025-04-27 22:52:16 · 949 阅读 · 0 评论 -
DAM-3B,英伟达推出的多模态大语言模型
DAM-3B(Describe Anything 3B)是英伟达推出的一款多模态大语言模型,专门用于为图像和视频中的特定区域生成详细描述。DAM-3B的核心创新在于“焦点提示”技术与“局部视觉骨干网络”。焦点提示技术将全图信息与目标区域的高分辨率裁剪图相结合,确保细节不丢失,并保留整体背景。而局部视觉骨干网络则通过嵌入图像和掩码输入,利用门控交叉注意力机制,有效整合全局特征与局部特征,随后将这些特征传递至大语言模型以生成描述。原创 2025-04-26 11:32:37 · 1053 阅读 · 0 评论 -
MineWorld,微软研究院开源的实时交互式世界模型
MineWorld是微软研究院开发并开源的一个基于《我的世界》(Minecraft)的实时互动世界模型。该模型采用了视觉-动作自回归Transformer架构,将游戏场景和玩家动作转化为离散的token ID,并通过下一个token的预测进行训练。MineWorld具备并行解码算法,能够以每秒4到7帧的速度生成画面,支持实时互动,提供高质量的游戏体验。原创 2025-04-23 23:01:17 · 683 阅读 · 0 评论 -
iFable,AI角色扮演互动平台,自动生成沉浸式故事游戏
iFable 是一个以动漫角色为主题的互动角色扮演游戏平台,旨在为用户提供沉浸式的故事冒险体验。平台允许玩家通过简单的创意输入,利用AI技术生成独特的互动故事与游戏体验。iFable 的设计宗旨在于帮助玩家与虚拟角色建立情感连接,享受个性化和富有创意的角色扮演旅程。原创 2025-04-21 22:08:33 · 1006 阅读 · 0 评论 -
Trae,字节跳动推出的 AI 编程助手插件
Trae 插件是 Trae 旗下全新一代的人工智能编程助手(前身为 MarsCode 编程助手),以插件形式集成在本地开发环境中,具备极高的兼容性和灵活性,旨在提升开发效率和代码质量。它支持超过100种编程语言,兼容主流的VSCode和JetBrains编辑器。原创 2025-04-19 22:54:23 · 1651 阅读 · 0 评论 -
UniRig ,清华联合 VAST 开源的通用自动骨骼绑定框架
UniRig是清华大学计算机系与VAST联合开发的前沿自动骨骼绑定框架,专为处理复杂且多样化的3D模型而设计。基于强大的自回归模型和骨骼点交叉注意力机制,UniRig能够生成高质量的骨骼结构和精确的蒙皮权重,大幅提升动画制作的效率和质量。原创 2025-04-15 22:47:41 · 1305 阅读 · 0 评论 -
Firebase Studio,谷歌推出的云端AI 开发环境
通过 Nix 定制开发环境,包括系统软件包、语言工具、IDE 配置和应用预览,支持共享项目及整个开发环境配置。原创 2025-04-10 22:09:43 · 1939 阅读 · 0 评论 -
BabelDOC ,开源的 AI PDF 翻译工具
用户可以设定翻译模型,包括 OpenAI 的 API 密钥、模型名称及基础 URL,以满足不同的翻译需求。原创 2025-04-09 08:53:28 · 3775 阅读 · 0 评论 -
Midjourney V7,最新的AI图像生成模型
Midjourney V7 是 Midjourney 最新推出的人工智能图像生成模型,在图像质量、互动体验和创作效率等方面进行了显著提升。该版本引入了草稿模式,使图像渲染速度比标准模式快十倍,成本也减少了一半。用户现在可以通过语音指令进行实时创作,系统会快速响应并生成初步草图,支持用户随时对生成内容进行动态调整。原创 2025-04-07 10:35:47 · 828 阅读 · 0 评论 -
MusicMint ,AI音乐生成工具
MusicMint 是一款强大的人工智能音乐创作工具,旨在帮助用户轻松制作个性化的音乐作品。借助先进的 AI 技术,用户只需输入简短的描述或选择心仪的音乐风格,便能迅速生成独特的歌曲。该平台支持多种音乐风格,包括流行、摇滚、嘻哈等,并提供丰富的自定义选项,如乐器选择、情感设定和主题定义,以满足不同用户的创作需求。原创 2025-04-04 22:29:10 · 666 阅读 · 0 评论 -
Amodal3R ,南洋理工推出的 3D 生成模型
Amodal3R 是一款先进的条件式 3D 生成模型,能够从部分可见的 2D 物体图像中推断并重建完整的 3D 结构与外观。该模型建立在基础的 3D 生成模型 TRELLIS 之上,通过引入掩码加权多头交叉注意力机制与遮挡感知注意力层,利用遮挡先验知识优化重建过程。Amodal3R 仅依赖合成数据进行训练,在实际应用中展现出卓越的性能,显著优于传统的“2D 预测补全 + 3D 重建”两步法,为遮挡场景下的 3D 重建设定了新的标杆。原创 2025-04-02 23:17:26 · 1189 阅读 · 0 评论 -
RuBii,基于人工智能的二次元角色创作平台
RuBii是一款基于人工智能的二次元角色创作平台,允许用户设计和个性化定制虚拟角色,并与之进行互动。在RuBii,用户不仅可以探索和发现其他社区成员创造的角色,还能参与互动故事,分享自己的创作。该平台提供了一个沉浸式的环境,帮助二次元爱好者享受创作和交流的乐趣。原创 2025-03-30 21:28:22 · 9143 阅读 · 0 评论 -
AndroidGen,智谱推出增强大语言模型框架
框架通过收集人类任务轨迹基于这些轨迹训练语言模型,开发出无需人工标注轨迹的 Agent,显著提升 LLM 执行复杂任务的能力。无需人工标注轨迹,通过将轨迹中的每一步作为样本进行训练,充分挖掘数据集中的信息。和八款全球流行的移动应用程序(如 Google Maps、YouTube 等)的评测中,AndroidGen 显示出色,在真实设备环境中对自然语言指令的理解与交互能力。:通过检索已完成的类似轨迹,帮助 LLM 进行上下文学习,从而使智能代理的能力得以提升,促进其在简单任务与复杂任务间的泛化。原创 2025-03-26 22:52:16 · 1041 阅读 · 0 评论 -
Uthana,AI 3D角色动画生成平台
平台基于简单的文字描述、参考视频或动作库搜索,快速为用户生成逼真的动画,支持适配任何骨骼结构的模型。Dreamer(免费+早期访问):用户享受免费加早期访问的待遇,包括对任何角色或装备的无限预览(PreVis)、无限动作生成、调整、混合、修剪和剪辑工具,用户创建的动画将受到创意共享许可的保护,每月20秒动画生成额度。Pro(月费):价格联系客服,用户访问超过10,000个动作的库,包括手指数据,支持每月下载多达100个角色秒数的内容,用户能商用创建的所有动画,享受优先电子邮件支持。原创 2025-03-23 22:14:10 · 2447 阅读 · 0 评论 -
Wispr Flow,AI语言转文字工具
Wispr Flow支持100多种语言,具备自动编辑、上下文感知和低音量识别等功能,大幅提升写作和沟通效率。Flow Pro(专业版):每月$12,包含 Flow Basic 的所有功能,每周无限制字数,命令模式编辑,优先功能请求,提前访问新功能。Flow Teams(团队版):每位用户每月$10,包含 Flow Pro 的所有功能,至少3个席位,集中计费,管理控制。Flow Basic(基础版):免费,每周最多 2,000字,快速语音输入,添加词汇到词典,支持100多种语言。原创 2025-03-22 22:45:24 · 1050 阅读 · 0 评论 -
Cursor安装注册+基础配置+入门实操
官网地址:https://www.cursor.com/下载按钮会根据电脑系统来匹配,点击对应「Download」按钮进行下载。完成后,按步骤安装即可。安装完成后,即可点击图标打开软件。基础设置完成后,就需要选择注册账号或者登录已有的账号。如果你有谷歌或者 GitHub 账号,直接选择授权登录即可,非常方便。登录成功之后,网页会自动打开Cursor软件。原创 2025-03-21 11:20:40 · 3160 阅读 · 0 评论 -
GROOT N1,英伟达开源的人形机器人模型
GROOT N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GROOT N1 基于大规模人形机器人数据集训练,结合真实数据、合成数据和互联网视频数据,用后训练适应特定机器人形态、任务和环境。GROOT N1 基于双系统架构,视觉-语言模型负责推理和规划,扩散变换器则生成精确动作。GROOT N1 在模拟和真实世界测试中表现出色,在复杂多步任务和精准操作中优势明显,为材料处理、包装和检查等应用提供高效解决方案。原创 2025-03-19 22:25:14 · 1186 阅读 · 0 评论 -
MIDI,AI 3D场景生成技术
MIDI(Multi-Instance Diffusion for Single Image to 3D Scene Generation)是先进的3D场景生成技术,能在短时间内将单张图像转化为高保真度的3D场景。通过智能分割输入图像,识别出场景中的独立元素,再基于多实例扩散模型,结合注意力机制,生成360度的3D场景。具有强大的全局感知能力和细节表现力,能在40秒内完成生成,对不同风格的图像具有良好的泛化能力。原创 2025-03-15 19:56:06 · 884 阅读 · 0 评论 -
Botgroup.chat,开源AI聊天机器人
Botgroup.chat 是基于 React 和 Cloudflare Pages 的多人AI 聊天应用。支持多个 Al 角色同时参与对话,提供类似群聊的交互体验。用户可以自定义 AI角色的性格和模型,可以对特定 AI进行禁言操作。创新的聊天方式让用户能体验与多个 Al 一起交流,类似于在一个虚拟的社交群组中。原创 2025-03-15 12:09:20 · 2227 阅读 · 0 评论 -
保姆级HeyGen AI使用教程
HeyGen AI是一个创新的视频制作平台,它通过生成式人工智能技术,能够在短短几分钟内制作出令人印象深刻的专业视频。这个平台由Joshua Xu和Wayne Liang于2020年11月在洛杉矶创立,其使命是让视频创作变得简单,无论用户是否拥有技术背景或经验。原创 2025-03-14 22:09:40 · 775 阅读 · 0 评论 -
HeyGen数字人注册使用教程
如果您在国内从事短视频,自媒体创业或者爱好希望注册并使用Heygen数字人,下面是一些简单的步骤来帮助您入门。访问。点击网页上的“注册”按钮。输入您的邮箱地址和选择一个安全的密码。再次点击“注册”按钮来完成注册过程。Heygen数字人提供了一系列强大的功能,包括:创建数字人修改数字人外观为数字人添加服装和配饰为数字人配音生成数字人动画导出数字人模型。原创 2025-03-13 22:45:31 · 2943 阅读 · 0 评论