自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 收藏
  • 关注

原创 Meta SAM Audio:多模态音频分割的新纪元

Meta发布SAM Audio模型,开创多模态音频分割新时代。这一突破性技术允许用户通过文本描述、视觉点击或时间标记三种自然方式,从复杂音频中精准分离特定声音。

2025-12-19 07:54:40 342

原创 实测 Kandinsky 5.0 图编辑功能:与龙猫模型效果深度对比,结果出乎意料!

本文详细介绍了如何在RTX 4090显卡(24G显存)上运行Kandinsky 5.0图像编辑模型。经测试,在图像编辑方面龙猫模型可能更具优势。

2025-12-18 08:03:04 1103

原创 租用共绩算力4090实测龙猫图片编辑

【摘要】本地16GB显存显卡无法运行LongCat-Image项目,改用共绩算力平台租用4090显卡(24GB显存)成功运行。该平台提供免费算力申请,预装开发环境,但共享存储卷读写较慢。实测显示项目需17GB显存,通过CPU卸载优化仍无法在16GB显卡运行。编辑效果出色,成功将图片中的汽车替换为摩托车并保留自然阴影细节。建议大显存需求开发者使用云算力方案。(149字)

2025-12-17 08:09:16 587

原创 两周实测:Kiro与Trae cn谁是我更中意的AI IDE?

摘要:本文对比测试了Kiro和Trae cn两款AI编程IDE的使用体验。从插件生态、AI交互、智能程度和稳定性四个维度分析,Trae cn在远程开发适配、上下文捕捉、问题解决能力和终端执行稳定性方面表现更优。特别是在自动捕捉报错信息和多环境开发支持上优势明显,而Kiro存在模型限制和agent误判问题。综合来看,Trae cn更适合开发者日常使用,但两款工具都处于快速迭代阶段,未来表现可能发生变化。

2025-12-14 19:56:26 1255 2

原创 尝鲜 AWS Agentic IDE:Kiro 一周使用初体验

AWS推出的Kiro Agentic IDE带来了规范驱动开发的新体验。基于VS Code内核降低了上手门槛,但对WSL和Remote SSH插件兼容性不足。其核心Spec模式通过需求文档、设计文档和任务清单三阶段确保开发规范性,并能自动同步代码与文档。Vibe模式则提供快速原型开发能力。

2025-12-13 08:30:27 1254

原创 GLM-TTS智谱开源的工业级语音合成系统到底强在哪?

智谱开源工业级语音合成系统GLM-TTS,实现3秒音色克隆和低成本工业级效果。该系统仅需10万小时训练数据,单机4天完成预训练,支持多音字、数学公式等精准发音,MOS评分行业领先。

2025-12-12 07:56:47 1248

原创 GLM-4.6V:从视觉理解到行动执行

智谱AI发布开源多模态大模型GLM-4.6V系列,其中GLM-4.6V-Flash(9B)轻量版免费商用并开放全量权重,实现多模态技术普惠化。

2025-12-11 08:04:19 1812 2

原创 Open - AutoGLM开源:解锁AI手机时代,人人皆可打造智能终端助手

Open - AutoGLM的开源,是AI Agent领域的一次重要突破,更是行业生态共建的一次有益实践。它用技术开放打破垄断,用架构设计保障隐私,用完整工具链降低门槛,让“人人可造AI手机”从愿景变为现实。

2025-12-10 08:07:03 1480 1

原创 LongCat-Image:美团的轻量化图像生成与编辑新标杆

美团开源LongCat-Image图像生成与编辑模型,60亿参数轻量化设计实现SOTA性能。该模型创新性地采用"生成与编辑一体化"架构,支持15类细分编辑任务,尤其在中文文本渲染方面表现突出。

2025-12-09 07:56:49 1495 1

原创 当前主流免费AI编程IDE盘点:高性价比开发工具精选

随着AI编程技术的快速普及,越来越多开发者开始依赖AI工具提升编码效率。当前市场上,一批支持免费使用的AI编程IDE凭借强大的功能、低门槛的接入方式,成为个人开发者与中小团队的首选。

2025-12-08 10:42:59 1008 1

原创 Orchestrator-8B:近期HuggingFace上火热的小型模型

英伟达与香港大学联合发布了一项令人瞩目的技术突破——Orchestrator-8B,近期在HuggingFace上保持着相当高的热度。

2025-12-07 13:27:19 802 1

原创 2025年开源图生图模型盘点:Kandinsky 5.0、Qwen-Image与Z-Image

2025年开源图生图模型迎来技术突破,三大代表性模型Kandinsky 5.0、Qwen-Image和Z-Image各具特色。

2025-12-06 15:45:05 1324 1

原创 国内的大模型访问能访问墙外内容吗?

在大模型应用日益广泛的当下,其内容访问能力直接影响回答的准确性与实用性,尤其是对墙外优质技术资源(如GitHub、Hugging Face等平台内容)的获取能力,更是技术从业者关注的重点。

2025-12-05 14:17:06 603 1

原创 从像素到语义:图像分割技术的演进与实践

图像分割技术:从算法演进到行业应用 摘要:图像分割作为计算机视觉的核心技术,实现了从像素感知到语义理解的跨越。本文系统梳理了技术发展脉络:传统算法(阈值/边缘检测)依赖手工特征,深度学习(FCN/U-Net/DeepLab)实现自动特征学习,而SAM/YOLO等前沿模型则推动通用化与实时化突破。当前技术已广泛应用于医疗(病灶分割精度达93.16%)、自动驾驶(实时156 FPS)和工业检测等领域,其中联邦学习解决了医疗数据隐私问题,SAM3更实现零样本概念分割。

2025-12-04 18:48:23 524 1

原创 手机端侧智能助手:从被动工具到主动助手的进化之路

端侧AI助手迎来突破性进展:阶跃星辰开源4B参数轻量化模型GELab-Zero-4B-preview,实现主流安卓设备一键部署;字节跳动豆包手机助手首发端侧持久记忆与跨App操作能力。

2025-12-03 08:22:11 1455 1

原创 DeepSeek V3.2 特别版体验

DeepSeek发布双模型版本DeepSeek-V3.2标准版和V3.2-Speciale专业版。初步体验Speciale 特别版模型目前在输出完整性上仍有优化空间,确实还存在一定的不成熟之处。

2025-12-02 09:27:31 2071 1

原创 TRAE SOLO:使用初体验

TRAE SOLO国内版上线后,其SOLO模式展现出超越传统代码补全工具的潜力,成为全程陪跑的"编程伙伴"。

2025-12-01 11:18:57 2748 2

原创 Ilya Sutskever在最近访谈中的关键观点及对IT技术人员的启示

Dwarkesh Patel 与 Ilya Sutskever 近期进行了深度对话 ,个人及AI辅助整理核心观点及启示。

2025-11-30 13:34:33 1238 1

原创 当AI成为“大脑”:人类如何在机器时代找到不可替代的价值?

人脑“快慢系统”与AI架构的相似性,指出情感是人类内置的价值函数,强调在AI时代,人类应聚焦共情、道德判断与终身学习等不可替代能力,走向人机协同而非对抗。

2025-11-29 15:46:26 1046 1

原创 Windows系统设置Ollama使用GPU

如果系统中有多个 NVIDIA GPU,并且希望限制 Ollama 使用其中的一部分卡,可以通过设置CUDA_VISIBLE_DEVICES环境变量实现。变量值为以逗号分隔的 GPU UUID列表。Nvidia官方关于CUDA环境变量的参考链接地址:https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#env-varsGPU的UUID可以通过使用以下命令查看得到结果类似下图。

2025-11-28 10:13:54 487

原创 Black Forest Labs开源AI图像生成与编辑模型FLUX.2

Black Forest Labs发布新一代图像生成模型FLUX.2,包含Pro、Flex、Dev和Klein四个版本,满足不同用户需求。FLUX.2 [Dev]开源采用Apache 2.0许可。

2025-11-27 09:17:48 917 1

原创 1B参数实现多项SOTA:腾讯混元OCR开源模型体验

腾讯混元实验室开源的HunyuanOCR模型以仅1B参数量实现SOTA性能,在多项OCR测评中表现优异。

2025-11-26 10:13:01 1562 4

原创 微软Fara-7B :把浏览器“交”给 7B 模型,一台笔记本能走多远?

微软推出7B参数的Fara-7B模型,定位为高效计算机操作代理。该模型基于视觉解析直接操控设备界面,无需依赖可访问性树,可自动执行网页交互等任务。

2025-11-25 11:47:11 1476 1

原创 大模型测评技术

大模型评测体系正成为AI发展的重要支撑。通过科学评测体系,大模型能力将得到精准评估和持续优化,推动AI技术在各行业的健康发展。

2025-11-24 11:30:51 851 1

原创 筑牢大模型安全防线:京东JoySafety和Meta LlamaFirewall两款主流开源安全框架解析

聚焦当前最流行的两款开源框架——京东JoySafety、Meta LlamaFirewall,从技术架构、核心能力到落地实践进行解析。

2025-11-23 17:27:17 1344 1

原创 从 SAM3D 到 Marble —— 为什么“splats”正成为 3D 内容的新通用语?

3D模型格式正经历从传统Mesh到Gaussian Splats的技术跃迁。Splats通过数百万个"椭球+透明度"单元实现照片级渲染,兼具NeRF的质量和三角面的实时性。

2025-11-22 12:27:16 1391 1

原创 从“灵光”谈起:AI 应用的交互重塑

蚂蚁集团推出全模态助手「灵光」,实现从对话到交互应用的范式跃迁。

2025-11-21 11:27:42 959 1

原创 SAM3:从“分割一切”到“理解万物”

SAM 3实现了从"分割一切"到"理解万物"的跨越,支持通过自然语言、图像示例等多元提示方式完成概念分割。SAM 3D更突破性地实现了单图3D重建,大幅降低了3D内容创作门槛。

2025-11-20 16:47:52 2386 2

原创 李飞飞Marble 3D世界模型免费开放!实测体验Marble 的技术能做什么、还不能做什么

Marble验证了空间智能技术的商业价值,为世界模型商用化提供了初代样本,但距离实现真正的"智能世界"仍有技术鸿沟需要跨越。

2025-11-19 10:30:28 1355

原创 EverMemOS:陈天桥团队引领的AI长期记忆革命

盛大集团EverMind团队推出的开源长期记忆操作系统EverMemOS,EverMemOS具备全场景覆盖、生物启发设计和实时推理等优势,成为AI从"工具"向"智能体"演进的关键基础设施。

2025-11-18 11:01:00 1166

原创 Vibe编码与程序员裁员潮:未来编程的“氛围感”革命

2025年Vibe Coding(氛围编程)这一概念被《柯林斯词典》评为年度词汇,已正式进入编程范式革命。

2025-11-17 10:15:49 479

原创 Step-Audio-EditX:用大语言模型“雕琢”声音,开启音频编辑新视界

Step-Audio-EditX是全球首个开源的LLM级音频编辑大模型,将传统复杂的语音编辑升级为直观的"文本标记级操作"。

2025-11-16 13:24:05 1307

原创 AI编程助手隐私条款详解:你的代码会被用于训练吗?

AI编程助手在提升开发效率的同时,也引发了代码隐私保护的担忧。本文分析主流工具的隐私条款发现:阿里通义灵码和腾讯CodeBuddy承诺不将代码用于训练,而阿里Qoder和字节Trae则允许脱敏使用但提供隐私模式选项。

2025-11-15 13:37:26 945

原创 TRAE SOLO正式版发布:AI编程进入“响应式智能体”新时代

字节跳动AI编程工具TRAE发布SOLO正式版,实现从辅助到自主开发的跃升。

2025-11-14 09:34:36 1202

原创 零知识证明:破解数据交易的隐私与价值困局

零知识证明(ZKP)为解决数据交易中的隐私保护与有效性验证矛盾提供了创新方案。它通过数学证明替代数据展示,使卖家能证明数据符合约定而不泄露原始信息,有效解决了数据易复制、隐私敏感和有效性不确定等核心问题。

2025-11-13 15:01:01 500

原创 AI重构信息获取:从TrendRadar到微舆,开源工具如何颠覆热点追踪?

AI开源工具TrendRadar和微舆正在革新舆情分析。两者突破了传统工具的数据搬运局限,实现价值提炼和趋势预判,这些低门槛工具正让AI分析成为人人可用的生产力。

2025-11-12 16:23:57 1751

原创 隐私计算赋能RDA和RWA项目:一份可落地的“应用地图”——来自 2025 年项目的复盘

隐私计算技术正成为RDA/RWA项目场景落地的关键支撑。2025年多家机构在RDA/RWA项目中应用该技术。

2025-11-11 11:14:45 1227

原创 抗量子多方安全密钥管理:量子时代的密码安全革命

量子计算即将颠覆传统加密体系,当前虽不需立即全面替换传统算法,但高敏感领域必须开始规划迁移,因系统升级周期长且存在"现存后解"攻击隐患。迁移需分优先级推进,这是一个需要未雨绸缪的系统工程。

2025-11-10 10:04:53 836

原创 从 RWA 到 RDA:数据驱动的资产革命

RWA(真实世界资产)与RDA(真实数据资产)正在重构数字经济与实体经济的连接范式。

2025-11-09 22:30:50 1295

原创 当AI成为“华尔街之狼”:从Alpha Arena到AI-Trader

智能体架构正从工具向决策者演变,形成功能型与系统型两种发展路径。开源框架如AI-Trader、TradingAgents中文增强版等,为研究者提供了真实市场测试平台。然而,从实验到实战仍面临样本有限、运行时间短等挑战。

2025-11-08 17:05:45 1222

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除