技术大会的学习笔记：精简系统代码、大模型工具探索等干货分享

最新推荐文章于 2025-04-07 22:20:05 发布

煎鱼（EDDYCJY）

最新推荐文章于 2025-04-07 22:20:05 发布

阅读量468

点赞数 2

文章标签：学习笔记

本文链接：https://blog.csdn.net/EDDYCJY/article/details/131950380

版权

文章介绍了ArchSummit全球架构师峰会上关于系统精简、AI多媒体内容审核以及大模型在生产力工具中的应用。去哪儿旅行的冯阳阳分享了如何高效清理线上无用代码，趣丸科技的马金龙探讨了AI在内容审核的实践，美的集团的郭智勇分享了分布式应用运行时的落地经验，而商谈科技的詹明捷则讨论了大模型时代的生产力工具技术探索。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大家好，我是煎鱼。

最近 ArchSummit 全球架构师峰会在深圳也开展了，以下是我简单记录的一些笔记，有兴趣的同学可以一起看看学习进步。

上篇：《技术大会的学习笔记：AI 大模型落地、AIGC 技术探索等干货》；

本文是下篇。

欢迎大家关注！

系统精简之道-冯阳阳

演进主题：《系统精简之道：如何以极低风险，高效清理线上无用代码》，讲师：马阳阳，去哪儿旅行

这个演讲主题挺有意思，我提前有所关注。内容是：瘦身项目，去除无用代码，业内挺少见，主打极低风险。

业务背景：去哪儿是 2005 年开始做，业务历史悠久，短期业务多（例如：端），人员流动大（互联网特性），容易找不到人。

线上有流量覆盖的代码行只有 40%。

做这个精简项目，成立了虚拟团队来支撑：

整体的步骤，分为：找的到，删的好：

”找得到” 的依据，主要是这两点：没流量和没迭代。

例如: 网关、Trace、定时任务。Config 等。（可以理解为所有能证明你这个项目还在跑的依据，基本就是依赖的识别使用）

真正下线时做了个灰度流程，人工确认，不接流量。服务下线，再真正回收等。

对应的精简代码的核心特征分析:

未被引用的方法(静态)
没有流量的方法(运行时)
重构

“找得到” 方案的最终选型：

核心是基于 Java 语言的 SA 工具，JVM 内有记录了方法的执行次数，SA 工具有提供对应的 JAR 用来获取。

实际上 SA 计数，会跑三个月，每次服务迭代发布，都是在跑统计的。对老的 Pod (上个迭代的老版本服务)进行计数，不会影响到新的 Pod(新迭代新上的服务版本)。

注：超过三个月都没有跑的，确实很难避免。但是基本不会出现 P1、P2 的事故。SA 工具理论上跑的越久越好。

“删得好” 的多种手段：

全自动这个很好理解；半自动是提供了 IDE 插件来识别和提醒，便于人工介入。

真正删完上线，最佳实践是根据服务、包的重要程度等选择了不同的删除手段和建议。这个结合自己实际公司行情就可以了。

一张图总结概括：

粗略总结：

这个项目，感觉上级给了很大的支撑，否则这种事情，还是比较折腾的，也很容易出事故。
技术思路上，主要就是调用 SA 工具的方法技术群 MethodCount 来得到调用次数，接着就是对应的业务逻辑处理和灰度策略了。
目前仅适用于 Java 项目，如果有其他语言的，也可以参考思路来解决。

AI 多媒体内容审核

演进主题：《AI多媒体技术在内容审核场景实践探索》，讲师：马金龙，趣丸科技

这个演讲主题，和大家最近遇到的挺相关，因为 AIGC 出现了后，很多应用需要受到很多的要求，要做内容审核。否则很容易翻车。特意看看思路和行业情况如何。

当前内容审核要求很多、种类多样、挑战多多、AI 幻觉多多、较为不可控。

设计上是基于 ASR（Automatic Speech Recognition，语音识别）的架构，也就是基于语义，预训练。提前训练好。用 NLP 做。技术路径和以往的差不多。

异常特别的场景，还是会找一些渠道找到数据，或者考虑 AIGC 来生成：

给出的数据来看，普遍多维度的检测成功率都在 91% 以上，准确度据描述已经比较高了。

未成年人的识别率达到 99%，从表述来看，针对用户行为、动作、语义等多个方面都做了综合判别。根据描述是公司核心能力之一，拿了许多奖，没有具体举例说明。主打一个描述。
声音识别上，主要可以识别声音的事件，例如唱歌、说唱等。识别声音事件、类型、语义。能做到比较好的识别结果。对于不同语种，主要是基于模型训练，也做微调，拿到不同的标签等。
歌曲识别，识别人声指纹。就能很好的捕获到不合规的艺人、语录等。

识别的关键词基本是：语义、行为、声纹、事件等。

提问有同学问到：AIGC 文生文，文生图的内容审核安全问题。也是我去听时较关注的问题之一。

主要是通过以下方面来解决：