亚信科技&清华大学:DeepSeek赋能自智网络高阶演进评测报告 2025

2bf47d003d95ce5a67277de296864cfd.jpeg

该文档是亚信科技与清华大学智能产业研究院联合发布的《DeepSeek 赋能自智网络高阶演进评测报告》,聚焦大模型在自智网络领域的应用,对 DeepSeek 等几款典型大模型进行多维度评测,为自智网络发展提供参考。

评测背景与目的

结合自智网络高价值场景业务需求,从语义解析、意图识别、推理能力等维度评测 DeepSeek 等大模型,为自智网络高阶演进提供科学依据与技术参考,推动通信行业智能化转型。

评测场景与指标体系

  • 业务编排智能设计:测试语义解析、推理能力、知识检索等,评估业务智能编排的合理性、隐含信息理解等指标。

  • 网络数据查询分析:考查语义解析、意图识别,评估查询分析意图识别准确率、提取准确率等。

  • 网络拓扑生成:关注意图识别、语义解析,评估拓扑生成意图识别准确率、提取准确率等。

  • 网络故障根因分析:涉及意图识别、自主规划等能力,评估根因分析的准确性、合理性、时效性等多方面指标。

  • IP 网配置生成:测试意图识别、知识检索、文本生成能力,评估配置生成的准确率、覆盖范围、相关性等指标。

  • 一线装维服务:评测意图识别、语义解析、知识检索能力,通过知识检索指标、服务准确性等衡量。

  • 感知诊断分析:考查意图识别、语义解析、知识检索,评估分析的准确率、覆盖范围、全面性等。

  • 无线投诉处理(文档未完整列出,但可推测相关能力测试与其他场景类似):主要针对无线网络优化相关能力进行评估,如语义连贯性、准确性、完整性等。

DeepSeek 模型表现分析

  • 优势:在多数场景和能力测试项中,DeepSeek R1 和 V3 与其他模型相比有一定竞争力,部分指标表现良好。

  • 不足:处理少见网络专业问题时,知识检索的准确性和全面性不足;深度思考模式下存在过度思考现象,影响任务处理效率。

优化建议与展望

  • 建议结合其他模型或方法弥补处理少见问题的缺陷,优化模型思考逻辑以平衡性能与效率,为后续自智网络发展和大模型应用提供方向 。

后台回复“250303C”,可获得下载资料的方法。

6fe920c517f2ef94a0970d945e26f6bc.jpeg

aab2872674cff4761397420aae00608e.jpeg

dc6c30a04905740db5f85f741a8dd29e.jpeg

507611810b1ce973fcbdcce2104f32ad.jpeg

4ab36a0c697900caf288ebfda7828f2a.jpeg

f549e4f9eb5369f09b1ccae5d1fa9188.jpeg

bb9112dd5eeb0a9819583c7e71a46875.jpeg

f4afeb819817116454143e353be94f57.jpeg

1c3eff7c29f280b8deb6b53c13d55e76.jpeg

ff59408db4cd9bd8583800b431e4d3a7.jpeg

80ef86a51317fb9cc8d6bdc24ccb8df3.jpeg

a8b2af27eae74997dca7f98ff72a8f55.jpeg

34a31c94b10805b85a1a547fea038c98.jpeg

2b2c2c5df50cbd114251a726aa8023a4.jpeg

8844897cbe7ea23aa1ec2599faa18767.jpeg

7db77f1c6da368502f35170ad49550f6.jpeg

da6f5ef9c7edbcd8cc31e7d558fc7925.jpeg

39a79bc5342b675f1c5066cdb4ad3f4c.jpeg

1b6c34981ff1c7a2802eaae23c1ae219.jpeg

79787ab22fca15d177c9ac883258ea27.jpeg

3b49f4e15baf361457dc901dd060d5f6.jpeg

b319768b1b23439f75a1cbc9223b891d.jpeg

1fa8a6ee73325c8fc2fcaed3ad01e7f5.jpeg

696f65a49b9acd67dbfa8e4461f2a8c2.jpeg

0f575c1b2bf16264d03ad31f1009f741.jpeg

9da2d90fd4e764b325b1f93eb768bee0.jpeg

042d08c2353aeaf832fff62cd2e37020.jpeg

18b55f61a1d9506a101e8304414d9788.jpeg

4d3e8649c1601c0ab795f7dc23724090.jpeg

8e694ed117cd310c16c7c2a7b87f6c64.jpeg

7a5d8c05d94abca7286808edcf6178f8.jpeg

a79157a6aecac70e03cbcec1c909616a.jpeg

c9e19736bec719c411111b1920517c42.jpeg

b5ec99f19925cfb291b3b427868fb22b.jpeg

b381df5708de266c11bddc28adfd1b07.jpeg

5746e1dc50731219fa105b19e6766ebc.jpeg

70e1fd201e365bd3fc22559214364d1b.jpeg

001e9d7b5186b366827987a5c14b7196.jpeg

本公号使用腾讯元器(使用DeepSeek R1大模型)创建了智能交通技术AI服务,欢迎扫码进入体验(或在后台使用私信对话)。

40585fc42b418ad7990639288f9146d7.jpeg

点击文后阅读原文,可获得下载资料的方法。

8697ebbc760bedbbf008dee985ae1794.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值