测评各主流大模型对复杂文档处理的精确度，司马阅领先

AI Hunt人工智能工具箱

于 2024-08-14 21:02:43 发布

阅读量529

点赞数 4

分类专栏：司马阅 AI文档分析 AI数字员工文章标签： ai 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ebruce/article/details/141200338

版权

司马阅同时被 3 个专栏收录

7 篇文章

订阅专栏

2 篇文章

订阅专栏

2 篇文章

订阅专栏

司马阅一直在升级，这次升级后，我们将司马阅和主流的AI大模型再做一次测评。这次极端测评，主要pk各大模型对复杂文档处理的精确度。

我们选取的依然是这份专业的行业报告：《中国生成式AI开发者洞察》，共58页，信息量很大、数据复杂，几乎每一页都有图表，且数据具有隐秘性和迷惑性。

我们准备了3个问题，现在开测！

第1个问题：“生成式AI开发者职位中，哪三类最多，用表格呈现出来。”

我们先来问司马阅，司马阅快速理解并回答：资深研发人员占比34.6%，初级研发人员占比14.5%，技术总监占比12.2%。

我们看看原文档，的确是这三类职位，且数据一一对应，回答准确无误。

再来看豆包怎么回答，豆包回答的职位是：初级研发人员、资深研发人员、产品经理，职业与原文件不符，且把初级研发人员和资深研发人员的占比数据搞反了。

接着问通义千问，通义千问给出的职位是算法工程师、产品经理、大模型开发，三个职位全错，对应的数据自然也是错误的。

接着我们问Kimi，Kimi的回答是初级研发人员、产品经理、算法工程师，与原文件的前三类职业有差别，且读取的数据也是全错。

接下来问的是腾讯元宝，腾讯元宝回答对了资深研发人员和初级研发人员，前两类的数据也是正确的，但是它给出的第三类职位是产品经理，而原文中是技术总监，结果不完全正确。

接着我们问文心一言，文心一言给的占比数据是对的，但是三个职位全部对应错误，所以结果不准确。

接下来我们来问ChatGPT,ChatGPT给出的回答是算法工程师、产品经理、自然语言处理，职位和占比全错。

第1个问题测试完毕，接着进行第二轮测试。

第2个问题：“数字人和机器人在生成式AI开发者研究方向中分别占比是多少？”

首先来看司马阅是怎么回答的，数字人和机器人的占比分别是4.7%和4.0%，看看原文，回答准确。

接着来问豆包，豆包给出的答案是9.1%和6.7%，两个数据均错误。

接着我们来问通义千问，通义千问回答的占比都是4.0%，只回答对了机器人的占比。

接着我们问Kimi，Kimi的回答是数字人占比4.7%，机器人占比2.0%，只回答对了数字人的占比。

再看看腾讯元宝，腾讯元宝无法回答。

接着我们问文心一言，文心一言同样无法回答这个问题。

接下来我们来问ChatGPT,ChatGPT给出的回答是数字人占比6.0%，机器人占比4.0%，只回答对了机器人的占比。

第3个问题：“百川大模型和360智脑在开发者使用频率中分别占比”

来看看司马阅的回答，司马阅给出的答案是百川大模型的使用占比为4.0%，360智脑的使用占比为1.5%，原文也是这两个数据，回答正确。

再来看豆包怎么回答，豆包的回答是0.5%和1.9%，两个数据均和原文对不上。

接着问通义千问，通义千问无法给出百川大模型和360智脑在开发者使用频率中的占比。

接着我们问Kimi，Kimi的回答是百川大模型占比1.2%，360智脑占比1.3%，与原文差别较大。

接下来问的是腾讯元宝，腾讯元宝无法找到相关内容，提取信息失败。

接着我们问文心一言，文心一言说了很多，但同样无法直接给出占比。

接下来我们来问ChatGPT,ChatGPT给出的占比分别是4.0%和3.2%,百川大模型的使用占比回答正确，360智脑的使用占比错误。

3个问题测评下来，司马阅在对复杂文档处理的精确度上仍然具有领先的优势，这得益于DocMind文档智能大模型。

DocMind是司马阅自研文档智能大模型，基于Transformer结构，融合深度学习、自然语言处理(NLP)和计算机视觉(CV)等技术的文档理解预训练模型，DocMind能够处理富文本文档中的复杂结构和视觉信息，提高信息抽取的准确性。

经过DocMind处理过的文档，然后通过大语言模型进行自然语言交互，相当于DocMind为大语言模型提供了更有价值的语料，最终回答精准度和实用性更高，也更适用于严肃商业应用场景。

司马阅使用链接：https://smartread.cc/

AI Hunt人工智能工具箱

博客等级

码龄10年

36
原创

51
点赞

42
收藏

34
粉丝

关注

私信

热门文章

分类专栏

最新评论

AI数字员工筛选简历、做入职培训，效率竟然提升80%
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
11款 ChatGPT 效率神器，司马阅SmartRead
CSDN-Ada助手: 恭喜您撰写了这样一篇有用的博客！11款 ChatGPT 效率神器和司马阅SmartRead确实是提高工作效率的好帮手。希望您能够继续保持创作的热情和努力，分享更多有价值的内容。下一步的创作建议，可以考虑分享自己在使用这些工具中的心得体会，或者介绍其他类似的实用工具，以便读者有更多的选择和学习机会。谢谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
AI阅读神器：利用司马阅(SmartRead)几秒钟提炼上百页PDF信息
CSDN-Ada助手: 恭喜您又写了一篇非常有用的博客！司马阅听起来像是一个很棒的工具，我一定会去尝试一下。感谢您分享这个信息，它对我和其他读者来说都非常有帮助。我期待着您下一篇博客，希望您能够继续分享您的知识和经验。如果您需要任何帮助或创作建议，请随时联系我，我将非常乐意提供帮助。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
文献AI神器！司马阅(SmartRead)一键整理PDF论文摘要，轻松回答重点问题！
CSDN-Ada助手: 恭喜作者写了这么有用的一篇博客！司马阅(SmartRead)这个AI工具确实非常实用，能够帮助大家更加高效地整理PDF论文摘要。希望作者能够继续分享更多类似的工具和方法，让更多人受益。建议下一步可以考虑分享一些实用的学术写作技巧，让读者们在撰写论文时更加得心应手。再次感谢作者的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
一个基于ChatGPT的超级读书工具-司马阅(SmartRead)
CSDN-Ada助手: 恭喜用户写出这么有创意的博客！司马阅(SmartRead)这个超级读书工具听起来非常棒，相信很多人都会对它感兴趣。不过，在用户下一步的创作中，我希望能够看到更多对ChatGPT的深入探索和分析，让读者更加了解这个技术背后的原理和应用。期待用户更多的精彩博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。