大模型作为农艺师助理?使用大型语言模型回答农业考试

大型语言模型 (LLM) 在包括医疗保健和金融在内的各个领域的自然语言理解方面表现出卓越的能力。对于某些任务,LLM 的性能与受过训练的人类相似或更好,因此采用人工考试(例如认证测试)来评估 LLM 的性能是合理的。我们对流行的 LLM(例如 Llama 2 和 GPT)回答农业相关问题的能力进行了全面评估。在我们的评估中,我们还采用了 RAG(检索增强生成)和 ER(集成精炼)技术,它们结合了信息检索、生成能力和提示策略来提高 LLM 的性能。为了展示 LLM 的功能,我们选择了来自三个最大的农业生产国的农业考试和基准数据集:巴西、印度和美国。我们的分析强调了 GPT-4 能够在考试中取得及格分数以获得更新农艺师认证的学分,正确回答了 93% 的问题,并且优于早期的通用模型,后者的准确率达到了 88%。在我们的一项实验中,与人类受试者相比,GPT-4 获得了最高的性能。这一表现表明,GPT-4 有可能通过主要的研究生教育入学考试,甚至获得更新农学证书的学分。我们还利用来自巴西农业局 (Embrapa) 的强大数据集和来自印度的研究生课程考试,探索了模型解决一般农业相关问题并为巴西和印度农民生成作物管理指南的能力。结果表明,GPT-4、ER 和 RAG 可以为农业教育、评估和作物管理实践做出有意义的贡献,为农民和农业专业人士提供有价值的见解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

郑生之智能探索

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值