目录
一、对项目实训内容的理解
3.23-3.25:
在3.25日时我们组首先对项目实训的要求进行了广泛的讨论
首先我们可以看到项目实训的两个大方向分别是“通用人工智能方向”以及“开源工业基础软件”方向,因为我们组都是软件工程的学生,对工业软件的接触并不多,于是我们没有过多纠结便选择了人工智能方向,通过通读要求我们可以发现,本次项目实训要求我们应用现有的AIGC或者LLM技术,进行创新开发,可以是模型微调,也可以是某个领域的应用。我们首先应该了解什么是AIGC与LLM,以及思考如何通过他们开展我们的创新项目实训。
AIGC:
AIGC 是使用 Generative AI (GAI,生成式 AI) 的方式,能够模拟人类的方式,在很短的时间内创作大量的内容。比如现在很火的如下两个模型:
ChatGPT:一个语言模型,能够很快的理解并回复人类的问题
DALL-E-2:能够在根据文字创作一幅对应的高质量图像,如图 1 所示
我们可以总结为AIGC(AI Generated Content,人工智能生成内容)就是指利用人工智能技术生成各种类型的内容,包括文本、图像、音频、视频等,那么我们能够选择的方面就非常多了。
而大型语言模型(Large Language Model,LLM),即利用大规模语料数据进行预训练的预训练语言模型(Pre-trained Language Models,PLMs),是自然语言处理(Natrual Language Processing,NLP)的方式之一。简言之,大语言模型是在巨大数据集上训练以理解人类语言的深度学习模型,其核心目标是准确地学习和理解人类语言,大语言模型使机器能够像我们人类解释语言一样解释语言,彻底改变了计算机理解和生成人类语言的方式。
二、针对项目内容进行选题
在我们组内讨论完项目实训的要求后,我们针对项目实训的选题也进行过很多讨论,因为这个题目与全国大学生软件创新大赛的题目非常相似,所以我们也参考了一部分优秀作品为我们的选题提供思路,首先我们看看赛事组给我们提供的一些可能的方向
这些方向都是非常具有参考价值的,我们最开始本来就是想做旅游方便的智能出行服务的,但是因为网上现有的旅游大模型都没有特别完善,而与旅游相关的数据集的获取也具备一定的不确定性加之我们认为这可能是一个非常热门的选题最终就放弃了这个选项。
我们又参考了许多优秀作品加上我们小组的不断讨论
最终我们确定题目为多模态的医疗图像辅助诊断系统,因为医疗方面肯定有很多结合LLM做医疗问答的,而我们选择医疗图像辅助诊断也可以将LLM医疗问答等融合进来。