AI创新之旅,昇思MindSpore创新训练营·长三角站成功举办

8月27日-30日,昇思MindSpore创新训练营·长三角站在上海交通大学顺利举行。本次活动由上海交通大学、华为技术有限公司、昇思MindSpore开源社区主办,长三角各高校教务处协办,吸引了来自上海交通大学、浙江大学、复旦大学、南京大学、中国科学技术大学、同济大学、华东师范大学、华东理工大学、中国石油大学(北京)、南京邮电大学、南京林业大学、加州大学洛杉矶分校共12所高校的79名学生参与。经过连续几天的学习与实践,学员们不仅对人工智能及大模型领域的最新进展进行了深入探讨,还全面了解了行业发展的最新趋势,为自己在未来科技创新的道路上奠定了坚实的基础。

cke_211.png

image.png

昇思MindSpore生态技术专家杨滔

在为期四天的学习中,训练营从Transformer的基础知识入手,逐步探索了大模型技术的发展脉络。讲师们深入讲解了大模型的开发、预训练、微调和应用全流程的关键技术点,帮助大家建立了全面的技术全景图。通过对以BERT和GPT为代表的大模型的深入剖析,大家不仅理解了encoder-only和decoder-only结构的差异,还深入掌握了大模型训练过程中不可或缺的技术——分布式并行技术。此外,训练营还探讨了高效参数微调技术,提升大模型的训练效率,降低训练成本,并通过分析基于MindSpore框架的MusicGen和ChatPDF等大模型应用实例,让大家感受到大模型在现实中的无限可能。

cke_1542.png

image.png

获奖同学合影

以下仅为同学们在创新训练营中众多优秀作品中的部分璀璨亮点,它们不仅展现了同学们的智慧与才华,更是大家辛勤学习与不懈探索的结晶:


01MindOverflow —— 针对线性代数的教学助手

在大模型已经“飞入寻常百姓家”的时代,尽管通用预训练语言模型的能力日益增强,但在科研、教学与学习中,这些大模型的专业能力仍有待提升。尤其是在数学运算问题上的回答准确率,仍需进一步提高,以更好地满足高校教学的需求。

为了解决这一问题,使大模型更好地服务于高校教学,MindOverflow团队利用MindSpore框架、RAG(Retrieval-Augmented Generation)算法以及Qwen-2预训练模型,基于高质量的线性代数数据集,开发了一款专业能力强大、交互界面完善的“AI助教”。这款“AI助教”能够准确回答线性代数问题,不仅有效减轻了教师的教学负担,还显著提升了学生的学习效果。

image.png

代码仓地址:https://github.com/Lzzzzy4/Mind-Overflow


02三颗花椒队 —— image to text

图生文技术旨在从图像中提取关键信息,并生成自然语言描述,从而实现对图像内容的深入理解和表达。然而,传统的图生文解决方案在训练过程中存在两个主要问题:首先,由于映射网络结构过于庞大,导致训练时间过长;其次,传统方案中所用的语言模型在处理中文文本时效果欠佳,导致生成的文本质量较差。

为了解决这些问题,“三颗花椒”队的同学们提出了一系列改进措施。他们通过简化映射网络结构,显著缩短了模型的训练时间。同时,他们将传统的输出文本语言模型替换为中文处理能力更强的通义千问模型,以提升文本生成的效果和准确性。这些改进有效地提升了模型的训练性能,并改善了中文文本的生成效果。

image.png

尽管取得了显著进展,但由于时间限制,当前生成的效果与预期仍存在一定差距。队员们计划在后续工作中,进一步优化数据集处理,精细调整映射网络并微调语言模型,选择文本生成能力更强的模型。此外,他们还考虑将映射层替换为表达能力更强的BERT等模型,以进一步提升整体效果。我们期待在不久的将来,能够看到他们更加完善的方案,并取得更加优秀的成果。

效果展示:

image.png

代码仓地址:

https://xihe.mindspore.cn/projects/Devon/ImageToText


03大模型说的都队 —— 基于Yi-Chat的AI医疗诊断大师

传统的医疗场景中,面临着人力成本高昂、城乡医疗服务质量差异明显等挑战。虽然大模型的引入在一定程度上提高了医疗服务的效率和水平,但其回答完全依赖于预训练的语言模型,这可能导致在处理复杂医学问题时出现不准确、不完整的回答,特别是由于缺乏最新的或专业的医学知识,可能导致严重的误导。

针对这一问题,大模型说的都队的同学们深入研究了课程中讲解的高效参数微调技术和RAG算法,并成功开发了一个基于Yi-Chat的智能医疗问诊机器人。这个机器人通过首先检索与特定病症相关的最新和专业信息,然后再让大模型基于这些检索到的信息生成回答,从而有效解决了大模型在医疗场景中常见的“幻觉”问题。这样的技术方案,不仅显著提升了问诊机器人的准确性,还大大增强了其在复杂医学问题处理上的可靠性,展示了学员们在本次学习活动中的创新能力和技术深度。

image.png

04baseline —— AI专用搜索增强

在信息爆炸的时代洪流中,众多网站深藏信息丰富的宝藏帖,却受限于低效精准的关键词搜索。传统的方法普遍存在效率低下、精准度不足以及广告泛滥等痛点问题,baseline队旨在利用大模型为这些网站赋能,通过一系列创新性的实现方案,旨在为用户带来便捷舒适的搜索体验:

智能提取关键词生成搜索请求:GLM+Prompting技术深度解析用户输入,精准提取并生成高效搜索请求,提升初始准确性。

精准捕获答案构建知识库:RAG策略筛选整合高质量答案,确保信息丰富且有效,避免无效信息干扰。

AI整合输出最优答案:Bert+Fine-Tuning技术深度匹配问题与答案,自动化处理呈现快速准确结果。

昇思MindSpore框架加速大模型部署:提升上下文理解与开发效率,使搜索结果更贴近用户真实意图。

image.png

效果展示:

image.png

image.png

05我写的都队 —— 基于bert真假新闻鉴别器及基于gpt的新闻扩写器

我写的都对队的同学们之前并不了解深度学习和大模型方面的知识,在课上接触和了解到了一些NLP以及大模型的知识后,想要实现一个新闻的鉴别和生成课题中。他们灵活地将课堂上讲到的bert的文本分类GPT的文本生成的例子运用到了大作业课题中。同学们分别将两个模型作为文本分类器和扩写器,实现了新闻的分类和生成并取得了良好的效果。他们还联想到了使用GAN网络的生成器和判别器进行对抗训练,强化作品生成的能力和准确性,他们将会在后续参与到开源实习活动中,尝试实现对课题的进一步优化。

效果展示:

image.png

代码仓地址:https://xihe.mindspore.cn/projects/lucy/project/

接下来,让我们一同聆听同学们的学习心得,感受他们在LLM领域探索旅程中的收获与成长。

“我只有一些深度学习基础,原来有些担心跟不上。后来我发现完全能跟上老师们的节奏,…,感觉老师们不急于介绍MindSpore的细节,而是很细心地从基础讲起,然后很自然地用MindSpore实现——这真的要点一个大大的赞!”

“在这三天的课程中,我印象最深的是分布式并行技术的讲解,从数据拆分,模型拆分,再到pipeline的层级拆分,每一种新的方式和思路的出现,与他们所面临的不同的问题和代价,一次次的拓宽着我的思路…”

“收获最大的部分就是最后做项目的时候,用一个下午和晚上从0到1训了个模型,并不断的尝试扩展其功能(前端、目标检测等),体验了一夜一个奇迹的快乐”

“我印象最深的部分是GPT1与GPT2的学习。在日常生活的很多方面,我都会用到GPT,但作为大模型方面的小白,我一直对GPT背后的原理了解甚少。通过学习这次课程,我了解了GPT等大模型的原理,并且尝试了大模型下游应用的编写,让我对大模型有了更深的了解。”

“印象最深的是基于Transformer的机器翻译实操。自己一步步构建出这一复杂的模型并运行起来,看到良好的效果是一件神奇而有趣的事情。”

“参加昇思MindSpore训练营让我深刻感受到了人工智能的魅力与潜力。课程中理论与实践的结合,使我不仅在技术上有所提升,更在思维上得到了启发。通过实际操作,我掌握了深度学习和自然语言处理等核心技术,并在项目中应用这些技术解决了实际问题。我意识到, AI不仅是技术的革新,更是对人类创造力的一种拓展。在这几天和其他学校队友的朝夕相处,合作攻克难题,这样宝贵的经历也让我们产生了更深的友谊。”

希望本次创新训练营能够作为同学们在知识海洋中航行的起点,祝愿每位同学在未来的大模型领域里继续扬帆起航,创造更多辉煌成就。

在最后的结营仪式上,昇思MindSpore AI框架业务副总经理孙宾表示:“昇思MindSpore AI框架作为软件根技术,已成为加速人工智能、大模型开发、推动产业发展的核心力量,广泛应用于运营商、金融、交通、互联网等行业。昇思MindSpore自开源以来一直重视人才的培养,人才是AI生态的源头活水,目前已发布了四项行动,持续赋能AI人才培育,包括学术论文基金、开发板应用创新、原生大模型孵化以及开源社区实习活动等。”最后,孙宾鼓励学生们继续参与昇思MindSpore社区活动,共同推动人工智能技术的发展。

image.png

昇思MindSpore AI框架业务副总经理孙宾

ICT销服招聘调配部部长傅丹表示华为一直致力于推动数字化进程,为全球用户提供更便捷、高效的服务。同时,她也提到,华为高度重视人才的培养和发展,拥有完善的人才机制和培养体系,为员工提供广阔的发展空间和机会。最后,傅丹再次表达了对与会同学的热烈欢迎,并鼓励大家积极了解华为,共同探索未来的发展机会。

image.png

ICT销服招聘调配部部长傅丹

最后,上海交通大学学生创新中心书记熊振华对本次的创新训练营进行了总结,他指出,今年的暑期训练营虽然只有短短的四天,但却过得充实且愉快,各个高校的同学们在上海交大结下了深厚的友谊,相信这段经历都将成为同学们青春岁月中难以忘怀的记忆。

image.png

上海交通大学学生创新中心书记熊振华

长三角研究型高校联盟的创新训练营已迎来了第五年的成功举办,吸引了更多学校和学生的参与,不仅促进了优秀学生之间的交流,还为他们将来参加华为ICT大赛及昇思MindSpore社区开源实习提供了坚实的基础。未来,昇思MindSpore开源社区将携手更多高校,不断地培养人工智能领域发展需要的创新型&应用型人才。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值