[项目实训]2024创新项目实训中期周报合集(4/8~5/24)

第一周(4/8~4/14)

       开题通过的第一周。刚通过开题答辩,但因为我之前完全没有接触过大模型相关开发,虽然对项目有了大致的理解,但对现在应该做什么,总共需要完成哪些任务还非常迷茫。这一周我主要以学习大模型相关知识为主,学习大模型的生成原理、如何微调、如何使用prompt调整输出,让大模型处理特定的任务。通过对部署大模型需要的软硬件要求进行比对,我们最后选择在本地部署chatGLM-6B,并且通过prompt工程和few-shot learning来调整大模型,使其能够完成病历的生成。

       本周成果:明确任务,学习大模型基础知识,学习prompt方法,学习few-shoting learning

第二周(4/15~4/21)

       本周我完成了大模型的本地部署,并且通过一些下载的demo程序进行调试。我们继续从网上学习大模型开发的相关知识,对下载的demo程序进行调试,大致了解本地部署的大模型的项目结构和使用方法,初步尝试使用prompt工程对大模型进行调整,使其能够完成特定领域的任务。

       本周成果:完成大模型的部署,进行初步调整

第三周(4/22~4/28)

      结合prompt工程对部署的大模型进行调整,实现了基于大模型的病历抽取功能。通过不断地调整prompt并给大模型设置history,抽取生成病历的效果符合预期,但是输出并不稳定,经常会有其它输出或是输出不符合格式,如果将这样的输出发给前端或是存到数据库,可能导致预料之外的错误。不断尝试新的更多的prompt,调整大模型的history,但是依然可能出现预期之外的额外返回内容(可能性大约20%)。准备尝试其他的方法调整输出,如果输出仍然不理想,可能使用fine-tuning调整模型参数。

      本周成果:完成record_with_prompt.py,能根据命令行用户输入的病情描述提取出病历信息(姓名,年龄,主诉,持续时间,既往病症,过敏药物),生成符合格式的json字符串,但有时候会有额外的输出

第四周(4/29~5/5)

     受到启发,因为大模型生成算法本身的原因,调整prompt几乎不可能让它不会有额外的输出,但是在大量的测试下,发现它在出现额外输出时,一般仍会按要求在其之后有json数据,所以在进一步使用该数据(传给前端或存到数据库)之前,用另一个调整函数对输出进行调整,使用正则表达式筛选出其中的json数据,并且删除其他内容。但是在进一步测试中发现,还是有小概率出现额外的输出,格式调整函数并没有一直生效。在反复调试后发现,其输出的json数据有时并不是标准形式(以'```json')开头,但是仍然会有中括号,所以如果没有找到json数据,再在一个elseif里面用正则表达式匹配位于‘{}’中的数据,删除其他数据,再重新加入'```json'标识,变为json数据。同时,json字符串中间应该是‘,’但是有时返回的数据会使用‘、’,再进行一次匹配,将'、'替换成','

       反复检查,record_with_prompt.py均能正常输出json数据

      本周成果:完善record_with_prompt.py,输出更加稳定;对输出结构进行了过滤,使其只包含json数据。

第五周(5/6~5/12)

     设计数据库,设计前后端交互接口,设计前端页面布局,并与另一位同学一起编写Django,将record_with_prompt.py整合进Django框架中,使其变成一个前后端分离的web应用。同时,其他几位同学也在使用vue制作前端页面。

    本周成果:初步搭建了Django后端。

第六周(5/13~5/19)

       继续编写后端Django,通过Django启动大模型,对前端发来的病人描述数据进行处理,返回对应的json数据。

      本周成果:record_with_prompt.py组合进后端,并通过postman测试,成果返回预期中的json数据。

第七周(5/20~5/26)

        将后端与前端VUE代码初步结合,检查接口,统一前后端框架中已完成的部分。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值