自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(最终篇)

部署了BioT5模型,对该模型进行了相关微调,实现了相关功能的使用。

2024-06-24 13:12:52 215

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(十七)———Huggingface模型微调

使用预训练模型有许多显著的好处。它降低了计算成本,减少了碳排放,同时允许您使用最先进的模型,而无需从头开始训练一个。Transformers 提供了涉及各种任务的成千上万的预训练模型。当您使用预训练模型时,您需要在与任务相关的数据集上训练该模型。这种操作被称为微调,是一种非常强大的训练技术。在本教程中,您将使用您选择的深度学习框架来微调一个预训练模型。Transformers 模型而优化的 Trainer 类,使您无需手动编写自己的训练循环步骤而更轻松地开始训练模型。

2024-06-24 12:59:57 164

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(十六)————编码问题解决

python脚本的调用产生的问题:如果想通过在本地即可调用相关的python脚本首先必须保证的的是python的pip必须已经导入到了本地路径,使得python脚本在运行时可以正常运行,否则会出现无意义的报错。数据库编码问题:在设定数据库的字符编码集的时候要选择和本地相匹配的字符编码集,一般选定的是UTF-8,不然会出现中文字符在后台中显示的是正常的中文字符,但是存入到数据库中就会出现”?

2024-06-24 11:54:13 199

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(十五)

该前端页面主要设置了三个可以下拉的下拉窗口,每一个下拉窗口对应于一个功能,例如功能一分子转换为分子图,这里的主要实现逻辑是获得输入框中的Smiles分子式,然后传递给后端springboot,springboot再通过具体的包含rdkit脚本的python文件生成图片存至本地,并返回生成路径,之后只需根据返回的路径将图片进行展示即可,其中分子图元素中使用了v-if标签来代表是否生成。

2024-06-24 11:32:49 225

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(十四)

本篇博客主要讲解模型性能分析页面的实现,对于不同的类型的模型,其对于众多的数据集具有着不同的表现性能,包含bbbp等众多的数据集,这里我们选择多选框的方式,可以选择不同类别的模型,类别一共分为三类,simple模型llm模型和chenm llm模型,选择之后会通过后端Methods调用相关函数获得数据,之后即可直接返回数据在前端生成echarts柱状图。

2024-06-24 11:16:46 153

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(十三)

本篇博客主要讲解chat的聊天内容的存储和实现,首先对于前端的内容,首先如果是drugchat机器人,需要提前输入smiles分子才能继续进行,如果是drugassist机器人则直接发送相关消息即可,之后再获得输入框中的内容调用询问函数调用后端springboot的接口,从而获得模型的输出。

2024-06-24 11:01:27 172

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(十二)

对于窗口组件window,主要解决的是聊天问题,因为用户的聊天信息在窗口的右边,但是chatbot在窗口的右边,因此这里我们使用chatlist存放聊天记录,在设置一个属性type,如果type的属性值大小为0就是在左边修饰,反之就是在右边进行修饰。因此需要实现对应的组件即可,对于列表组件,该组件主要存储的是聊天列表数目,因为我们使用的有两个聊天机器人,因此frienflist里面存放两个对象,之后只需要根据v-for对列表进行遍历即可进行展示聊天列表。

2024-06-24 10:51:41 148

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(十一)

对于不在本地上运行的python文件,比如由于模型需要运行在对应的服务器上,从而导致不能直接调用python脚本进行输出,因此必须通过服务器通讯进行调用结果。对于本地的python文件,通过执行外部的Python脚本,将用户消息作为参数传递给脚本,并获取脚本的输出结果。: 使用RestTemplate的exchange方法发送HTTP请求,并获取响应实体。: 等待Python脚本执行完成,并获取脚本的退出码。: 读取Python脚本的输出流的每一行,将其添加到。,包含要执行的Python脚本的命令和参数。

2024-06-24 10:41:11 248

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(十)

命令中的端口转发选项。它指定了一个本地端口转发规则,将本地端口7860的流量转发到远程主机connect.bjc1.seetacloud.com的端口7860。本篇博客主要记录实现服务器穿透通讯的经验记录,模型的首次部署是在学校的实验室服务器152上进行部署,可以在服务器的127.0.0.1的7860端口进行展示web页面,但是对于服务器的本地网页,本地的主机应该如何访问到服务器呢?之后,由于本地的算力资源的有限,因此我们使用了相关atuodl网站的服务器进行部署,这样就可以进一步训练展示更优越的性能。

2024-06-24 10:30:01 189

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(九)

根据模型配置信息中的模型架构(model_config.arch),从注册(registry)中获取相应的模型类。为了能够使得模型能够更调用并与前端进行通讯,这里我们选择flask作为后端框架,这样springboot端即可通过访问对应的网址从而实现模型的调用,在之前chat类的基础上,只需要根据springboot端的请求从而实现对应的功能即可实现python端的数据返回给后端springboot。: 从请求的JSON数据中获取名为'user_message'的值,赋给变量。的函数,用于重置消息。

2024-06-24 10:14:25 372

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(八)

本次项目使用的模型是drugchat模型,该模型是基于大语言生成模型的对话模型,为了能够更好的进行对话交流,需要实现一个chat类使其变为一个可以聊天的chatbot机器人,因此实现了一个聊天机器人类Chat。从生成的输出中提取第一个输出令牌(output_token),并进行一些预处理操作,例如删除开始标记(首先初始化函数就是设置该聊天机器人的device,使用模型model以及编码词汇等早停的初始化变量。的最后一条消息中,并返回输出文本和输出令牌的numpy数组。中最后一条消息的内容。

2024-06-24 09:54:46 347

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(七)

函数用于处理用户的聊天输入。如果用户消息的长度为0,函数将返回一些更新后的参数和Gradio元素,提示用户输入不能为空。为None,函数将返回一些更新后的参数和Gradio元素。最后返回一些更新后的参数以及更新后的Gradio元素。函数上传图像,然后返回一些更新后的参数和Gradio元素。列表中,最后返回一些更新后的参数和Gradio元素。最后返回一些更新后的参数。函数处理用户的消息,并将用户消息和空的回答添加到。不为None,将清空聊天状态的消息列表。函数生成回答的语言模型消息,然后将其添加到。

2024-05-31 00:38:50 286

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(六)

输入输出:gr.Image(图像), gr.Textbox(文本框), gr.DataFrame(数据框), gr.Dropdown(下拉选项), gr.Number(数字), gr.Markdown, gr.Files。Gradio的优势是一种只需简单定义输入和输出接口即可快速构建简单的交互页面的AI可视化函数库,更轻松部署模型。对于复杂程序,输入列表中的每个组件按顺序对应于函数的一个参数。布局组件:gr.Tab(标签页), gr.Row(行布局), gr.Column(列布局)最常用的基础模块构成。

2024-05-31 00:31:15 162

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(五)

2,返回主项目的根文件夹,在src/components或者任意合适的位置创建一个组件,比如名为"EmbeddedProject.vue"。1,打开需要被嵌入的项目的根文件夹,运行npm run build命令构建该子项目,生成dist文件夹。但是只了解这些,不足以支持系统开发,所以我和队友又去学习了一下iframe属性和父子项目的交互。我和另一个队友进一步构想实现在一个vue项目中嵌入一个chatbot的集成框架。

2024-05-30 22:15:22 148

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(四)

的知识,对它的创建过程和训练有了一些认识,所以我在Chatbot的灵感激发下,先做出来了一个chat的简易vue聊天界面,包含简单的文件上传和表情设置。4月30日前后,我们团队针对项目的具体需求和具体工具做出了进一步的构想,推翻了之前的一些想法,同时也产生了一些新想法。在设计的过程中,我们对项目的需求规划更加的清晰,接下来准备再试试了解一些新东西,看能不能有一些新的点子。所以,4.30-5.10我在网上初步学习了。

2024-05-30 21:54:26 211

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(三)

在预训练模型的顶部添加一些自定义的层次,以适应特定任务的需求。这些自定义层次通常是与任务相关的分类器、回归器或其他任务特定的层次。

2024-04-22 16:50:52 620

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(二)

元素来定义一个插槽并定义了一个占位符,说明了在父组件中的哪个位置应该插入子组件的内容。在子组件中,可以使用父组件提供的插槽来分发内容组并可以将子组件的内容插入到父组件的插槽中。插槽是一种特殊的占位符,允许在父组件中插入子组件的内容。在父组件中,可以使用。因为在vue中必须在data函数中返回静态数据才能使用。:前端页面中点击折叠后,左侧菜单的图标不显示。属性才能让侧边栏和折叠效果正常联动。匹配的插槽,但其实这是不必要的。加载远程图片不成功,前端显示。:将上述的插槽删除即可。

2024-04-16 13:56:40 399

原创 山东大学软件学院创新项目实训-基于LLM的药物分子性质分析平台(一)

BioT5+是BioT5框架的一个扩展,旨在增强生物研究和药物发现。该模型包括的特性:集成IUPAC名称以增强对分子理解,包括来自bioRxiv和PubChem等来源的广泛生物文本和分子数据,多任务指令调整以实现跨任务的通用性,以及一种新颖的数值标记技术以改进数值数据的处理。其通过预训练和微调进行验证,包括分类、回归、生成类型的问题、15种任务和21个基准数据集,在大多数情况下表现出色。BioT5+在捕捉生物数据中复杂关系方面表现突出,对生物信息学和计算生物学有重要贡献。

2024-04-08 16:43:17 553

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除