自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 山东大学项目实训纪实

通过`RestTemplate`的`exchange`方法发送了一个`GET`请求,并将响应结果保存在`responseEntity`对象中。该代码解析了一个使用`@GetMapping`注解的方法`askquestion`,该方法接受一个`user_messages`参数作为请求参数,并返回一个`Result`对象。接下来,创建了一个`requestBody`对象作为请求体,使用`HashMap`存储了一个键值对,键为`user_message`,值为`user_messages`参数的值。

2024-06-24 13:10:05 317

原创 山东大学DrugLLM开发团队 项目实训(十四)

基本功能完成,css进行优化,部分功能的查漏补缺,补充一些运行细节和bug。

2024-06-24 10:16:37 239

原创 山东大学DrugLLM开发团队 项目实训(十三)

1.前端联系我们界面搭建成功,集成邮箱发送功能允许用户通过邮件提建议或者要求。2.前端后端Drug咨询搭建成功。3.前端后端数据库精选搭建成功。4.后端界面功能完善。

2024-06-24 10:15:39 76

原创 山东大学DrugLLM开发团队 项目实训(十二)

2.Drug咨询flask和springboot通信成功。1.前端分子转化、前沿论文集成页面和功能实现完成。3.后端性能管理、主页实现完成。

2024-06-24 10:13:34 319

原创 山东大学DrugLLM开发团队 项目实训(十一)

3.模型端Chat使用flask函数调用成功,接下来考虑flask和springboot的通信。4.设计分子生成、综合分析等平台界面及功能。1.前端主页界面完成。2.后端用户管理完成。

2024-06-24 10:10:34 95

原创 山东大学DrugLLM开发团队 项目实训(十)

2.模型端基本部署完成,从中抽取Chat类和Conversation类进行集成。1.前后端基本框架搭建,前端js和css对平台进行美化。3.对后期的功能做了规划。

2024-06-24 10:08:55 110

原创 2024.6.22 山东大学项目实训纪实

除此以外,修改了各种前后端传数据的问题,提供了训练出的更高精度的checkpoints,保证模型的正确性。3.增加页面布局,把登录的按钮css应用到其他的按钮,保证页面整体统一。2.调整图片路径导致图片无法正常显示的问题。1.调整宽度与屏幕不兼容问题。

2024-06-24 10:03:09 114

原创 2024.6.17 山东大学项目实训纪实

【代码】2024.6.17 山东大学项目实训纪实。

2024-06-24 09:51:37 84

原创 2024.6.15 山东大学项目实训纪实

数据库精选-前端代码。

2024-06-24 09:49:32 348

原创 2024.6.14 山东大学项目实训纪实

最终编写实现了一个 Drugchat 的演示应用程序,用户可以通过界面输入 SMILES 字符串与聊天机器人进行交互,并查看聊天的结果。通过编写这个demo,为后续编写Chat类,实现Chat与前端连接的功能实现了接口范例,同时对模型部署和训练的结果有了一个可视化的图形界面来进行检测。Gradio 构建的 DrugTeller 的演示应用程序。

2024-06-24 09:46:07 83

原创 2024.6.10 山东大学项目实训纪实

类的实例,表示一个名为 "CONV_VISION" 的对话,其中包含了一些初始属性值。类用于存储和操作对话历史记录。类,并重写了其中的方法。

2024-06-24 09:41:53 185

原创 山东大学项目实训纪实 2024.6.4

药物数据库是一个组织和存储药物相关信息的系统,它提供了药物的详细描述、特征、用途、剂量、副作用,或是药物分子的分子式,smiles、iupac等描述分子信息的数据。因此,对目前流行常用的药物分子数据库有一个大致的了解是非常有必要的,便于AI领域在对模型训练时进行抽取数据,同时其中一些文本库描述的数据可以为生物专业人士获得可以理解的药物分子的有关知识。首先我们在获取了目前流行的生物信息数据库的有关信息和具体网站,然后通过编写前后端,对数据库信息进行处理和获取,在前端中进行展示。

2024-06-24 08:23:25 211

原创 山东大学DrugLLM开发团队 项目实训(九)

2.前台展示页面的美化和完善(嵌入了一些css动画效果,使得页面更加协调不死板)3.租服务器,配置服务器环境,重新上服务器跑模型训练。1.css+js+html动画技巧学习、vu。的学习(帮助完成chat页面的嵌入)

2024-05-30 19:49:17 143

原创 山东大学DrugLLM开发团队 项目实训(八)

2.header头部美化、footer底部美化(包括echarts)、页面按钮美化、轮播主页实现。1.css+js+html动画技巧学习、可视化技术学习。3.将聊天chatroom嵌套到Consult咨询界面。4.更换vicuna-13b-v0的权重。

2024-05-30 19:48:02 146

原创 山东大学DrugLLM开发团队 项目实训(七)

2.根据训练出的模型,制作一个小demo,展示对话。1.制定美化方案、可视化技术学习。

2024-05-30 19:46:34 97

原创 山东大学DrugLLM开发团队 项目实训(六)

4.配置rdkit环境,编写配置smiles to graph。3.个人中心设计以及头像上传设计;1.再次整合系统需求;2.实现修改密码操作;

2024-05-30 19:45:01 128

原创 山东大学DrugLLM开发团队 项目实训(五)

2.集成mybatis-plus实现数据查询,实现增删改查,路由的设计,实现导入导出、实现用户登录,实现注册和异常处理,Springboot集成JWT,实现文件上传。3.开始训练drugchat。

2024-05-30 19:42:52 90

原创 山东大学DrugLLM开发团队 项目实训(四)

3.vue整合element、后台整体布局、整合echarts、用户前台页面设计,1.学习前后端技术;.获取制作数据集QA。

2024-05-30 19:41:15 87

原创 山东大学DrugLLM开发团队 项目实训(三)

1.vicuna-7b-v0原始weight的获取。

2024-05-30 19:39:00 136

原创 山东大学DrugLLM开发团队 项目实训(二)

3.整体项目规划(如下图)

2024-05-30 19:37:33 125

原创 山东大学DrugLLM开发团队 项目实训(一)项目概述

DrugLLM:基于大语言模型的药物分子性质分析平台药物发现和开发过程确实是一项耗时且成本高昂的工作。通常需要数年时间和数十亿美元才能将一种药物推向市场。这一过程涉及探索和理解广阔的化学空间以及分子结构与其生物活性之间的复杂关系。传统方法通常涉及费力的迭代测试,而后期的失败率很高,这使得我们迫切需要一种能够直观理解药物化合物分子图中固有复杂数据并产生有意义见解的工具。

2024-05-30 19:20:19 553

原创 山东大学项目实训纪实 2024.5.27

因为算力问题,13b的训练中止了一段时间,虽然不知道13b的最终效果怎么样,但是我们打算租一张卡跑一下训练,然后根据效果看看是否要用13b。经过多方比较后,我们打算在autodl上面租服务器,选择了一张L20,目前来看应该是可以符合我们的训练要求的算力要求的。跑的也不快,一个epoch大概需要六个小时作用,看看跑出来的效果如何吧。根据emvironment.yml提供的环境进行配置。配置过程比较艰辛(略)部署完后项目的结构如下。

2024-05-30 17:00:11 766

原创 山东大学项目实训纪实 2024.5.20

7b的模型还是不太聪明,多训练了几个epoch效果还是不佳,打算换13b的vicuna进行训练。4.结果保存在vicuna-13b-weight-save中,使用tree命令看一下文件构造。至此,vicuna-13b的weight就找到了,可以重复之前的过程进行训练了。美好的过程,总算是找到了13b的参数,用tree命令查看一下13B的文件夹。训练需要40G,目前实验室的服务器达不到这个标准。接下来要得到vicuna-13B有两个步骤。接下来考虑租服务器吧.....核对一下SHA256是否正确。

2024-05-30 16:46:00 203

原创 山东大学项目实训纪实 2024.5.11

目前可以做到给一个smiles,进行提问,回答该smiles的一些特点之类的。(但是vicuna对中文来说不太友好,建议提问的时候用英文提问会更精确一些,因为训练编的QA也是英文的)使用vicuna7b-v0跑出来的模型,根据这个跑出来的模型,写一个小的demo展示一下,后面再完善ui和管理端。写出来的小demo大致长这个样子(简单一写,等回头写前后端的同学写好了ui再合起来)目前有个缺点,就是7b的模型,精度不高,回答的问题有些地方有错误,还需要再调一下。

2024-05-30 16:28:37 261

原创 山东大学项目实训纪实2024.5.4

6.smiles2graph(smiles_string) smiles to graph:将smiles字符串转换为图形数据对象,首先将smiles字符串转换为RDkit的分子对象mol,然后使用前面的2~5的函数将原子和化学键转换为特征列表,最后构建包含边索引,边特征、节点特征和节点数量的字典,并将其返回为图形对象。通过读入文本文件中的内容,解析时间戳和smiles字符串,然后使用6的函数把smiles字符串转化为图形对象,并将时间戳和图形对象保存到一个pickle文件中。通过本地启动演示进行推理。

2024-05-30 15:21:33 413

原创 山东大学项目实训纪实 2024.4.27

使用 bash finetune_gnn.sh 命令开始训练,这里注意,配置文件train_configs/drugchat_stage2_finetune.yaml中有个地方是有问题的,model:ckpt:中不需要填写,把已填内容改为""即可。训练得到多个记录点(用实验室的3090的一张卡跑的,非常慢非常慢非常慢,完整跑完10个epoch用了四天时间,前期还出现各种各样的bug,硬控10天左右),只提供delta版的权重(真实权重与获取到的权重的差值),所以需要自己获取vicuna的权重。

2024-05-30 13:46:09 341

原创 山东大学项目实训纪实 2024.4.20

在整个数据集中,我们确定了14,816种包含药物信息的化合物。在进一步过滤排除描述信息不足的药物后,我们最终得到了一个包含3892种药物的数据集。我们从PubChem网站上收集数据,该网站上有66,469,244种化合物的信息。在这些化合物中,有19319种具有药物信息,在过滤掉缺乏详细文字描述的药物后,我们保留了6942种药物。data/ChEMBL_QA.json data/PubChem_QA.json {SMILES字符串:[[问题1, 答案1],[问题2, 答案2] ……

2024-05-29 17:12:57 273

原创 山东大学项目实训纪实 2024.4.14

这篇文章介绍了一种名为DrugChat的系统,旨在将ChatGPT类似的功能应用于药物分子图,从而革新我们与这些复杂实体互动和理解的方式。使用 bash finetune_gnn.sh 命令开始训练,这里注意,配置文件train_configs/drugchat_stage2_finetune.yaml中有个地方是有问题的,model:ckpt:中不需要填写,把已填内容改为""即可。本次我们使用的轻量级的v0版本的Vicuna-7b(本来想用13b的,但是目前还没有找到可以用的13b的weight权重)

2024-04-14 16:00:22 1060 1

原创 山东大学项目实训纪实 2024.4.5

为了调研生物大模型的有关背景,阅读了文章<Leveraging Biomolecule and Natural Languagethrough Multi-Modal Learning: A Survey>,下面是对该文章的总结。随着大模型和 AI4Science 的蓬勃发展,越来越多的工作开始关注生物分子(Biomolecule)与自然语言(Language)的联合建模。这种方法利用文本数据中所包含的生物分子的丰富、多方面的描述,增强模型对其的理解,提高生物分子属性预测等下游任务的效果,

2024-04-11 16:11:52 966

原创 山东大学DrugLLM开发团队 项目实训(一)项目概述

DrugLLM:基于大语言模型的药物分子性质分析平台,可用于研究人员进行药物相互作用预测、药物性质分析等提供支持。

2024-04-05 21:59:53 1565 1

原创 DrugLLM:基于大语言模型的药物分子性质分析平台

本篇文章用于介绍山东大学软件学院大三下项目实训有关内容。

2024-03-24 16:50:17 148

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除