自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 【RAG实战】中医医疗问答系统

这里的知识库数据集来自于网络上搜集的五个文件,可以看到均为pdf格式文件。​​。

2025-12-04 16:52:30 471

原创 Lora微调glm-4-9b-chat模型,完成多文档摘要生成任务

GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。本代模型增加了多语言支持,支持包括日语,韩语,德语在内的 26 种语言。

2025-11-24 12:44:49 797

原创 思腾合力云服务器远程连接

因为我们学院采购的是思腾合力的工作站,当时在配置工作站的时候去官网查找过一些信息,碰巧看到这个产品还提供云服务器租赁,所以想着开通一下玩一玩,然后去b站上查了一些教程基本上没有基于该平台的连接教程,少数存在的几个视频还是比较老的版本了,所以在我根据官方教程配置成功并且顺利运行代码后分享一下基于这个平台的云服务器远程连接问题。

2025-11-01 16:03:26 908

原创 【leetcode hot 100】49.字母异位词分组

Python字典是一种的数据类型,用于存储。字典中的每个键(key)都唯一且不可变,它对应一个值(value)。

2025-10-29 19:02:19 335

原创 【论文解读】:PDFormer-模型结构部分

交通流预测作为智能交通系统的核心技术,具有广泛的应用前景。交通流预测面临的根本挑战是对交通数据中复杂的时空依赖关系进行有效建模。时空图神经网络(GNN)的交通预测模型存在三大局限性:1)大多数方法以静态方式建模空间依赖性,这限制了学习动态城市交通模式的能力;ii)大多数方法只考虑短期的空间信息,无法捕捉长期的空间依赖关系;iii)这些方法忽略了交通状况在地点之间的传播在交通系统中具有时间延迟的事实。为此,我们提出了一种新颖的传播延迟感知动态远程transformer,即PDFormer,用于准确预测交通流。

2025-06-11 16:24:26 2047

原创 【SQL基础题十七】项目员工

这个题很简单只需要通过employee_id进行联表查询即可解决,具体细节不多描述,完整代码如下。我们看到示例的计算方法 可以确定要用到的计算公式为。

2025-06-02 14:35:27 209

原创 【SQL基础题十六】平均售价

在这里我们考虑了purchase_date为null值的情况,然后我们可以将这个子查询插入我们的主代码即可满足需求。我们看到这个示例,我们要找到每个产品在不同时期各自的售价和数量,然后平均。根据计算方法我们可以确定计算公式为。在这里使用了一个case条件语句来筛选purchase_date为null值的情况。

2025-06-02 14:28:43 363

原创 【SQL基础题十五】有趣的电影

我们先来看查询条件,要求返回description不等于boring且id为奇数的影片,而且最后要按照rating降序排列。这里面唯一注意的就是如何筛选出奇数的id,我们可以使用mod函数,mod(x,y)返回的是x/y的余数,所以我们可以用mod(id,2)=1来筛选出id为奇数的数据。注意我们要返回id为奇数的方法有很多,但是mod是最直接且快速的一种。

2025-05-28 14:06:40 252

原创 【SQL基础题十四】确认率

我们看到题目在这里需要计算两个数量,第二张表按user_id分组求得各id的confirmed数量当作分子、第二张表的总请求数量当作分母。然后需要特地注意一点就是我们有的id可能没有请求所以总请求数量为0,所以我们将使用一个条件赋值。那么难点就在于我们怎么将两个数量放置在一个查询语句中表现出来。在这里我用的比较直接就是没脑子的方法,我用了两个子查询分别将两个数量计算出来,然后给这两个子查询命名为两这张表,然后我们通过user_id进行外连接。

2025-05-26 23:51:20 878

原创 【SQL基础题十三】至少有五名直接下属的经理

在这里我们分步骤进行查看结果。运行结果:很明显我们需要拿出name或者id出现大于等于5次的name,我们只需要where count(name或者id) >= 5 group by name或者id。但是在这里题目出现了一个比较恶心的地方就是,表内可能会出现名字重复的经理,此时我们使用name进行分组就区分不开,所以只能使用id进行分组和统计,这样就能得到我们想要的答案。

2025-05-25 23:11:42 167

原创 【SQL基础题 十二】学生们参加各科测试的次数

首先说的是这个题比较有难度,需要我们在答题页面逐一试错。为什么这一步我们实现不了题目要求呢,因为我们题目要求输出id对应参加各个科目的次数,也就是说就算某学生没参加某考试,也要将其展现出来只不过次数列为0。现在我们已经有了学生参加了考试的次数,现在我们要想办法把每个学生对应所有科目的组合都表示出来,在这里我们用到交叉连接将两个表中的所有行进行组合的连接方式,结果集的行数是两个表行数的乘积(即笛卡尔积)。

2025-05-25 11:58:00 524

原创 【SQL基础题十一】员工奖金

我们看到这是一个双表联合查询,两表通过empid链接。在这里我们要输出的字段是name和bonus,查询条件是bonus<=1000,注意在这里看似只有一个条件但是我们知道要是有的行在bonus这的值是null时应该表示没有奖金也是满足<1000的条件的,所以这里要用or连接两个条件。综上代码如下。

2025-05-22 15:36:36 467

原创 【SQL基础题十】每台机器的进程平均运行时间

我们可以看到上面示例我们要计算在同一machine_id下所有process_id的平均耗时,每个process_id记录了开始时间和结束时间。首先这是在一张表中 进行计算 ,所以我们肯定要使用到自连接,另外我们要计算(activity_type = end) - (activity_type = start)的平均时间,且要保证是在同一machine_id和process_id下,所以 在这里我们可以确定我们两张表连接的规则。

2025-05-22 14:58:29 505

原创 【SQL基础题九】上升的温度

首先我们看到题目需要查询的字段为id,再看查询条件“比前一天温度更高的日期id”,然而在这里只给出了一个表,且需要进行自比较,所以我们需要进行自连接。然后查询条件严格限制了与前一天进行比较,且表中记录时间的字段是date日期类型,所以我们用到date_sub函数,用于从指定日期中减去一个时间间隔,函数语法是。

2025-05-21 19:53:37 413

原创 【SQL基础题八】进店却未进行交易的顾客

我们首先看到题目需要查询的字段customer_id和只光顾不交易的次数,在这里我们首先可以确定用到一个函数count(customer_id),既然我们统计次数了我们就要确定按照分组规则,在这里很明显是按照customer_id进行分组。第二步,我们需要在两个表之间进行操作所以在这里可以使用左外连接left join,而我们的 连接关系只能是两个表都有的visit_id,我们可以进行下面操作。

2025-05-20 14:11:10 471

原创 【SQL基础题七】产品销售分析

我们看到题目要求,需要查询product_name、year、price三个字段内容,这三个字段分布在两个表中,且两个表通过,product_id连接,所以在这里我们可以使用左外连接进行串联,具体代码如下。

2025-05-20 00:00:00 265

原创 【SQL基础题六】使用唯一标识码替换员工id

看到题目这是一个多表查询,我们需要输出表Employees中的name列和表EmployeeUNI中的unique_id列,并且要求没有唯一标识码的员工,输出name但是unique_id使用null填充,所以在这里我们要使用左外连接,我们的Employees表作为左表,这样我们可以输出左表的全部查询字段信息。

2025-05-15 20:54:16 216

原创 【SQL基础题五】无效的推文

我们看到题目查询条件推文内容的字符数严格大于15时则认定成无效,然后我们看到content列是varchar数据类型,所以在这里我们要用到char_length()来统计字符串长度。

2025-05-15 16:20:54 173

原创 【SQL基础题四】文章浏览

我们先看题目要求:1、查询浏览过自己文章的作者,即要求author_id = viewer_id,2、按照作者的id升序排列,即order by author_id asc。然后我们看到对于表的描述,表中不存在主键就意味着会出现重复行,然而我们在查询时对重复行只需要输出一行即可,所以我们要分组输出,即group by id。综上我们的代码是。

2025-05-14 23:49:19 260

原创 【SQL基础题三】大的国家

我们可看到题目要求,输出字段为name,population,area,所以前半部分就确认了。

2025-05-14 00:29:26 146

原创 【SQL基础题二】寻找用户推荐人

我们可以看到Customer表,referee_id是推荐他们的客户id,这一列包括null值,所以我们在查询时要考虑两种情况:一是referee_id不等于 1的,二是referee_id为null值的,现在我们要将满足这两个条件中的一种给提取出来。我们使用两个条件查询。因为两个条件是或者的关系,所以中间用or连接,查询语法为。

2025-05-12 20:52:08 358

原创 【NLP实战】自然语言处理在中医疾病诊断中的应用

本文使用Bert+LSTM模型实现对于中医疾病的诊断应用,在训练epoch=20的情况下准确率达到了0.9364,效果喜人。

2025-05-12 15:10:38 2330 4

原创 【SQL基础题一】可回收且低脂的产品

Productsproduct_id是该表的主键(具有唯一值的列)。low_fats是枚举类型,取值为以下两种 ('Y', 'N'),其中 'Y' 表示该产品是低脂产品,'N' 表示不是低脂产品。recyclable是枚举类型,取值为以下两种 ('Y', 'N'),其中 'Y' 表示该产品可回收,而 'N' 表示不可回收。然后我们看到我们需要查询的字段是product_id,表名为Products,

2025-05-12 14:08:59 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除