自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(176)
  • 收藏
  • 关注

原创 【SQL】有至少五名直接下属的经理

经理和下属均具有独立id,经理的managerId为null,下属的managerId为对应经理id。该表的每一行表示雇员的名字、他们的部门和他们的经理的id。没有员工会成为自己的管理者。,你可以根据两个表中的某些列之间的匹配关系,获取这些表的组合结果集。是一种用于结合来自两个或多个表的数据的 SQL 操作。该表的每一行表示雇员的名字、他们的部门和他们的经理的id。需要计数,按照经理的id分组 group by e1.id。id 是此表的主键(具有唯一值的列)。找出至少有五个直接下属的经理。

2024-10-01 17:14:22 767

原创 【SQL】大的国家

如果一个国家满足下述两个条件之一,则认为该国是 大国 : 面积至少为 300 万平方公里(即3000000 km2),或者 人口至少为 2500 万(即 25000000)语句在SQL(Structured Query Language,结构化查询语言)中扮演着至关重要的角色,它主要用于过滤数据,确保只检索、更新或删除满足特定条件的记录。语句需要精确构建条件表达式,以避免误操作数据,在处理大数据集时,合理利用索引能显著提升查询性能。这张表的每一行提供:国家名称、所属大陆、面积、人口和 GDP 值。

2024-10-01 16:08:50 747

原创 【SQL】笛卡尔积比较收入更高的员工

两个表之间笛卡尔积(Cartesian product)的形式,用了逗号分隔的连接(comma-separated join),这是早期SQL语法中用于连接表的一种方式,也可以使用显式的。,但由于没有提供连接条件,这两个表将按照它们的行数进行笛卡尔积组合。观察员工id和经理id的关系,这个只需要找比对应经理高的即可。该表的每一行都表示雇员的ID、姓名、工资和经理的ID。id 是该表的主键(具有唯一值的列)。编写解决方案,找出收入比经理高的员工。Joe 是唯一挣得比经理多的雇员。这里指定了查询要使用的表。

2024-09-30 17:34:13 245

原创 SSL VPN | Easyconnect下载&安装&使用 (详尽)

EasyConnect是一款远程连接工具,为用户提供简便、快捷的远程访问和控制解决方案。

2024-09-30 11:03:39 561

原创 【SQL】每个部门工资最高的员工

子查询(Subquery)是一种强大的特性,允许在另一个查询中嵌套一个或多个SQL查询。子查询的结果可以作为另一个查询的条件、值或表来使用,从而实现复杂的查询逻辑。Max 和 Jim 在 IT 部门的工资都是最高的,Henry 在销售部的工资最高。此表的每一行都表示员工的 id、姓名和工资。| 列名 | 类型 |此表的每一行都表示一个部门的 id 及其名称。查找每个部门中薪资最高的员工,首先需要分组。在 SQL 中,id 是此表的主键列。在 SQL 中,id是此表的主键。

2024-09-29 17:56:12 699

原创 【SQL】重复的邮箱信息

语句主要用于结合聚合函数(如 COUNT(), MAX(), MIN(), SUM(), AVG() 等)来将结果集中的多行数据组合成更小的分组,以便对每个分组执行计算。这样做的好处是可以对数据进行汇总分析,比如计算每个部门的员工数量、每个产品的销售总额等。操作中,所有具有相同值的行会被分在同一组中,包括 NULL 值。首先需要按照Email进行分组,后通过统计Email数量的形式,多于一次即意味着重复,group by Email。函数可以应用于任何类型的列,但实际上,在大多数情况下,它用于计算非空(

2024-09-29 14:54:34 920

原创 【SQL】未订购的客户

(或称为左外连接)是SQL中的一种连接类型,它用于从两个或多个表中基于连接条件返回左表(LEFT JOIN语句左侧的表)的所有记录,以及右表中满足连接条件的记录。基于共同的客户 ID(在 customers 表中的 id 列和 orders 表中的 customerId 列),将表 customers 与表 orders 进行连接。子句是一个非常重要的组成部分,它用于指定筛选数据的条件,从而限制查询结果集仅包含满足条件的行。该表的每一行都表示订单的 ID 和订购该订单的客户的 ID。

2024-09-28 18:24:01 714

原创 【GAN】生成对抗网络Generative Adversarial Networks理解摘要

GAN本质是对抗或者说竞争,通过生成器和鉴别器的竞争获取有效地结果,换句话说,GAN是在养蛊,大量数据和批次的训练最终培养出最合适的蛊王,而不合适的死于对抗。

2024-09-28 16:31:50 886

原创 【SQL】筛选字符串与正则表达式

请注意,你可以在方括号内指定的字符范围的数量没有限制,您可以添加想要匹配的其他字符或范围。\.:表示句点字符。请注意,字符 ^ 用来否定字符范围,它在方括号内的含义与它的方括号外表示开始的含义不同。[a-z]*:表示一个字符范围,匹配从 a 到 z 的任何字符 0 次或多次。[a-z]+:表示一个字符范围,匹配从 a 到 z 的任何字符 1 次或多次。,所以^[a-zA-Z]+[a-zA-Z0-9_.-]*,这里面包含小写字。[a-z]:表示一个字符范围,匹配从 a 到 z 的任何字符。

2024-09-26 16:37:30 1031

原创 【SQL】指定时间段的下单产品

where 子句用于对查询的数据进行筛选,使用 order_date >= '2020-02-01' and order_date < '2020-03-01' 条件来确定订单发生时间在 2020 年 2 月份。随后使用having子句限制条件为不少于100的产品,注意having子句用于对分组后的数据进行过滤,需要在group by 之后,只有当 unit 汇总结果大于等于 100 时,当前分组的数据才被保留。2020 年 2 月份下单 product_id = 2 的产品的数目总和为 80。

2024-09-26 14:31:42 1113

原创 【SQL】产品分组销售

是 SQL 中的一个聚合函数,主要用于将分组后的多个行的值连接成一个字符串。对于2020-05-30,出售的物品是 (Headphone, Basketball, T-shirt),按词典序排列,并用逗号 ',' 分隔。子句,但这可能会导致每次查询时返回的行顺序不同,因为数据库管理系统DBMS不保证未指定排序的查询结果的顺序。首先按照第一个列排序,然后在该列的值相同的情况下,按照第二个列排序,依此类推。对于2020-06-01,出售的物品是 (Pencil, Bible),按词典序排列,并用逗号分隔。

2024-09-25 16:11:59 886

原创 【Python】数据可视化之热力图

热力图(Heatmap)是一种通过颜色深浅来展示数据分布、密度和强度等信息的可视化图表。它通过对色块着色来反映数据特征,使用户能够直观地理解数据模式,发现规律,并作出决策。

2024-09-25 14:12:08 893

原创 【Python】数据可视化之点线图

在散点图中,每个观测值(或数据点)都被表示为一个点,其中横轴(X轴)代表一个变量的值,而纵轴(Y轴)代表另一个变量的值。Lineplot是Seaborn库中用于绘制折线图的函数,它能够帮助用户可视化数据集中不同变量之间的关系,特别是展示随时间变化的数据趋势。气泡图(Bubble Chart)是一种多变量的数据可视化图表,它是散点图的一种变体,也可以看作是散点图和百分比区域图的组合。style:控制数据点的样式或线条的样式,如点型、线型等,同样可以根据数据集中的某列进行映射。

2024-09-24 23:46:24 1227

原创 【损失函数】交叉熵作为损失函数的理论依据

交叉熵是信息论中的一个重要概念,主要用于度量两个概率分布之间的差异。在信息论中,交叉熵描述了用非真实分布q来表示来自真实分布p的平均编码长度所需的比特数。如果两个分布完全相同,则交叉熵达到最小值(即0),表示编码是完美的。反之,如果两个分布差异较大,则交叉熵会增大,表示编码效率降低。在深度学习中,交叉熵被用作一种损失函数,来衡量模型预测的概率分布与真实概率分布之间的差异。这种差异越小,说明模型的预测越准确,损失也就越小。

2024-09-24 16:49:08 835

原创 【Python】数据可视化之分布图

分布图主要用来展示某些现象或数据在地理空间、时间或其他维度上的分布情况。它可以清晰地反映出数据的空间位置、数量、密度等特征,帮助人们更好地理解数据的内在规律和相互关系。

2024-09-23 19:58:37 1718

原创 【损失函数】KL散度与交叉熵理解

变分自编码器等模型中会引入Kullback-Leibler散度作为损失函数。

2024-09-23 17:32:05 1873

原创 【Python】数据可视化之核密度

KDEPlot(Kernel Density Estimate Plot,核密度估计图)是seaborn库中一个用于数据可视化的函数,它基于核密度估计(KDE)这一非参数统计方法来估计数据的概率密度函数。KDEPlot能够直观地展示数据的分布特征,对于单变量和双变量数据均适用。

2024-09-04 12:20:50 1463

原创 【解决办法】最新0.13.2Seaborn未以关键字参数传递数据,报错kdeplot() takes from 0 to 1 positional arguments but 2 were given

KDEPlot(Kernel Density Estimate Plot,核密度估计图)是seaborn库中一个用于数据可视化的函数,它基于核密度估计(KDE)这一非参数统计方法来估计数据的概率密度函数。KDEPlot能够直观地展示数据的分布特征,对于单变量和双变量数据均适用。

2024-09-04 10:25:25 224

原创 【Python】数据可视化之分类图

分簇散点图Swarmplot,是一种用于展示分类变量和数值变量之间关系的数据可视化图表类型,特别适用于探索多个分类级别下数据的分布情况,简单说就是数据点不重叠的分类散点图swarmplot()作为可视化的工具,不仅能够单独使用来展现数据的分类特征,还常作为箱形图(Boxplot)或小提琴图(Violin Plot)的补充手段。这种表示方式不仅展示了数据的中心趋势(如中位数附近的密集区域),还揭示了数据的整体形状、对称性、多峰性以及可能的异常值区域,从而提供了比箱形图更为丰富和细致的数据分布信息。

2024-09-03 17:50:14 1783

原创 【SQL】跳过记录筛选第二名

当从数据库表中查询数据时,如果表中某列包含重复的值,而又只想获取这些值的唯一列表,那么就可以使用。,那么 SQL 会返回这些列组合起来的唯一值。子句通常一起使用来限制查询结果的数量,并指定从哪里开始获取这些结果。这通常用于获取查询结果的第二行数据(假设结果集是按某种顺序排列的,比如按主键或某个特定的列排序)。可以考虑使用 ifNull(查询,null)方法,或者通过外层再加一层查询,使其作为临时表。在某些数据库系统中(如SQL Server),可能需要使用不同的语法来实现分页,比如。id 是这个表的主键。

2024-09-03 10:17:02 1045

原创 【Python】企业排名、地域分布与词云分析可视化

生成的可视化数据显示,世界五百强企业的营业收入呈现出显著的差异,这种差异不仅体现了行业内巨头企业与新兴或中小型产业代表之间的鲜明对比,还深刻揭示了不同经济领域之间市场规模的差异性。紧随其后的是由香港、上海、深圳和杭州构成的第二梯队,这些城市同样凭借其强大的经济实力、完善的产业体系和创新能力,吸引了大量五百强企业的入驻,形成了较为密集的企业集群。:Pyecharts支持多种常用的图表类型,包括但不限于折线图、柱状图、散点图、饼图、地图、热力图、雷达图、箱形图、K线图等,能够满足不同场景下的数据可视化需求。

2024-09-02 17:53:28 1538

原创 【SQL】Delete使用

子查询(Sub Query)或称为内查询(Inner Query)、嵌套查询(Nested Query),是SQL语言中一种常用的程序模块,用于在一个查询语句中嵌套另一个查询语句。当一个查询的结果是另一个查询的条件时,这个查询就被称为子查询。子句可以包含各种条件,这些条件可以基于一个或多个列的值。可以直接作笛卡尔积,比较id大小和电子邮箱,删除所有id较大且相同的电子邮箱。id 是该表的主键列(具有唯一值的列)。通过子查询查找id最小的电子邮箱,同样的思路,也可以通过子查询实现。运行脚本后,显示的答案是。

2024-09-02 11:55:00 975

原创 【SQL】特定字符串检索

在某些数据库系统中,如果xxx列包含NULL值,并且试图使用LIKE来搜索这些值,那么这些NULL值将不会被匹配,因为NULL表示“未知”或“无值”,而不是空字符串或任何特定的文本值。在SQL中,要实现检索特定字符串也可以通过regexp,这是一个强大的字符串匹配函数,它使用正则表达式(Regular Expressions)来搜索和匹配字符串模式。这里的xxx是表中的一个列名,而like后面跟着的是要匹配的模式,模式中可以包含通配符来代表任意数量的字符。这个表包含医院中患者的信息。

2024-09-01 19:34:55 670

原创 【SQL】统一字符格式

其他字符即第一个字符以后的所有字符,通过substring(name,2)选取第二个字符及其之后的字符,通过lower使得它们变为小写形式,lower(substring(name,2))字符分开处理后通过concat进行拼接,concat(upper(substring(name,1,1)), lower(substring(name,2)))通过substring(name,1,1)选取第一个字符,然后通过upper使得其为大写,upper(substring(name,1,1))

2024-09-01 14:44:16 1372

原创 【Python】家庭用电数据的时序分析

数据集包含了一个家庭6个月的用电数据,收集于2007年1月至2007年6月。这些数据包括全球有功功率、全球无功功率、电压、全球强度、分项计量1(厨房)、分项计量2(洗衣房)和分项计量3(电热水器和空调)等信息。该数据集共有260,640个测量值。列名说明Date日期Time时间该家庭所消耗的总有功功率(千瓦)该家庭消耗的总无功功率(千瓦)Voltage向家庭输送电力的电压(伏特)输送到家庭的平均电流强度(安培)厨房消耗的有功功率(千瓦)洗衣房所消耗的有功功率(千瓦)

2024-08-31 15:58:19 1262

原创 【SQL】窗口函数的妙用

通过窗口函数按照tiv2015分别计数,要求计数大于1即可实现,count(*) over(partition by tiv_2015) b。其 tiv_2015 与其他投保人不同,并且位置与第三条记录相同,这也导致了第三条记录不符合题目要求。tiv_2015 是该投保人在 2015 年的总投保金额,tiv_2016 是该投保人在 2016 年的总投保金额。因此,结果是第一条记录和最后一条记录的 tiv_2016 之和,即 45。tiv_2015 值为 10 与第三条和第四条记录相同,且其位置是唯一的。

2024-08-31 13:15:02 1007

原创 【SQL】好友申请

需要查找拥有最多好友数目的人和具体数目,而一条申请记录代表两人均增加一位好友,故可以将申请好友者列连接接受好友者列,以id为组,统计好友数目。这可以避免一些繁琐情况。(requester_id, accepter_id) 是这张表的主键(具有唯一值的列的组合)。编号为 3 的人是编号为 1 ,2 和 4 的人的好友,所以他总共有 3 个好友,比其他人都多。这张表包含发送好友请求的人的 ID ,接收好友请求的人的 ID ,以及好友请求通过的日期。编写解决方案,找出拥有最多的好友的人和他拥有的好友数目。

2024-08-30 14:22:55 573

原创 【SQL】餐馆营业额七日均线数据

第一个七天消费平均值从 2019-01-01 到 2019-01-07 是restaurant-growth/restaurant-growth/ (100 + 110 + 120 + 130 + 110 + 140 + 150)/7 = 122.86。第四个七天消费平均值从 2019-01-04 到 2019-01-10 是 (130 + 110 + 140 + 150 + 80 + 110 + 130 + 150)/7 = 142.86。该表包含一家餐馆的顾客交易数据。返回结果格式的例子如下。

2024-08-29 11:16:21 1304

原创 【SQL】电影评分

通过where限制时间为2020年2月,where created_at>='2020-02-01' and created_at<'2020-03-01'Frozen 2 和 Joker 在 2 月的评分都是 3.5,但是 Frozen 2 的字典序比较小。(movie_id, user_id) 是这个表的主键(具有唯一值的列的组合)。,即按字母在字典中出现顺序对字符串排序,字典序较小则意味着排序靠前。movie_id 是这个表的主键(具有唯一值的列)。user_id 是表的主键(具有唯一值的列)。

2024-08-28 14:14:45 617

原创 【SQL】换座位

可以再次通过if,使得最后一位同学id不变,if(id=(select count(*) from Seat), id, id+1)这里两个连续的学生换位,即偶数位减一,奇数位加一,不必使用case when等,通过简单的if可以实现。如果学生的数量是奇数,则最后一个学生的id不交换。注意到,前面仅适用于学生总数是偶数的情况,如果学生数量是奇数,最后一位同学座位不变。请注意,如果学生人数为奇数,则不需要更换最后一名学生的座位。该表的每一行都表示学生的姓名和 ID。是该表的主键(唯一值)列。

2024-08-28 10:36:40 435

原创 【SQL】筛选上级经理离职的员工

2.离职经理的id在employ_id删除了,但是在manager_id中没有删除。Joziah 的上级经理是 6 号员工,他已经离职,因为员工表里面已经没有 6 号员工的信息了,它被删除了。并且他们的上级经理已离职。当一个经理离开公司时,他们的信息需要从员工表中删除掉,但是表中的员工的。Kalel 的上级经理是 11 号员工,他还在公司上班(他是 Joziah )。上级经理已离职的情况,即not in在职,考虑子查询,这个表包含了员工,他们的薪水和上级经理的id。查找这些员工的id,他们的薪水严格少于。

2024-08-27 10:44:52 882

原创 【SQL】分类统计的薪水

与Low Salary同理,select 'High Salary' category, ifnull(sum(if(income>50000,1,0)),0) accounts_count。严格低于,income<20000,通过sum,if结合计数,不必case when,sum(if(income<20000,1,0))考虑若类别中没有账户,即没有数据中没有账户满足Low Salary的条件,会报null,通过ifnull使其报告0。在 SQL 中,account_id 是这个表的主键。

2024-08-27 09:28:45 644

原创 【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

目标检测和实例分割是计算机视觉的基本任务。目标检测的传统方法中通常利用边界框技术进行对象定位,然后利用逐像素分类为这些本地化实例分配类。但是当处理同一类的重叠对象时,或者在每个图像的对象数量不同的情况下,这些方法通常会出现问题。Faster R-CNN、Mask R-CNN等经典方法虽然有效,但由于其固定大小的输出空间,它们通常预测每个图像的边界框和类的固定数量,这可能与图像中实例的实际数量不匹配,特别是当不同图像的实例数量不同时。并且它们可能无法充分处理相同类的对象重叠的情况,从而导致分类不一致。

2024-08-26 17:17:55 912

原创 【Pytorch】生成对抗网络实战

GAN框架是基于两个模型的竞争,generator生成器和discriminator鉴别器。生成器生成假图像,鉴别器尝试从假图像中识别真实的图像。作为这种竞争的结果,生成器将生成更好看的假图像,而鉴别器将更好地识别它们。定义生成器模型# 获取参数# 定义反卷积层1# 定义批归一化层1# 定义反卷积层2# 定义批归一化层2# 定义反卷积层3# 定义批归一化层3# 定义反卷积层4# 定义批归一化层4# 定义反卷积层5# 前向传播# 反卷积层1# 反卷积层2# 反卷积层3。

2024-08-26 10:48:25 2402

原创 【SQL】窗口函数sum() over ( partition by xx order by xx)

可以发现, 结合 partition by 和 order by 使用窗口函数后,意味着分组按行,对每一行之前的数据进行聚合计算,这种计算适合用于统计一些累加的数据分析,如。可以发现,窗口函数仅使用Partition by,类似于使用 group by 之后,对每一个分组进行一次 sum 计算,只是同一个分组下每一行都计算了相同的一次。结合 partition by 和 order by 使用窗口函数。窗口函数可分为专用窗口函数和作为窗口函数使用的聚合函数。仅按照partition by开窗。

2024-08-25 14:14:50 784

原创 【SQL】最后一个能上车的人

上巴士且不超过重量限制的乘客,并报告。

2024-08-25 13:30:37 600

原创 【Python】家庭用电数据分析Prophet预测

数据集包含了一个家庭6个月的用电数据,收集于2007年1月至2007年6月。这些数据包括全球有功功率、全球无功功率、电压、全球强度、分项计量1(厨房)、分项计量2(洗衣房)和分项计量3(电热水器和空调)等信息。该数据集共有260,640个测量值。列名说明Date日期Time时间该家庭所消耗的总有功功率(千瓦)该家庭消耗的总无功功率(千瓦)Voltage向家庭输送电力的电压(伏特)输送到家庭的平均电流强度(安培)厨房消耗的有功功率(千瓦)洗衣房所消耗的有功功率(千瓦)

2024-08-24 15:15:07 1096

原创 【SQL】指定日期的产品价格

通过ifnull,若为null,则价格为10,ifnull(b.new_price,10)(product_id, change_date) 是此表的主键(具有唯一值的列组合)。关键点在找到 2019-08-16 前所有有改动的产品及其最新价格和没有修改过价格的产品。即针对一种产品,找到其在2019-08-16 前的最新价格,也就是最新日期的价格。这张表的每一行分别记录了 某产品 在某个日期 更改后 的新价格。时全部产品的价格,假设所有产品在修改前的价格都是。编写一个解决方案,找出在。结果格式如下例所示。

2024-08-24 12:02:16 773

原创 【SQL】连续出现的数字

通过distinct每个数字仅取一次,select distinct num as ConsecutiveNums。即(id,num)中id+1,+2,num不变。单纯面向题目,三表连接或者子查询即可实现。在 SQL 中,id 是该表的主键。1 是唯一连续出现至少三次的数字。找出所有至少连续出现三次的数字。返回的结果表中的数据可以按。id 是一个自增列。

2024-08-23 14:57:35 603

原创 【SQL】关注者数量

(user_id, follower_id) 是这个表的主键(具有唯一值的列的组合)。count计数,count(follower_id) followers_count。该表包含一个关注关系中关注者和用户的编号,其中关注者关注用户。使用order by升序排列order by user_id。编写解决方案,对于每一个用户,返回该用户的关注者数量。按照用户id分组,group by user_id。查询结果的格式如下示例所示。2 的关注者有 {0,1}0 的关注者有 {1}1 的关注者有 {0}

2024-08-23 11:09:50 689

Python企业排名、地域分布与词云分析数据集

Python企业排名、地域分布与词云分析数据集

2024-09-02

生成式深度学习数学原理.pdf

生成式深度学习数学原理.pdf

2024-07-21

HCCDA – AI华为云人工智能开发者认证60判断题及答案.docx

HCCDA – AI华为云人工智能开发者认证60判断题及答案+针对华为云人工智能开发者认证理论考试+原题题库

2023-09-13

C语言程序设计期末试题及答案详解1.pdf

C语言程序设计期末试题及答案详解1.pdf

2023-09-11

C语言程序设计期末试题及答案解析1-3.pdf

C语言程序设计期末试题及答案解析1-3.pdf

2023-09-10

C语言程序设计期末试题及答案解析1-2.pdf

C语言程序设计期末试题及答案解析1-2.pdf

2023-09-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除