自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 【MySQL】CAST()在MySQL中的用法以及其他常用的数据类型转换函数

CAST()在 MySQL 中用于将一个表达式的类型转换为另一个类型。这在处理不同类型的数据时非常有用,比如将字符串转换为数字,或者将浮点数转换为整数等。

2024-09-25 15:39:09 1007

原创 【MySQL】regexp_replace在MySQL以及regexp extract all在MySQL的用法

在MySQL中,函数用于在字符串中搜索正则表达式模式,并用指定的字符串替换该模式的每个匹配项。

2024-09-24 17:11:14 477

原创 【SQL】累计统计方法,使用SQL详细写出

累计统计通常指的是在一组数据中,计算每个数据点的累积总和或者累积其他统计量。在SQL中,这通常可以通过使用窗口函数(如)来实现。

2024-09-24 00:51:03 994

原创 【SQL】总结Select语句中用来连接字符串的方法

每种方法都有其适用场景,选择哪种方法取决于你的具体需求和使用的数据库系统。

2024-09-23 22:42:40 501

原创 【MySQL】获取最近7天和最近14天的订单数量,使用MySQL详细写出,使用不同的方法

要获取最近7天和最近14天的订单数量,我们可以使用不同的方法来优化查询性能。

2024-09-23 00:05:42 1108

原创 【MySQL】group by在MySQL中使用规则

在MySQL中,GROUP BY子句用于将取自数据库的记录集分组在一起,以便可以对每个组执行聚合函数(如COUNT()MAX()SUM()AVG()等)。使用GROUP BY时,通常与SELECT语句中的聚合函数一起使用,以计算每个组的合计或统计值。以下是在MySQL中使用GROUP BY:在SELECT语句中,除了聚合函数外,所有列都必须在GROUP BY子句中指定。:如果SELECT列表中的列与GROUP BY子句中的列完全相同,那么这些列可以省略在GROUP BY子句中。:可以在SELECT。

2024-09-22 21:19:32 776

原创 【MySQL】在MySQL中STR_TO_DATE()以及其他用于日期和时间的转换

在MySQL中,函数用于将字符串转换为日期格式。这个函数非常有用,当你需要将文本数据转换为可由MySQL日期和时间函数处理的格式时。

2024-09-21 18:11:26 431

原创 【SQL】NVL函数的用法和MySQL中有什么不同

在Oracle数据库中,NVL函数用于将NULL值替换为指定的值。如果第一个参数不是NULLNVL函数返回第一个参数的值;如果第一个参数是NULL,它返回第二个参数的值。

2024-09-21 17:53:23 1042

原创 【sql】MySQL中去重处理的方法

在MySQL中,去重通常指的是从查询结果中删除重复的行。这可以通过多种方式实现,具体取决于你的需求。

2024-09-20 23:28:04 757

原创 【MySQ】在MySQL里with 的用法

本文详细介绍了MySQL中WITH语句的语法、应用场景、注意事项和限制。WITH语句可以提高查询的可读性和性能,尤其适用于处理递归查询、数据转换和处理以及简化复杂查询等情况。在使用WITH语句时,需要注意每个CTE的命名和查询的语法,并理解其局限性。

2024-09-20 00:49:02 569

原创 【mysql】mysql中窗口函数lag()用法

可以用来访问当前行的前一行或多行的数据。这个函数通常用于分析时间序列数据,比如计算相邻行之间的差异或者获取前一个状态等。请注意,窗口函数是在MySQL 8.0及以上版本中支持的。如果你使用的是早期版本的MySQL,这些函数将不可用。这个查询将为每个部门内的每行返回当前行的日期和前一行的日期。如果你想在没有足够的行时返回一个特定的默认值,可以使用。这个查询将为每行返回当前行的日期和前一行的日期。这个查询将返回前一行的日期,如果不存在,则返回。在MySQL中,窗口函数。

2024-09-19 17:18:02 389

原创 mysql中format()的用法以及其他常用的数字格式化函数

在MySQL中,FORMAT()函数用于格式化数字,使其具有固定的小数位数,并且可以根据需要包含千位分隔符。这对于将数字转换为更易读的格式非常有用,尤其是在报告和用户界面中显示财务数据时。语法功能FORMAT()示例这里,数字 1234.56789 被格式化为两位小数,并且包含千位分隔符。在这个例子中,格式化结果没有小数部分,四舍五入到最接近的整数。负数也会被正确处理,包括负号和千位分隔符。这里,计算所有员工的平均薪资,并格式化为两位小数。注意事项FORMAT()DOUBLEFORMAT()

2024-09-14 17:22:34 646

原创 【数据分析】标准误差与标准差的区别

标准误差(Standard Error, SE)和标准差(Standard Deviation, SD)是两个在统计学中非常重要的概念,但它们的含义和用途有所不同。总结来说,标准差是描述单个数据集内部变异性的指标,而标准误差是描述样本均值作为对总体均值估计的可靠性的指标。在实际应用中,它们都是评估数据和进行统计推断的重要工具。

2024-09-11 22:30:16 635

原创 【机器学习】python补充知识点

是NumPy库中的,用于生成更灵活的数字序列,包括浮点数,并且返回的是NumPy数组。都是用于生成数字序列的函数,但它们属于不同的库,并且有不同的用途和特性。之前,需要确保已经安装了NumPy库,并且在代码中导入了NumPy。是Python内置的,用于生成整数序列,而。

2024-09-11 16:15:54 343

原创 【机器学习】.toarray()表示什么意思

在scikit-learn中,.toarray()方法通常与稀疏矩阵对象一起使用。稀疏矩阵是用于存储大多数元素为零的矩阵的数据结构,它只记录非零元素的位置和值,从而节省内存和计算资源。.toarray()方法的作用是将稀疏矩阵转换为一个常规的NumPy数组(即密集矩阵)。这个操作会创建一个包含所有零值的完整矩阵,使得矩阵不再是稀疏的。为什么要使用.toarray()?示例假设你有一个稀疏矩阵在这个例子中,.toarray()

2024-08-31 16:15:00 1058 1

原创 【机器学习】在 scikit-learn 中,有哪些特征编码方法?分布详细举例列出

One-Hot Encoding (独热编码):Label Encoding (标签编码):Ordinal Encoding (序数编码):Binary Encoding:Feature Hashing (特征哈希):Target Encoding (目标编码):Custom Encoding (自定义编码):Leave-One-Out Encoding:HashingVectorizer:DictVectorizer:CountVectorizer:TfidfVectorizer:这些方法中, 和 是最

2024-08-31 15:58:05 952

原创 【机器学习】.fit_transform()跟.transform()的区别

在您的输出中,训练数据和测试数据的编码结果可能看起来不一致,这是因为训练数据中的类别和测试数据中的类别不完全匹配。然而,您的输出结果似乎假设了训练数据和测试数据中有相同的类别,这在实际情况中可能不是真的。默认将每个特征的每个唯一值转换成一个二进制特征,其中1表示该类别存在,0表示不存在。对于测试数据,我们有两个样本,每个样本有两个特征是1。,所以在第二个和第五个特征上是1,其余是0。参数,这样对于未知的类别,编码器会输出全0。,所以第一个和第四个特征是1,其余是0。用于训练数据来学习类别并转换它们,而。

2024-08-31 15:42:00 719

原创 【数据分析面试】面试题

• 什么是CRM• customer relationship management 客户关系管理,最早这个概念是由这个gartner group公司提出的。• 企业利用相应的信息技术以及互联网技术,还有数据技术的能力,去协调企业与客户之间在销售、营销和服务上的交互,从而提升其管理方式,向客户提供创新式的, 个性化的客户交互和服务的过程其最终目标是吸引新客户, 保留旧客户 ,以及将已有的用户转化为忠诚的用户。

2024-08-11 12:27:56 1030

原创 MySQL里的累计求和

以下是一个简单的例子,假设我们有一个名为sales的表,它有两个列:id和amount。我们想要得到每一行的累计求和值。在MySQL中,你可以使用SUM()函数来进行累计求和。如果你想要对一个列进行累计求和,可以。2.按照课程号分组,然后根据学号对成绩进行累积求和。,进行窗口函数的操作。

2024-07-14 15:44:40 679

原创 MySQL中group_concat函数用法总结

名。

2024-07-09 13:19:32 294

原创 SQL 之 concat_ws和concat的区别

综上所述,选择使用concat还是concat_ws函数取决于具体的需求:如果需要连接字符串并希望它们之间有分隔符,或者希望在参数中包含NULL值时仍然得到一个有效的结果,那么应该使用concat_ws函数。这意味着concat_ws函数可以生成带有分隔符的连接结果,而concat函数则没有这个功能,它只是简单地将字符串连接在一起,不考虑任何分隔符。而concat_ws函数则允许参数中包含NULL值,它会在处理时忽略这些NULL值,只连接非NULL的参数。: concat_ws(分隔符,参数1,参数2,…

2024-07-08 16:06:37 754

原创 SQL之delete、truncate和drop区别

相同点:1、都有删除表的功能;不同点:1、delete、truncate仅仅删除表里面的数据;drop会把表的结构也删除掉2、delete是DML语句,操作完了,还可以回滚;truncate和drop是DDL语句,删除之后立即生效,不能回滚;3、在执行效益上drop>truncate>delete;扩展知识:为了形成数据库语言,DDL和DML都是必须的。DDL和DML之间的主要区别在于:DDL有助于更改数据库的结构,而DML有助于管理数据库中的数据。

2024-07-07 13:07:39 1110 1

原创 DBeaver——设置字体大小

DBeaver脚本窗口字体调整、放大和缩小字体。

2024-06-22 15:30:41 5394

原创 mysql插入中文异常:Incorrect string value: ‘\xE5\xB0\x8F\xE9\xBE\x99...‘ for column ‘name‘ at row 1

这个错误通常发生在MySQL数据库中,意味着你尝试将一个不符合当前列字符集的字符串值插入到数据库表的某个列中。在这个例子中,‘\xE8\xBE\xB9\xE5\x9F\x8E’ 是“姓名”的UTF-8编码,而’bname’列可能使用的是不支持这些字符的字符集,如Latin1。如果你已经有了不正确的数据,你可能需要先清理这些数据,或者在插入之前转换数据为合适的格式。注意:在修改字符集前,请确保备份数据库,以防止数据丢失。确保应用程序连接数据库时,也使用了正确的字符集。

2024-06-21 20:53:32 641

原创 【机器学习】 python的shape函数

2024-06-18 23:17:31 136

原创 【机器学习】 np.vstack()

np.vstack() 函数是 NumPy 中用来按垂直方向(沿着行方向)堆叠数组的函数。它将两个或多个数组沿着垂直方向堆叠在一起,要求这些数组在水平方向上的维度相匹配。注:使用np.vstack()进行堆叠时,输入数组的列数必须相同。如果列数不一致,将会引发一个ValueError异常。此外,np.vstack()返回的是一个新的数组对象,原始数组不会被修改。

2024-06-17 21:41:43 327

原创 【机器学习】 np.newaxis()函数

例1:这里的 x 是一维数据,其 shape 是 4,可以看到通过在列方向上增加新维度,变成了 4 x 1 的矩阵,也就是在 shape 的后面发生了变化。np.newaxis 的功能是增加新的维度,但是要注意 np.newaxis 放的位置不同,产生的矩阵形状也不同。例2:通过在行方向上增加新的维度,变成了 1 x 4 的矩阵,也就是在 shape 的前面发生了变化。x[:, np.newaxis] ,放在后面,会给列上增加维度。x[np.newaxis, :] ,放在前面,会给行上增加维度。

2024-06-17 17:48:05 298

原创 【机器学习】python中numpy.concatenate()函数的用法并举例说明

在这个例子中,array1是一个2x2的数组,array2是一个1x2的数组。我们使用numpy.concatenate()函数沿着axis=0连接这两个数组,结果是一个3x2的数组。array1, array2, …: 要连接的数组序列。axis: 沿着哪个轴连接数组。

2024-06-17 17:32:12 257

原创 【机器学习】make_classification函数

转载。

2024-06-16 22:42:56 211

原创 【机器学习】scikit-learn决策树算法类库介绍

scikit-learn决策树算法类库

2024-06-14 13:30:48 133

原创 【机器学习】feature_importances_使用方法并举例说明

它用于衡量每个特征对模型预测的重要性程度。通过查看特征重要性,我们可以了解哪些特征对模型的预测起着关键作用,这有助于特征选择、特征工程和模型解释。在这个示例中,我们使用RandomForestClassifier来训练一个随机森林分类器,并通过feature_importances_属性获取了各个特征的重要性。我们打印出了每个特征的重要性得分,这些分数表示了该特征对于模型的预测有多大影响。通过分析特征重要性,我们可以识别出对预测最具影响力的特征,有助于我们理解模型的预测过程并进行特征选择或优化模型性能。

2024-06-14 13:17:12 467

原创 【机器学习】 数据集的.data和.target的区别是

在机器学习中,数据集通常包含特征数据(.data)和标签数据(.target),它们在训练和评估模型时具有不同的作用。通过将特征数据和标签数据组合在一起,机器学习模型可以学习如何根据输入特征预测正确的输出标签,从而进行准确的预测或分类。在监督学习中,模型的目标是学会根据输入特征预测正确的输出标签。举例来说,考虑一个简单的数据集,包含学生的考试成绩和他们的通过与否标签。是一个矩阵,其中每一行代表一个样本,每一列代表一个特征。部分可能包含一个二元标签,表示学生是否通过了考试(1表示通过,0表示未通过)。

2024-06-13 12:19:12 391

原创 python学习笔记之pd.cut函数和pd.qcut函数实现数据分箱

例如:把年龄划分为18岁以下、18-30岁、30-45岁、45-60岁、60岁以上等5个标签(类别)。在机器学习中,经常会对数据进行分箱处理操作,即将一段连续的值切分为若干段,每一段的值当成一个分类。这个将连续值转换成离散值的过程,就是分箱处理。qcut:按照数据分布进行分割,等频率。cut:按照数值进行分割,等间隔。

2024-06-10 16:05:14 297

原创 matplotlib 辅助线_vlines&hlines/axvline&axhline/axvspan&axhspan

辅助线一、绘制一条垂直/水平的辅助线,以 vlines 为例说明重要参数:x:横坐标ymin,ymax:辅助线纵坐标的最小值、最大值label:标签内容二、绘制一条横跨当前图表的垂直/水平辅助线,以 axvline 为例说明重要参数:x:横坐标ymin, ymax:辅助线两头纵坐标相对于整个图表的位置,范围在 0 到 1 之间。与 vlines 的区别在于:(1)可以不规定 ymin 和 ymax。

2024-06-09 23:52:31 1058

原创 open函数的用法:

open函数是多种编程语言中用于打开或创建文件的函数。在Python中,open函数的基本用法是打开一个文件并返回一个文件对象,用于读取或写入文件。以下是open函数的一些基本用法和参数:参数:open函数接受两个参数,分别是文件名和打开模式。文件名是要打开的文件的路径(包括文件名和扩展名),而打开模式则指定了文件的操作方式,如只读、写入、追加等。模式:‘r’:以只读方式打开文件,文件的指针将会放在文件的开头。这是默认模式。

2024-06-09 11:51:10 416

原创 Python学习笔记——参数axis=0,1,2...

k的三维数组a,当执行函数function(a, axis=0)时,相当于在第1个dimension上进行function运算,其他维度的形状保持不变,运算结果的shape为原数组a去掉第一个dimension的sahpe(即j*k),当axis=1或2时同理。当然,axis的取值不限于0/1/2,还可以拓展到高维数组。在Python程序中,当需要对一些多维的数组或列表进行操作时,经常碰到操作函数中有axis这个参数。axis=0/1/2该怎么区别?总结一下,对于一个shape为i。

2024-06-04 22:35:19 339

原创 matplotlib

• 散点图:值是由点在图表中的位置表示,类别是由图表中的不同标记表示,通常用于比较跨类别的数据。• 柱状图介绍• 柱状图是统计报告图的一种,由一系列高度不等的纵向条纹或线段表示数据分布的情况,一般用横轴表示数据所属类别,纵轴表示数量或者占比。• 用柱状图可以比较直观地看出产品质量特性的分布状态,便于判断其总体质量分布情况。柱状图可以发现分布表无法发现的数据模式、样本的频率分布和总体的分布。

2024-06-04 14:56:35 954

原创 numpy

• 数组(Array):同类性数据元素按一定顺序有序排列的集合称为数组• NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列数组叠加组成的N维数组;• NumPy最核心的数据类型是N维数组(The N-Dimensional Array)ndarry。• 数组和列表一样,以 0 下标为开始进行索引axis=0,表示沿着第 0 轴进行操作,即对每一列进行操作;axis=1,表示沿着第1轴进行操作,即对每一行进行操作。在一维数组里axis=0表示x轴;

2024-06-04 14:54:19 621

原创 Numpy库:常用函数(精简版)

NumPy是一个用于Python的库,提供大量的函数和工具,用于处理大型多维数组和矩阵,以及进行相关的数学运算。常用函数。

2024-06-04 14:52:07 793

原创 Jupyter Notebook 教程

Markdown 图标 快捷键撤销 Ctrl /⌘+Z重做 Ctrl /⌘+Y加粗 Ctrl /⌘+B斜体 Ctrl /⌘+I标题 Ctrl /⌘+Shift +H有序列表 Ctrl /⌘+Shift +O无序列表 Ctrl /⌘+Shift +U待办列表 Ctrl /⌘+Shift +C插入代码 Ctrl /⌘+Shift +K插入链接 Ctrl /⌘+Shift +L插入图片 Ctrl /⌘+Shift +G。

2024-06-04 14:34:02 615

机器学习之十大集成学习模型

机器学习之十大集成学习模型

2024-06-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除