自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2685)
  • 收藏
  • 关注

原创 常用开发工具官方文档及源码链接入口页

Python:文档 (中文)、文档 (英文);CPython 源码numpy:文档pandas:文档matplotlib:文档sklearn:文档;源码NetworkX:文档XgBoost:文档Pylint:文档Black:文档PyCharm:文档ElasticSearch:文档;Python APIKafka:文档 (中文);源码;Python API

2023-04-20 13:16:34 861

原创 MySQL 源码|词法解析:状态及状态转移规则(4)

(下一个字符是标识符而非关键字),并 break 出 switch 继续处理当前 token。|根据多字符字符集或单字符字符集,遍历当前 token 的所有字符。(数字之后,不是标识符),并 break 出 switch 继续处理当前 token。如果是单字节字符集,如果最后字符是否为 ASCII 字符为非 ASCII 字符则将。(下一个字符是标识符而非关键字),否则下一个字符可能标识符引号或双引号,将状态置为。如果下一个字符是 SQL 字符,则将状态置为。且之后的字符为 SQL 字符,则将状态置为。

2024-07-22 08:57:16 319

原创 Python|python-kafka 的 KafkaConsumer 类的自动提交设置

用于控制周期性提交偏移量的时间间隔,默认是 5000 毫秒。用于控制消费者组是否周期性地后台提交偏移量,默认是打开的;这两个非私有方法中被调用。自动提交的时机,只需要查看。

2024-07-19 19:05:04 611

原创 机器学习|轮廓系数的定义

取值越大则说明内聚度相较于分离度的越大,聚类效果越好。越大,内聚度越差,聚类效果越好。越大,分离度越大,聚类效果越好。的单位是相同的,且聚类效果越好,的轮廓系数来说,其取值范围为。的轮廓系数,定义总的轮廓系数。,取值越大说明聚类效果越好。此时,我们可以得到向量。与同一簇内其他向量的。是衡量内聚度的指标,是衡量分离度的指标,

2024-07-19 15:40:43 404

原创 Kafka|Kafka 的 read_committed 模式

因此,如果需要仅读取事务型 Producer 成功提交事务写入的消息,还需要配置 Consumer 的。模式下,Consumer 只会读取事务型 Producer 成功提交事务写入的消息,而不会读取到终止事务的消息。此外,消费者也能读取到非事务型 Producer 写入的所有消息。模式下,Consumer 可以读取到 Producer 写入的任何消息,无论事务型 Producer 是提交事务还是终止事务。(事务终止)API,实现了事务内的统一提交,即事务内的消息要不全部写入成功,要不全部写入失败。

2024-07-18 19:50:33 136

原创 水杉SQL解析器|词法解析器性能设计

水杉的文本解析器与 MySQL 的词法解析器类似,都使用了类似有限状态自动机的设计。

2024-07-18 09:50:41 452

原创 SQL|Hive 不同类型比较返回 null 值的规则

在 Hive 中,主要的数据类型包括字符串、整型、浮点型、布尔型这 4 种。在比较不同类型的值时,可能出现 true、false、null 三种可能得结果。字符串在与整形和布尔型比较前,(相当于)都会将整型和布尔型先转化为等价的浮点型,然后将字符串与转换后浮点型进行比较。当字符串与浮点型比较时,会尝试将字符串转换为浮点型,如果无法转换会返回 null,如果能够转换则会将转换后的浮点型与浮点型进行比较,返回。在以上 3 种比较场景中,因为一定可以正确地相互转化,所以返回值只会为。

2024-07-17 15:23:26 212

原创 pytorch|找不到 fbgemm.dll 问题处理

发现可能需要重新安装 Visual C++ Redistributable 工具。通过上图,可以看到使用因为没有找到依赖的 VCOMP140.DLL 文件。如果是 32 位系统,则下载 x86_Release 文件。点击 File > Open,选择依赖报错的 dll 文件。解压后运行 DependenciesGui.exe 文件。安装之,即可正常 import torch。

2024-07-17 11:08:29 372

原创 MySQL|MySQL 运算符优先级顺序

()[]!

2024-07-16 11:43:45 347

原创 Python|pip 报错 use_2to3 is invalid 问题处理

参考链接:https://blog.csdn.net/u013938578/article/details/128753043。

2024-07-15 10:52:23 210

原创 MySQL 源码|词法解析:状态及状态转移规则(3)

映射判断当前指针位置的字符是否为标识符、数字、特殊字符的一部分,直到进入 SQL 的其他部分(即当前 token 结束)。否则,先将指针向前移动 1 个字符,然后判断上一个 token 是否为关键字或函数,如果指针指向的位置是。(等待下一个 token),并返回函数或关键字的编码,否则将指针向后移动 1 个字符,并继续处理当前 token。这个语法块,用于在存在多字节字符的字符集中,获取当前的一个单字节字符或多字节字符。如果是函数或关键字,则返回关键字或函数的编码,否则返回 0。

2024-07-15 08:53:17 1060

原创 MySQL 源码|词法解析中的 CHARSET_INFO 结构体及衍生函数

对于 GB18030 字符集来说,需要 2 个字符才能判断多字节序列的长度,因此我们无法通过一个字节就判断它是否为一个多字节序列。这个数组用于快速判断一个字符是否为标识符、数字、特殊字符的一部分,还是 SQL 语句的其他组成部分。函数是用于检查提供的字符串是否是一个多字节字符序列的逻辑,如果该函数为。将以 ASCIII 编码 0 为截止符号的字符串转换为英文大写格式。将以 ASCIII 编码 0 为截止符号的字符串转换为英文大写格式。是否为标识符中的字符(英文字母、数字或下划线)。

2024-07-14 16:42:31 982

原创 MySQL 源码|词法解析的状态存储器(Lex_input_stream)的主要数据成员与函数

为 True),则将原始数据流中的 n 字符复制到预处理数据流中,并将这两个指针都向后移动 n 个字符。为 True),则将原始数据流中的 n 字符复制到预处理数据流中,并将这两个指针都向后移动 n 个字符。(指向已写入到 UTF-8 格式流对应的预处理数据流的位置的指针)时,直接提供需要复制到的结束位置的指针。调整当前 token 的开始位置,用于处理开头的空白字符的情况。为 True),则将该字符回显到指向预处理输入流中的当前位置的指针(为 True),则将指向预处理输入流中的当前位置的指针(

2024-07-13 23:14:41 1103

原创 MySQL 源码|词法解析:Lex_input_stream(文本扫描器)的数据成员

源码位置:(版本 = MySQL 8.0.37)

2024-07-13 12:33:45 597

原创 MySQL 源码|词法解析:状态及状态转移规则(2)

源码位置:(版本 = MySQL 8.0.37)

2024-07-12 08:43:05 370

原创 MySQL|相同 SQL 偶发慢查问题处理记录

查询反查的 RDS 实例的慢查日志,发现在卡死时出现了一个慢查,扫描了 20115559 行,用时 308 秒。表更新较为频繁,但是统计信息没有能及时更新,从而导致表的统计信息不准,进而导致执行计划错误,出现偶发的索引失效问题。某单并发的实时任务中偶发卡死约 5 分钟,在这 5 分钟内没有消费上游 Kafka TOPIC,也没有写出下游记录。这个实时任务,每一条上游 Kafka TOPIC 变化都会执行一次以上查询,但是只有这一个查询偶发了慢查。的,查看慢查的 SQL 的执行计划,也是走了索引的。

2024-07-11 11:22:29 476

原创 MySQL 源码|词法解析:状态及状态转移规则(1)

中的初始化状态转移规则进行转移。如果是空格,则继续匹配不改变状态,直到遇到正式的。源码位置:(版本 = MySQL 8.0.37)状态的处理中,都通过循环跳过了会切换到。下面我们从默认状态开始整理各个状态。因此可知,词法解析的默认状态就是。并在外层循环中继续处理当前。状态单独出现不会发生。

2024-07-11 09:03:27 332

原创 SQL|MySQL 的一些罕见语法

在MySQL中,创建表时可以指定列是否可以存储NULL值。默认情况下,列可以存储NULL值。如果你不希望某列存储NULL值,可以使用NOT NULL约束。函数可以接收一个参数,表示小数位的精度,默认值是 6,取值范围是 0 ~ 9。列没有指定是NOT NULL还是NULL,默认是可以存储NULL值的。关键字之后的,并不是一个值,而是一个函数,这个函数是允许默认值的。列被定义为NOT NULL,意味着这些列必须有值。列被指定为NULL,表示这个列可以存储NULL值。这里需要注意的是,在 DDL 中。

2024-07-10 14:57:25 166

原创 MySQL 源码|词法解析:自动机状态转移矩阵

该状态转移矩阵主要用于在开始匹配 token 时,根据当前字符获取状态。|为十六进制值、二进制值和 unicode 字符串赋状态值。源码位置:(版本 = MySQL 8.0.37)|将结构体中的每个枚举值赋对应的状态值。函数中,初始化了状态转移矩阵。|为一些特殊的字符赋状态值。

2024-07-10 08:52:30 431

原创 MySQL 源码|词法分析:lex_one_token 函数外层逻辑

将原始输入流、预处理输入流中当前 token 的开始、结束位置的指针均设置为当前指针。|启动一个无限循环,在其中根据当前状态执行逻辑,若当前 token 匹配完成则直接。源码位置:(版本 = MySQL 8.0.37),该类型用于存储此法解析状态。

2024-07-09 09:02:49 317

原创 MySQL 源码|LEX 结构体

LEX。

2024-07-09 08:00:10 479

原创 MySQL 源码|Query_block 类的基本变量和方法

(版本 = MySQL 8.0.37)(版本 = MySQL 8.0.37)类中,除实现了父类的纯虚函数以及与。,时查询树中代表叶子节点的特殊类型。选项的函数,在修改时会同步更新。子句中查询的表列表存储在。子句中的排序逻辑存储在。定义了设置、添加、移除。关键字的信息就存储在。

2024-07-01 08:42:22 353

原创 Python|ImportError DLL load failed while importing MPI 报错处理

需要注意,一次性下载多个文件时,Chrome 浏览器可能会弹窗提醒。

2024-06-21 08:58:54 232

原创 Python|firefly 训练报错 KeyError qwen2 的解决方法

,可以看到:Qwen1.5 需要将 transformers 更新只 4.37。查看 firefly 的 README 中安装环境一节(

2024-06-20 08:29:10 197

原创 Python|Windows 安装 DeepSpeed 安装方法及报错 Unable to pre-compile async_io 处理

下时,发现路径已存在。查看这 3 个文件,发现其中 Linux 中使用的重定向文件。但是,这里的用法时错误的,无法覆盖文件,且路径也是错误的。PowerShell 可以通过 Win + r 搜索 powershell 启动。安装,会触发如下报错信息。出现后,需使用如下方法完成安装。脚本编译,其中在配置环境变量后,也是通过。不会实现覆盖,所以需要手动删除掉。观察报错信息,可以看到是。可以看到,这三行尝试将。

2024-06-19 08:26:57 2279 2

原创 Python|Windows 系统安装 triton 的方法

这是因为 pypi 中的 triton 中没有适用于 Python 的版本。如果继续抛出如下异常,可能是版本不匹配,暂未找到合适的解决方法。通常是用来显卡加速的,可以尝试暂时卸载。

2024-06-18 23:12:43 927

原创 Python|Windows 安装 DeepSpeed 报错 Unable to pre-compile async_io 处理

PowerShell 可以通过 Win + r 搜索 powershell 启动。的文件,该文件中只是一个空路径,将该文件删掉即可。中复制文件夹时出现重复,可以为。路径下,发现有一个名为。

2024-06-17 20:06:13 281

原创 MySQL 源码|Query_term 及其子类

Query_term。

2024-06-11 08:21:40 446

原创 MySQL 源码|Query_expression 类的基本变量和方法

(版本 = MySQL 8.0.37)(版本 = MySQL 8.0.37)类表示查询表达式(query expression),其中包含由多个UNIONINTERSECTEXCEPT等集合操作合并的一个或多个查询块。

2024-06-10 16:07:57 455

原创 MySQL 源码|附录 1:类型别名

(版本 = MySQL 8.0.37)

2024-06-10 11:17:52 215

原创 Python|flash_attn 安装方法

直接使用 pypi 安装会安装最新版本,不一定适配本地环境,所以需要直接从 release 中选择合适的版本安装。没有适合的 CUDA 版本和 pytorch 版本则应用更早的版本)。的版本上,直接选择最新版本即可(若最新版本的。

2024-06-09 16:34:18 1254 1

原创 Python|pip 安装报错 error Microsoft Visual C++ 14.0 or greater is required 的解决方法

直接按日志提示,在微软官网下载和安装 Microsoft C++ Build Tools 即可。这样可能需要安装较多的组件,但是简单、靠谱。如果不是磁盘非常紧张,建议使用这个解决方法。|选择 “使用 C++ 的桌面开发”,选择默认的安装详情。|出现如下界面说明安装已经成功。|下载后运行安装工具。

2024-06-09 08:32:16 423

原创 MySQL 源码|查询树与 Query_term 节点

作为叶子节点时,它既是查询规则(query specification),也是查询的表构造器(table constructors of the query)。(版本 = MySQL 8.0.37)节点间的嵌套关系,构成了查询树结构。的方式,每个非叶子节点都有其对应的。作为非叶子节点时,它是一种实现。指针相互连接形成单向链表,作为。类是查询树结构中的节点,通过。方法返回一个指向它自身的指针。成员,同时也包含一个指向。这 4 个类都包含一个。

2024-06-04 08:52:05 349

原创 MySQL 源码|Query_block 和 Query_expression 的连接关系

均使用嵌入式链表(intrusive double-linked list)的形式的存储。:这里的源码注释有点问题,其中有 Select 1.2.1 节点但 SQL 语句中没有。类表示查询表达式(query expression),其中包含由多个。类表示查询块(query block),其中包含必选的。和指向下级节点链表的第 1 个元素的。(版本 = MySQL 8.0.37)等集合操作合并的一个或多个查询块。类中包含指向上级节点的指针。和表列表,以及可选的。

2024-06-03 08:30:51 471 1

原创 SQL 解析器设计文档|1 - 架构设计

多个字段等在语法上确实并列的场景外,我们将其他 SQL 语法均解析为嵌套的一元表达式或二元表达式。),遍历 SQL 字符串,对于每一个字符,基于状态和字符选择执行器(执行器会可以更新缓存器中的状态以及存储的数据。在词法解析的实现上,我们使用了单一的有限状态自动机(),状态机的状态及数据存储在缓存器(具体地,词法解析器的逻辑在。中,语法解析的逻辑在。

2024-05-30 13:05:29 288

原创 Python|streamlit 在 PyCharm 的启动方式

【代码】Python|streamlit 在 PyCharm 的启动方式。

2024-05-28 18:56:13 437

原创 Python|module 的 __spec__ 属性

要区分 module 和 class,可以通过查看 module 对象和 class 对象的类名称,即。这是包含模块的符号表的字典。修改此字典将实际改变模块的符号表,但是无法直接对。的符号表中的一个名称。模块属性可以被赋值。时(根据 Python 文档,为避免并发问题,在遍历。为对应的 py 脚本路径。为模块对应 py 或 pyc 文件路径。语句严格来说也是对模块对象的一种操作;的模块对象,而是要求存在一个对于名为。此时 module 的类名称为。属性,为搜索子模块的路径。,class 的类名称为。

2024-05-28 18:26:55 395

原创 SQL|MyBatis 的 # 和 $ 占位符

【代码】SQL|MyBatis 的 # 和 $ 占位符。

2024-05-23 19:43:24 150

原创 Python|pylint 类型别名的命名规范

是 Python 对类型的注释,是通过。

2024-05-20 10:29:51 264

原创 SQL|Hive 和 MySQL 与 == 运算符和 ! 运算符

=

2024-05-04 15:26:38 176 2

Kaggle:tmdb-box-office-prediction(转结构化数据,用于 SQL 练习)

原数据源(将其训练集结构化): https://www.kaggle.com/c/tmdb-box-office-prediction/data 数据量级+建表语句(含字段含义注释)详见博客: https://dataartist.blog.csdn.net/article/details/132268426 共 15 个表: - movies:电影表 - belongs_to_collection:电影系列表 - person:人员表(演员与剧组人员) - cast_rela:电影与演员的关联表 - crew_rela:电影与剧组人员的关联表 - genres:电影体裁表 - genres_rela:电影与体裁关联表 - keywords:电影关键词表 - keywords_rela:电影与关键词关联表 - production_companies:电影制作公司表 - production_companies_rela:电影与制作公司关联表 - production_countries:电影制作国家表 ……

2023-08-14

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除