xboysen-CSDN博客

原创堆 (优先队列)

堆是一种特殊的，因为数组可以高效地通过索引访问节点，而不需要存储指向父节点或子节点的指针。堆支持的主要操作包括插入（将新元素添加到堆中并重新调整以保持堆的性质）、删除（移除根节点并重新调整堆）以及查找最大（或最小）元素（在大顶堆或小顶堆中，根节点总是最大或最小的）。

2024-12-07 22:38:51 928

因将线上表的某个字段的类型进行了更改，进而引发了下面两个问题：字段的声明类型和parquet存储时的类型不一致table schema和partition schema不一致致使数据表直接无法使用。具体出错的问题从执行日志中可以清楚的看到。问题1问题：将字段类型改成int类型，但是报错信息提示parquet文件对应字段类型是int64，设置的字段类型与实际存储的类型不一致解决：将字段类型改为bigint使与parquet存储时一致，数据表可以正常使用。问题2问题：由于以前的分区已经运行

2021-05-20 20:32:02 2656

原创二叉树的遍历python3版本

文章目录先序遍历迭代递归中序遍历迭代递归后序遍历迭代递归层次遍历迭代广度优先搜索BFS应用法1法2深度优先搜索DFS应用法1法2法3输出遍历序列实际上就是将遍历中的print语句改成储存在结果列表中即可，这里作为练习都写了一遍。先序遍历迭代栈入栈出栈顺序# 先序遍历打印def preorderTraversal(root): if not root: return stack = [root] while stack: cur = stack.pop() print(cur.

2021-05-04 17:26:49 956 4

翻译 hive字符串相关操作整理

内置操作||可以实现字符串的拼接，和concat作用一样内置函数下面汇总一些比较常用的函数返回类型签名描述stringconcat(string|binary A, string|binary B…)将传入的字符串或者字节依次拼接，接受任意个数的参数stringconcat_ws(string SEP, string A, string B…)使用指定分隔符SEP将字符串拼接stringconcat_ws(string SEP, array< str

2021-04-01 16:53:06 383

原创 hive集合数据类型汇总

文章目录基本概念arraymapstruct使用创建常用函数(主要汇总了和array相关的)hive支持的集合类型有三种：structmaparray基本概念array含义：array数组是一组具有相同类型和名称的变量集合访问：内部每个元素可以通过下标来访问，下标从0开始。如值为['john',' boysen']的数组，第二个元素通过数组名[1]访问注意：如果元素为字符类型时，mr和presto的显示不一样。例如['john','boysen']，mr的结果中显示为["john","

2021-04-01 11:19:02 4297

原创 python中文注释

在python脚本中添加中文注释可能会报错。官网的说明如下：Defining the Encoding Python will default to ASCII as standard encoding if no other encoding hints are given. To define a source code encoding, a magic comment must be placed into the source files either as first or

2021-02-27 21:42:57 248

原创关于datetime

strptime()完整调用形式是datetime.datetime.strptime()，因此有下面两种写法：#type1import datetimedatetime.datetime.strptime(arg...) #type2from datetime import datetimedatetime.strptime(arg...)注意timedelta是datetime中的即datetime.timedelta(arg...)import datetime 和from date

2021-02-24 16:07:45 137

原创 sys.argv

返回结果是调用脚本时输入的参数，第一个元素是脚本名称，如果传递了其他参数，其他参数按照位置次序从下标1开始

2021-02-24 15:47:16 108

原创 python导入自定义模块

只要将其作为.py文件和当前文件放在同一个目录下，使用import导入即可。使用方法和导入其他模块的使用方法相同。需要注意的是，如果被导入的模块中有可以运行的顶层代码，在导入后该部分代码会被运行，然后才运行当前脚本的代码# test.pyprint('test')def f(): pass# main.pyimport testprint('main')#结果：#test#main如果不想让test模块中的顶层代码在导入时自动运行，将其放在if __name__ == '__m

2021-02-24 09:12:48 139

原创 python赋值、深浅拷贝和重复

赋值传个引用（相当于多了个别名）重复深层重复使用的是引用L=[4,5,6]X=L*2//简单重复非引用Y=[L]*2 //列表的引用 //X=[4,5,6,4,5,6]//Y=[[4,5,6],[4,5,6]] L[1]=0 //X=[4,5,6,4,5,6] 没有改变//Y=[[4,0,5],[4,0,5]] 因为是列表的引用所以改变了copy浅拷贝(copy)：拷贝父对象，不会拷贝对象的内部的子对象。b = a[:]是浅copy深拷贝(deepcopy)

2021-02-23 17:46:47 125

翻译 collections.Counter 用法

https://docs.python.org/3/library/collections.html

2020-09-28 15:51:53 2231

原创异或运算

异或运算三个性质：任何数和 0做异或运算，结果仍然是原来的数任何数和其自身做异或运算，结果是 0异或运算满足交换律和结合律位运算（包含异或运算）都是针对二进制数的运算，因此输入十进制整数，并不是直接在十进制意义下进行运算，而是对对应的二进制进行运算。...

2020-09-28 09:26:42 1156

原创 python函数定义和调用

一般而言，函数的定义必须应该放在调用之前函数调用另一个函数的时候，不一定遵循上面的要求python是不需要先编译的，所以这决定了你调用函数之前得知道有这个函数，所以执行代码前需要有要用到的函数的定义。下面的代码在执行的时候，程序看到了函数fun1(), fun2()，并把相关的信息记录下来知道有这么个函数，但是并没有去查看函数内部的东西。等到调用函数fun1()时，再查看函数内部的实现，发现使用了函数fun2()，因为已经知道了有fun2()这个函数，再去查看使用fun2()内部具体的实现。因此，.

2020-09-12 09:20:16 568

原创 python赋值拷贝

直接赋值：就是赋值引用，将两个标识符同时指向了同一个对象，创建了别名a = b#a和b指向同一个对象，是同一个对象的不同名称浅拷贝：只拷贝父对象，不拷贝子对象a = [1,2]b = a.copy()python中列表是一个参考结构，也就是说，列表的内部元素储存的是元素的引用，而不是元素本身。因此对于上面的代码，只拷贝父对象指的是完成拷贝之后a和b是两个独立的对象，不拷贝子对象指的是并没有拷贝列表内部元素的引用，a,b内部的元素（是引用）指向的还是同一个内容，因此对a或b的元素进行修.

2020-09-10 19:16:20 252

原创图的应用——最小生成树（MST）

文章目录概念定义性质算法Prim想法算法代码Kruskal想法算法代码概念定义带权无向连通图权值之和最小的生成树就是最小生成树性质不一定唯一唯一的情况：所有边的权重都不相同原图本身就是生成树（边数等于节点数减一时）最小生成树的权重之和唯一，且是最小的最小生成的边数是顶点数减1算法基本想法：贪心法——每一步做出最好的选择基本思想：GENRIC_MST(G){ T=NULL; while T 未形成一颗生成树： do 找到一条最小代

2020-09-04 09:50:29 1925

原创图——基本概念与遍历

文章目录逻辑结构——基本概念图的存储邻接矩阵邻接表十字链表邻接多重表图的遍历广度优先搜索深度优先搜索图的应用最小生成树逻辑结构——基本概念线性表、树可以为空，但是图不能为空简单图：无重复边，不存在节点到自身的边；反之就是多重图无向完全图：任意两个顶点之间都存在边有向完全图：任意两个顶点之间都存在方向相反的弧生成子图：子图含有原图的所有顶点无向图——连通——顶点之间存在路径——连通图——最少n-1条边有向图——强连通——两个顶点之间同时存在双向的路径——强连通图——最少n条边连通分量（极

2020-09-04 09:45:06 264

原创树

文章目录基本概念性质二叉树满二叉树完全二叉树二叉排序树（BST ）应用平衡二叉树应用线索二叉树:shit:哈夫曼树应用树的存储结构二叉树重要性质二叉树的存储结构遍历树、森林与二叉树的转化转换遍历森林的遍历树的应用并查集基本概念层次——深度；从上往下（一般从1开始）高度：从下往上有序树：子树从左到右有顺序，否则就是无序树性质节点数=总度数+1树的度：各节点度的最大值度为m的树第i层最多有mi−1m^{i-1}mi−1个节点高度为h的m叉树最多有mh−1m−1\frac{m^{h}-1

2020-09-02 18:13:06 133

原创排序

排序重点在内部排序基本概念稳定性：关键字相同的元素，在排序前后的相对位置不变稳定性不是衡量算法优劣的标准，只是一个特性，反应算法性能的是算法的时空复杂度内部排序：指在排序期间元素全部存放在内存中的排序外部排序：指在排序期间元素无法全部同时存放在内存中，必须在排序的过程中根据要求不断地在内、外存之间进行移动内部排序插入排序每次将一个待排序的序列插入已经排好序的序列中直接插入排序初始L[1]是一个已经排好序的子序列对于元素L(i)(L(2)-L(n))插入到前面已经排好

2020-09-01 15:29:44 266

原创查找

内容来源：王道考研——数据结构文章目录顺序查找折半查找分块查找B树基本内容查找插入删除对终端节点的删除操作对非终端节点的删除操作B+树散列表散列函数构造冲突处理开放定址法拉链法散列表查找填装因子填装因子顺序查找又叫线性查找，主要用于线性表中查找typedef struct { ElemType *elem; int TableLen ; } SSTable ;int search_seq (sstable st, ElemType key) { //设置哨兵，不用对于

2020-08-30 14:05:21 246

原创字符串匹配

文章目录朴素模式匹配KMP算法基本思想next数组确定代码实现KMP算法改进在主串中找到和模式串相同的子串，并返回其所在位置。下面考虑的主串和模式串的的初始位置都是从数组下标为1的位置。朴素模式匹配将主串中和模式串长度相同的子串和模式串一次比较，只要有一个字符不匹配，就舍弃当前子串比较下一个子串主串长度为n，模式串长度为m，则最坏时间复杂度为O(nm)O(nm)O(nm)（要匹配(n-m+1)m次）朴素模式四配算法的缺点: 当某些子串与模式串能部分四配时，主串的扫描指针 i 经常回溯，导致时间开

2020-08-28 17:00:28 162

原创栈和队列基本应用

文章目录栈括号匹配问题表达式计算基本概念表达式转化表达式求值（算法实现）栈递归应用队列的应用树的层次遍历图的广度优先遍历在操作系统中的应用栈括号匹配问题基本想法：最后出现的左括号最先匹配不匹配的情况：左右括号不匹配左括号单身（最后栈不为空）右括号单身（栈空但是还有右括号）表达式计算基本概念按照操作符与操作数的相对位置分成三种计算方式：后缀表达式（逆波兰表达式）：操作符在两个操作数的后面前缀表达式（波兰表达式）：操作符在两个操作数的前面中缀表达式：操作符在两个操作数的中

2020-08-28 15:20:07 264

原创线性表备忘

常见时间复杂度O(1)<O(log⁡2n)<O(n)<O(nlog⁡2n)<O(n2)<O(n3)<O(2n)<O(n!)<O(nn)O(1)<O\left(\log _{2} n\right)<O(n)<O\left(n \log _{2} n\right)<O\left(n^{2}\right)<O\left(n^{3}\right)<O\left(2^{n}\right)<O(n !)<O\left(n^

2020-08-28 14:23:28 106

原创循环队列队空队满判断

为了方便对于循环队列进行队空队满判断，牺牲一个存储单元。记rear、head分别为队尾队头指针则：队满：（rear+1）%maxsize=head队空：rear=head插入元素后，rear=（rear+1）%maxsize删除元素后，head=（head+1）%maxsize...

2020-08-27 14:35:14 3005

原创字符串的比较和运算

字符串大小比较字符串大小比较的时候，会从左向右将两个字符串第一个不相等的两个字符的ascii码的比较结果作为最终结果。也就是说，对于两个字符串，从左到右依次取对应位置元素，比较字符元素的ASSIC编码，如果当前位置可以分出大小，就直接将当前的比较结果作为结果输出，不再比较后面的字符元素；否则继续依次比较后面单个字符元素的大小。字符串运算在mysql当中,字符串类型间进行加减乘除运算的时候,会截取字符串以数字开头的那一部分数字进行运算,如果字符串前面没有数字,那么对应字符串的截取的数值为0,那么进行加

2020-08-17 21:46:20 1006

空空如也

空空如也