- 博客(15)
- 收藏
- 关注
原创 Spark RDD持久化
1、RDD性质RDD数据是过程数据,即计算得到后一个RDD时,前一个RDD就会被释放。如图就是当RDD4被计算出来RDD3就会被释放。2、为什么要持久化呢?如图,一个应用程序中存在两个collect,中间链路都调用了RDD3,可是在第一个collect执行完时,由于RDD时过程数据,RDD3已经被释放,所以执行第二个collect需要重新计算RDD1、RDD2、RDD3,这样就浪费资源。为了避免重新计算RDD3,则对RDD3进行持久化。3、RDD持久化方法rdd3.cache()
2022-04-29 20:44:13 1286
原创 leetcode131.分割回文串
题目:给你一个字符串 s,请你将 **s **分割成一些子串,使每个子串都是 回文串 。返回 s 所有可能的分割方案。回文串 是正着读和反着读都一样的字符串。示例 1:输入:s = "aab"输出:[["a","a","b"],["aa","b"]]示例 2:输入:s = "a"输出:[["a"]]方法:回溯。回溯的过程是遍历一个树的过程,分为横向遍历与纵向遍历,在回溯算法中for循环对应横向遍历,递归对应着纵向遍历。这题中,横向遍历中,需要不断尝试在不同的位置切分字符串,
2022-04-01 14:14:27 343
原创 leetcode的三数之和与四数之和
三数之和;给你一个包含 n 个整数的数组nums,判断nums中是否存在三个元素 a,b,c ,使得a + b + c = 0 ?请你找出所有和为 0 且不重复的三元组 四数之和**;**给你一个由 n 个整数组成的数组nums ,和一个目标值 target 。请你找出并返回满足下述全部条件且不重复的四元组[nums[a], nums[b], nums[c], nums[d]](若两个四元组元素一一对应,则认为两个四元组重复)题目特点:这两题有一个特点就是三元组(四元组)不能重复解决方...
2022-03-30 12:56:56 721
原创 Django的Crontab不执行
1、查看任务执行后是否出现异常检查手段:(1)使用python3 manage.py crontab add,添加任务(2)python3 manage.py crontab run
2021-06-17 21:28:56 1569
原创 # Python中的Time库
Python中的Time库1、时间表达形式1.1 字符串# 举例'20201010', '2020-10-10', '2020:10:10'# 格式比较随意,只要方便通过调用time库内函数转成其他格式即可1.2 时间戳# 由time.time()获得print(time.time())# 输出形式为下方样式> 16090335831.3 时间元组# 举例> time.struct_time(tm_year=2020, tm_mon=12, tm_mday=27,
2020-12-27 10:18:30 496 2
原创 scrapy框架数据流程
背景简介:scrapy框架分为5+2结构,5指的是spider模块、Engine模块、Scheduler(调度模块)、Downloader模块、PipleLine模块2指的是DownloaderMiddleware和SpiderMiddleware我探讨的问题是:在scrapy中定义的start_request()方法在什么时候被调用?在工程执行时,start_request()会被自动调用一次,若其中只有一次yield,则在这一次就产生了Request(请求)。若start_reque
2020-06-23 09:50:37 208
原创 MySQL for visual studio 1.2.9删除
被我尝试后试出来的,不想再去弄截图了。我遇到的问题是,在删除的时候出现用户已存在这样的标识,导致我无法删除。应该是和我电脑上的visual studio 2015绑定起来了,导致无法删除。操作:运行MySQL的安装包,点MySQL for visual studio 1.2.9然后点modify,然后再目录中取消它与visual studio的绑定,然后就可以删除了...
2020-06-15 14:40:36 2197 5
原创 re模块的三个函数:sub()、search()、findall()
import re1、re.sub(pattern, repl, string, count = 0, flags = 0)‘’‘用于替换字符串,把string中与正则表达式匹配的字符串特换为repl’‘’pattern为匹配的正则表达式repl为替换的字符串string为被查找替换的原始字符串count为替换次数,默认为0,意思为原字符串中与正则表达式匹配的字符串均进行替换flags为标志位,用于控制正则表达式的匹配方式2、re.search(pattern, str.
2020-06-06 10:35:49 568
原创 ARP协议过程
前提:在网络中,直接相邻设备之间的通信是通过MAC地址完成,一个IP地址的主机与另一个IP地址的主机通信,是通过多个MAC地址完成的,需要能够在网络层工作的设备,动态的更新MAC地址,以完成数据的传送。基本概念:ARP高速缓存(主机存储IP与MAC映射关系的存储空间)、ARP协议、MAC地址、IP地址在传输前,主机通过子网掩码,可以分辨目的地址和源地址是否在同一个网段,则可分为同网段传输、...
2020-04-30 15:40:27 521
原创 中序遍历和层次遍历构造二叉树
/* 题目:层次遍历和中序遍历构建二叉树 算法思想:InOrder, LevelOrder 分别存储中序序列和层变遍历序列,用cnt1记录层次遍历序列插入结点的下标,[low, high]为插入结点在中序序列的范围,插入LevelOrder[cnt1] 找到LevelOrder[cnt1](层次遍历序列结点)在[low, high](中序序列)具体位置 mid 若 ...
2020-02-19 11:11:51 2876
原创 数据结构——哈希表
首先什么是哈希表?哈希表就是一个有哈希算法和冲突处理函数构造出来的数据存储表。创建哈希表的用意:将数据元素中的关键字作为哈希算法+冲突处理方法的处理对象,得到唯一的存储位置,这样在进行查找的时候,可以方便的通过计算得到数据存储地址,而不需要像顺序表那样一个一个的比较。怎么构建哈希表呢?常用的构建方法:直接定址法、数字分析法、平方取中法、折叠法、除留余数法直接定制法求地址...
2019-04-03 19:37:33 306
原创 数据结构——静态查找
静态查找表,意思是针对这个表进行静态查找,何为静态,那就是不能动态修改表中内容,不能对表进行增加、删除。静态查表表,有哪几种基本办法呢?顺序查找法、折半查找法、分块查找法顺序查找法,从队列头部逐个比对到末尾就可以了。存储数据可以使用数组或链表,数据通常没有非递增、非递减关系折半查找:针对有严格大小顺序排列的序列,需要定两个变量一个指向存储空间的首部、一个指向尾部。然后用求平均...
2019-04-02 22:58:07 248
原创 Linux系统中'\r'与‘\n’的区别
浏览https://blog.csdn.net/qq_42820594/article/details/82421724后自行测试:由两张图对比可以看出,输出printf('\r'),相当于将光标移动到本行的开头,而'\n'则是移动到另起一行的开头。根据这样的想法,我将L9输出的---改为一个-。发现输出abc---,根据实验得出,'\r'将光标移到本行开头,使用printf会...
2019-02-13 16:59:01 10288
原创 结构体指针初学犯的错误
例:typedef struct node{ int no; char *str struct node *next;}NODE;初学的时候容易犯错误,在NODE *p后,直接进行p->str操作,由于定义之后指针p没有进行地址赋值,所以现在的p为空指针,使用空指针进行操作,则会出现段错误。NODE *p;是定义了一个指向NODE类型的指针,p的大小...
2019-02-13 16:47:31 332 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人