自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

zdryn的博客

原创 Spark之RDD特性学习

RDD：是一种受限的共享内存模型，或者是只读的记录的集合。底层存储原理：将分布在不同存储器的Block数据块聚集在一起，每个block是由BlockManagerSlave管理，但是Block的元数据由Driver节点的BlockManagerMaster保存，BlockManagerSlave生成Block后向BlockManagerMaster注册该Block，由BlockManagerMaster管理RDD与Block的关系，当RDD不再需要存储时，将向BlockManagerSlave发送删除相应

2021-10-22 21:17:39 344

原创理解mysql事务

事务是数据库（编程语言）用户执行的一个语句，从开始开始到结束为止，这就造成了事务要么是执行成功结束，要么是执行失败而结束。而事务是控制事件的基本单位，既然是用来控制事件，就会针对各种事件产生了不同特征，也就是我们常说的ACID，原子性、一致性、隔离性、持久性。原子性：当前事务操作非失败即成功，只有这两钟可能，原子性是由undo log日志保证的。undo log记载着数据修改前的信息，例如我插入一条数据，undo log会记载我创建表的信息或者删除该条数据的记录，一旦事务执行过程中出现异常，就会执行

2021-10-17 21:54:15 179

原创 2021-10-16

近期看了自己的sql代码，发现一些需要修改的地方，一个是跟不同情况下的分组聚合查询结果，还有个是时间区间写了好多的case when，比较影响整段代码的可阅读行。1、首先是对于不同情况下的分组聚合查询，我是直接分组查询然后将不同情况下的结果union all在了一起，其实完全可以使用grouping set、rollup、cube等提高代码的可阅读性。--我想对不同维度下的字段进行分组查询--原来的写法 select nvl(line1,'未知'), --也可以使用coalesce(line1

2021-10-17 19:22:16 164

原创 spark任务提交流程

spark任务提交流程1、编写程序打成jar包2、调用spark-submit脚本提交任务到集群上运行3、发送请求到ResourceManager，请求启动applicationMaster4、RS接收到请求后在集群上选择一个合适的NameNode节点，启动ApplicationMater5、运行spark-submit的main方法，通过反射的方式创建主类的实例对象，然后调用main方法，开始执行代码6、代码创建sparkcontext对象并对其初始化，同时创建DAGScheduler（将rd

2021-04-04 23:40:01 689

原创 TreeMap的排序方法compare改写即犯错点

要求分别使用默认方法和手动方法实现字符串和Person对象的排序去重1.TreeMap存储字符串2.TreeMap存储Person对象代码仔细看一下吧写的比较乱import java.util.Comparator;import java.util.TreeMap;public class Test2 { public static void main(String[] args) { /* 改变排序器，同时将排序器的名字写在TreeMap的小括号

2020-08-08 10:47:04 959

原创子类的构造方法

构造方法的运行对于子类将父类重写，测试代码时，还是会先将父类的构造方法运行，如果不在子类的构造方法写super(有参或者无参数);，在默认的先运行父类的无参构造方法。public abstract class Demo6 {public static void main(String[] args) { new Zif("sfkg"); System.out.println("======"); new Zif();}}class Fuf{ String name

2020-08-05 21:38:18 1667

原创单例及其案例

单例：就是一种规范而已，不是必须的知识点或者关键字，仅仅是一种比较好的习惯（用途比较广泛）。作用：1、将规范好的数据传到已经开辟好的内存里，只能存一个，如果再往里面存就会把上一个数据替代。—传值2、全局访问点–感觉就是将一个空间给他static了一样（不准确）。一般分两类：饿汉式、懒汉式（还有几种，我还不会）普通方法：总结：就是比普通方法多了三句话//**普通方法**public class DanLi { public static void main(String[] args)

2020-08-01 17:12:53 174

原创 this super final abstract

this和superthis：是一种引用类型，代表当前对象，保存的是当前的对象的地址super：代表当前对象的父类，可以调用父亲的成员，但是它不是引用数据类型abstract class Gpv { private double price; private String name; private int ppu;//this的使用 Gpv(double price, String name, int ppu) { this.price = pric

2020-07-31 08:53:38 112

原创 Java 变量静态方法代码块规范

变量静态!](https://img-blog.csdnimg.cn/20200729200034739.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3pkcnlu,size_16,color_FFFFFF,t_70)public class Demo3 { public static void main(String[]

2020-07-29 21:06:28 535

原创绘制关系图

获取数据大概思路：1.将人物名字加载到数组中2.加载文本3.由于计算机没有思考能力来分析那两个人物是有关系的，这里就按照段落建立联系，每段出现的各人物就有了关系4.根据名字数组判断每个段落人物的联系5.将关系写入到字典中6.将关系写入到文本中import jieba,codecsfrom pyecharts import options as optsfrom pyecharts.charts import Graphnames={}relationships={}lineName

2020-07-21 11:15:21 335

原创朴素贝叶斯分类器注释

试编程实现拉普拉斯修正的朴素贝叶斯分类器，并以西瓜数据集3.0为训练集，对P.151“测1”进行判别。代码全是《机器学习》上的，只是将其整合到了一起，能够运行手写体识别。内容大部分进行了注释，可能有些注释不够精准或者不容理解，见谅！代码from numpy import *def loadDataSet(): #创建实验样本 postingList=[['青绿','蜷缩','浊响','清晰','凹陷','硬滑',0.697,0.460], ['乌黑','

2020-06-17 11:46:37 671

原创 k近邻注释

编程实现k近邻分类器，利用西瓜数据集3.0α，给出其中编号为8的西瓜的预测结果。代码全是《机器学习》上的，只是将其整合到了一起，能够运行手写体识别。内容大部分进行了注释，可能有些注释不够精准或者不容理解，见谅！代码：from numpy import * #引入numpy用来构建数据类型import operator #用来计算距离dataMat=array([[0.697,0.460],[0.774,0.376], [0.634,0.264],[0.608,0.318],[0.556,0

2020-06-17 11:42:37 347 1

原创 k均值聚类注释

试编程实现k均值聚类算法，设置三组不同的初始中心点，在西瓜数据集4.0上进行实验比较代码全是《机器学习》上的，只是将其整合到了一起，能够运行手写体识别。内容大部分进行了注释，可能有些注释不够精准或者不容理解，见谅！代码：import numpy as np #用来调整数组和矩阵import matplotlib as mpl #用来设置字体和正负号import matplotlib.pyplot as plt #画图框import warnings #用来设置警告dataMat= [[0.

2020-06-17 11:38:30 478

原创支持向量机书写体识注释，含文件

基于支持向量机的手写体识别代码全是《机器学习》上的，只是将其整合到了一起，能够运行手写体识别。内容大部分进行了注释，可能有些注释不够精准或者不容理解，见谅！代码from numpy import * #导入数据处理库from time import sleep #导入时间间隙函数def loadDataSet(fileName): #加载数据 dataMat = []; labelMat = [] fr = open(fileName) #打开文件 for line

2020-06-17 11:34:20 239

原创实战西瓜集决策树及其注释

有些注释不够严谨，见谅from math import log #引入math的log函数import operator #引入python的内部操作函数import matplotlib.pyplot as plt #引入绘画库'''定义文本框和箭头格式正常显示汉字'''decisionNode = dict(boxstyle="sawtooth", fc="0.8")leafNode = dict(boxstyle="round4", fc="0.8")arrow_args = d

2020-06-09 21:36:24 460

原创五十常用图的条形图树形图代码注释

条形图import pandas as pdimport matplotlib.pyplot as pltimport random# Import Datadf_raw = pd.read_csv("实例.csv")# Prepare Datadf = df_raw.groupby('manufacturer').size().reset_index(name='counts'...

2020-05-08 14:27:56 726

原创 python的squarify库一些用法

安装按住键盘上的Start+R 键，然后输入cmd进入命令符，输入pip install squarify作用一种坐标系，包括原点（x和y）和宽度/高度（dx和dy）的值。从最大值到最小值排序并规范化为总面积（即dx*dy）的正值列表。将数据生成基于matplotlib的树状图可视化详情函数返回一个dict列表（即JSON对象），每个dict都是一个矩形，其坐标与给定坐标系相对应，...

2020-05-07 20:57:02 8379 1

原创盒须图简要制作

盒须图用来描述一组数据离散情况的统计图。一般作用：找出数据的异常值；将多组数据进行对比。代码import pandas as pd#引用库import matplotlib.pyplot as pltplt.rcParams["font.sans-serif"] = ["FangSong"]#设置中文字体，若数据里面没有中文可以不设置#plt.rcParams["axes.un...

2020-05-07 12:23:49 828

原创 C语言统计成绩

统计成绩给出n个学生的考试成绩表，每条信息由姓名和分数组成，试设计算法：（1）查找最高分和最低分的学生，并列出其姓名与分数（2）按分数高低次序，打印出每个学生在考试中获得的名次，分数相同的为同一名次数据结构的设计顺序列表有利于数据的添加，删除和查找，而且容易编写代码。创建链表、排序、输出函数void create_xu( )功能：创建学生信息数组，进行排序和输出需要的相关信息...

2020-05-07 12:07:23 8548

原创深度算法遍历图结构

用深度算法遍历图结构根据邻接表建立的图结构，首先先建立一个链式表、再建立头非空的链式表链接。这样便于图节点的插入和删除，而且节省空间。各功能函数的设计建立图结构 void creat(algraph *g)功能：根据输入的顺序表及其后面连接的链式表构建矩阵表。建立深度优先搜索： dfs(algraph *g,int i)功能：以vi为结点进行深度优先搜索。建立查找所有的图结构：df...

2020-05-07 11:57:05 496

原创十进制整数转化R进制整数

数据结构的设计栈结构的逻辑结构为线性的，可建立链式结构使得入栈、出栈的操作是动态的，也可以很好地实现进制的转换。而且进制转换恰好和栈的输入输出输出类似，故选择栈是最好的。功能函数的设计建立并初始化栈函数 sqstack *Init_seqstack() 功能：该函数实现建立初始化的栈。具体过程：1.建立一个栈结构体指针s;2.将s指针指向的s->top赋予-1，即定义栈顶初始...

2020-05-03 11:05:47 3542 1

原创使用lxml的HTML和parse两种方式解析html代码

使用lxml解析html代码：若解析的代码是字符串类型使用lxml.etree.HTML进行解析，例如from lxml import etreetext="""<div class="login_corp" ><div class="Third-partyi-login"> <a title="微信" class="login-item weixin...

2020-05-02 13:19:03 3737

原创 Java 字符类型（和python有点区别）

#Java字符类型##数据的转换###1、隐式转换数据范围从小到大；代码不需要特殊处理；int–>long;float–>double;long–>float###2、显式转换格式：范围小的类型变量名=（范围小的类型）原本范围大的数据但数据转换时可能造成精度确实、数据溢出。byte/short/char这三种类型在运算时，都会先把类型提升到int，然后再计...

2020-04-30 15:22:24 283

原创 python的request库的简单操作

#requests笔记##发送get请求：发送get请求，直接’requests.get’‘’’pythonresponse= request.get(“https://www.baidu.com/”)‘’’##response的一些属性：‘’’pythonimport requestskw = {‘wd’:‘中国’}headers={‘User-Agent’:‘浏览的信息...

2020-04-30 12:12:27 303

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除