- 博客(184)
- 资源 (20)
- 收藏
- 关注
原创 typora图片存放gitee
文章目录picgo配置gitee插件配置typora配置typora图片是一件很头疼的事,默认的一般都是相对路径,所以可不可以将其存放在一个公共的服务端,这里采用gitee进行存放picgo配置picgo是图床的一种,相当于中间人,让它帮助转发到服务器端下载:github下载即可,https://github.com/Molunerfinn/PicGo/releases,但是比较慢,也可直接下载我上传的资源,https://download.csdn.net/download/xiaoyoupe
2022-05-04 19:59:09 578 1
原创 力扣算法前置知识——复杂度+简单排序算法(3)
文章目录堆排序堆结构堆排序桶排序计数排序基数排序堆排序传送门堆结构完全二叉树,要不然是满二叉树,要不然是按顺序填的二叉树,下图都是完全二叉树根节点位置为0左节点位置 2*i+1右节点位置 2*i+2父节点位置 (i-1)/2heapinsert操作开始的步骤,数组的数据进行完全二叉树的插入,并且不断调正,保证全树为大根堆heapify操作去除最大值也就是根节点被拿去后,将最后一个节点放置在根节点,并调整全树仍然为大根堆O(logN)级别的调整代价堆排序数组为:
2022-05-03 21:41:34 199
原创 拥抱K8s——Service详述篇
文章目录Service工作模式userspace 模式iptables 模式ipvs 模式Service类型Service使用ClusterIPEndpointHeadLinessNodePortLoadBalancerExternalNameIngressHTTP代理HTTPS代理Service传送门在kubernetes中,pod是应用程序的载体,我们可以通过pod的ip来访问应用程序,但是pod的ip地址不是固定的,这也就意味着不方便直接采用pod的ip对服务进行访问。为了解决这个问题,kub
2022-04-20 18:37:43 293
原创 拥抱K8s——Pod控制器详述篇
文章目录Pod控制器ReplicaSet(RS)创建扩缩容删除ReplicaSetDeployment(Deploy)创建扩缩容镜像更新重建更新Recreate滚动更新RollingUpdate版本回退金丝雀发布删除DeploymentHorizontal Pod Autoscaler(HPA)安装metrics-server准备deployment和servie部署HPA压测DaemonSet(DS)JobCronJob(CJ)Pod控制器传送门Pod是kubernetes的最小管理单元,在kube
2022-04-19 21:53:54 763
原创 拥抱K8s——Pod详述篇
文章目录pod配置镜像拉取启动命令环境变量端口设置资源配置pod生命周期创建和终止初始化容器钩子函数容器检测重启策略pod调度定向调度NodeNameNodeSelector亲和性调度NodeAffinityPodAffinityPodAntiAffinity污点和容忍污点容忍pod配置传送门pod.spec.containers name <string> # 容器名称 image <string> # 容器需要的镜像地址 imagePul
2022-04-17 21:28:53 1477
原创 力扣算法前置知识——复杂度+简单排序算法(2)
文章目录简单递归master公式归并排序快速排序引入快排快排1.0快排2.0快排3.0简单递归/** * 返回数组最大值 - 递归 */public class GetMax { public static void main(String[] args) { int[] arr = new int[]{3, 2, 5, 6, 7, 4}; System.out.println(getMax(arr)); } public static
2022-04-13 21:45:14 693
原创 拥抱K8s——前置篇
文章目录拥抱K8S介绍+搭建简介主要特性K8S组件master组件---管理node组件---具体工作者核心概念下载部署二进制安装资源管理资源管理方式命令式对象管理命令式对象配置声明式对象配置逻辑概念namespacepodLabelDeploymentServicePod详述拥抱K8S介绍+搭建传送门传统式部署:直接将应用程序部署在物理机上,很难合理性分配资源虚拟化部署:每个虚拟机都是一个独立的环境,解决了应用程序之间的影,一定程度上解决了资源,但增加了操作系统的部署容器化部署:类似虚拟化,
2022-04-11 22:03:38 643
原创 力扣算法前置知识——复杂度+简单排序算法(1)
文章目录复杂度+简单排序算法时间复杂度空间复杂度异或交换两数插入排序二分法对数器复杂度+简单排序算法传送门时间复杂度可以用选择排序进行举例,选择排序就是每次遍历确定最小值,将最小值和每次遍历的第一个数交换位置,假设N个数第一次比,遍历N个数,比较N次,交换1次 (此时第1个数已经确定,不必再动)第二次比,遍历N-1个数,比较N-1次,交换1次(此时第2个数已经确定,不必再动)…以此往复,总时间遍历 N + N-1 + N-2 + …比较 N + N-1 + N-2 + …比较 1 +
2022-04-10 17:39:36 827 2
原创 时间序列——python3手撕指数平滑代码
文章目录数据介绍python一二次平滑指数法数据介绍传送门一段值是value,一段值是时间index_array处理后数据为下图,可以理解为联合index,具有唯一性value_array处理后数据为下图,可以理解为,每一个小列表对应上图的一个index,31天数据,一共24个indexpython一二次平滑指数法误差采用的是均方误差# -*- coding: utf-8 -*-# @Time : 2022-04-07 15:44# @Author : XiaoYouPei# @
2022-04-07 22:01:55 1229
原创 分布式中一致性算法
文章目录一致性主从同步多数派PaxosBasic PaxosMulti PaxosRaftZAB一致性传送门分布式中最重要的理论——CAP理论:一致性、可用性、分区容错性,只能满足其中两点最终一致性:分布式数据库一个节点写数据,不能保证另外一个节点立马读到数据,但能保证未来某个时间点可以读到举例:DNS,公网增加一个ip以及域名,刚开始可能在其他地点访问不了,过一段时间几分钟后就可以访问强一致性需要解决的问题数据不能单节点状态机复制主从同步可以联想到mysql主从的机制(读写分离)
2022-04-06 21:43:14 536
原创 回顾java线程(基础篇)
文章目录java线程为什么会出现多线程?线程怎么用?线程生命周期线程优先级线程同步ThreadLocal定时器守护线程生产者消费者java线程传送门为什么会出现多线程?进程是程序执行的实体,每一个进程都是一个应用程序,cpu有多核,每个核心只能处理一件事,当多个进程,也就是多个程序运行的时候,cpu一般会通过时间片轮转调度的算法来实现多个进程的同时运行若两个任务需要同时运行,必须要运行两个进程,由于每个进程会有自己的独立的内存空间,进程之间的通信变得很麻烦,而且不同进程之间执行会产生上下文切换,比
2022-04-05 21:35:05 405
原创 Flink(kafka--->mysql)
文章目录maven pom表对应实体类Druid数据库连接池Mysql sink端Kafka source端maven pom <properties> <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> <flink.version>1.11.2</flink.version> <scala.binar
2022-03-06 17:07:01 1903
原创 实用机器学习——建模前/后处理
文章目录实用机器学习数据处理数据预处理的部分数据预处理可视化分析的部分数据清洗的部分数据变形的部分特征工程的部分评估+调参评估调参超参数优化实用机器学习(中文版)—李沐:https://www.bilibili.com/video/BV1Xh411p7M9?share_source=copy_web实用机器学习数据处理数据预处理的部分python可以采用pandas基本实现,可以先看下数据比如一些常见的看是否有空值、describe中的最大值,均值,最小值;有的数据是严格的非负数
2022-02-27 21:30:04 1915
原创 时间序列ARIMA
文章目录ARIMA验证平稳性差分ARMAARMAACF(自相关函数)PACF(偏自相关函数)综合考虑理清思路ARIMA传送门:https://www.bilibili.com/video/BV1dT4y1V7qW?p=3&share_source=copy_web验证平稳性要求我们用其时间特性的时候,就得需要该样本数据的均值和方差不发生明显的变化,就是按照现有的形状拟合延续严平稳:数据的分布不随时间的改变而改变弱平稳:未来某个时刻的数值依赖于过去的信息,有其依赖性差分时间序列t时刻与
2022-02-18 21:20:56 2688
原创 python机器学习基础05——sklearn之逻辑回归+分类评价指标
文章目录逻辑回归逻辑回归的损失函数逻辑回归API分类模型的评价指标混淆矩阵准确率召回率(较多被使用)精确率f1-score:精确率和召回率的调和平均数AUC逻辑回归逻辑回归是经典的分类模型,使用的是sigmod函数函数解释:Sigmoid函数是一个S型的函数,当自变量z趋近正无穷时,因变量g(z)趋近于1,而当z趋近负无穷时,g(z)趋近于0,它能够将任何实数(非0和1的标签数据)映射到(0,1)区间,使其可用于将任意值函数转换为更适合二分类的函数。 因为这个性质,Sigmoid函数也被当作是
2022-02-16 21:05:01 4942
原创 python机器学习基础04——sklearn之朴素贝叶斯
文章目录朴素贝叶斯算法高斯模型多项式模型朴素贝叶斯算法相关重点处:https://blog.csdn.net/xiaoyoupei/article/details/122641753贝叶斯思想,其实就是计算出条件概率(也就是某条件情况下,导致的结果的概率,选择概率大的)贝叶斯定理中必要知道什么是先验概率和后验概率。什么是先验概率和后验概率?举个例子:假设我们出门堵车的可能因素有两个:车辆太多和交通事故。先验概率:堵车的概率就是先验概率(不管有没有其他事件的发生造成的堵车)后
2022-02-15 21:34:43 2492
原创 python机器学习基础03——sklearn之线性回归相关处理
文章目录线性回归+评价指标引入误差L范式介绍sklearn-线性回归评价指标多项式回归和过拟合欠拟合处理欠拟合的处理-多项式回归过拟合处理-正则化线性回归+评价指标引入误差在回归任务中不需要归一化的操作,本身就是寻找出权重的过程,不需要将各维度进行统一约束找出特征和特征权重之间的一种组合,从而来预测对应的结果,误差的存在是必然的,回归的问题不像分类的问题,回归是一个连续值的预测,分类而是离散值的确定,那我们如何处理回归的误差?回归算法是一个迭代算法。所谓的迭代就好比是系统版本的迭代,迭代后的系
2022-02-12 19:28:54 2755
原创 python机器学习基础02——sklearn之KNN
文章目录KNN分类模型K折交叉验证KNN分类模型概念:简单地说,K-近邻算法采用测量不同特征值之间的距离方法进行分类(k-Nearest Neighbor,KNN)这里的距离用的是欧几里得距离,也就是欧式距离import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifier
2022-02-11 21:22:46 3247
原创 mysql——获取子结点所有父结点
Mysql-获取子结点所有父结点分享一下mysql中获取子结点所有父结点,原始数据如下:注意观察,根节点父结点为0,这是循环结束条件,下面看过程DELIMITER $$USE `usmsc` $$DROP FUNCTION IF EXISTS `getParents` $$CREATE DEFINER=`root`@`%` FUNCTION `getParents`(self_Id VARCHAR(40)) RETURNS VARCHAR(1000) CHARSET utf8 ##定义返回
2022-02-09 21:00:48 1363
原创 python机器学习基础01——sklearn开启
文章目录机器学习开发流程特征工程字符串特征化one hot编码文本特征化jieba分词数值型数据预处理归一化标准化特征选择Filter过滤式(方差过滤)PCA降维数据集数据集划分数据集接口介绍机器学习开发流程1.数据采集公司内部产生的数据和其他公司合作获取的数据购买的数据2.分析数据所对应要解决需求或者问题是什么?根据目标数据推断问题属于回归还是分类!3.数据的基本处理数据清洗合并级联等4.特征工程:对特征进行处理特征抽取特征预处理降维等5.选择合适的模型,
2022-02-08 19:49:22 1551
原创 python数据分析基础04——种草画图pyecharts
文章目录pyecharts传统的自然还是matplotlib绘图为主要,推荐下pyecharts贴上地址:https://echarts.apache.org/zh/index.htmlpyechartspyecharts 是一个用于生成 Echarts 图表的Python库。Echarts是百度开源的一个数据可视化 JS 库,可以生成一些非常酷炫的图表。环境安装pip install pyechartsPyecharts在1.x版本之后迎来重大更新,与老版本(0.5X)已是两
2022-02-07 19:47:43 676
原创 python数据分析基础03——练习项目
文章目录人口分析案例2012美国大选献金项目数据分析需求人口分析案例需求:导入文件,查看原始数据将人口数据和各州简称数据进行数据汇总将汇总的数据中重复的abbreviation列进行删除在汇总的数据中查看存在缺失数据的列在汇总的数据中找到有哪些state/region使得state的值为NaN,进行去重操作为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN汇总的数据和各州面积数据areas进行汇总我们会发现area(sq.mi)这一
2022-02-07 19:33:00 515
原创 python数据分析基础02——pandas相关操作
文章目录pandas高级操作替换操作映射操作运算工具排序实现的随机抽样数据的分类处理高级数据聚合数据加载透视表交叉表pandas高级操作import pandas as pdimport numpy as npfrom pandas import DataFrame替换操作替换操作可以同步作用于Series和DataFrame中单值替换普通替换: 替换所有符合要求的元素:to_replace=15,value=‘e’按列指定单值替换: to_replace={列标签:替换值}
2022-02-07 19:30:38 802
原创 机器学习——入门基础(神经网络)
文章目录M-P神经元感知机神经网络BP算法梯度下降(标准、Mini-batch、随机)传送门,讲解到位:https://www.bilibili.com/video/BV1Mh411e7VU?p=7&share_source=copy_webM-P神经元M-P神经元是模拟生物行为的数学模型,接收n个输入,并且给各输入增加权重,计算加权和,然后和自身的阈值theta进行减法比较,最后经过激活函数处理(两种处理方式:减法结果<0—>抑制、减法结果>0—>激活),然后输出,一
2022-01-23 14:54:12 830
原创 机器学习——入门基础(贝叶斯分类器)
文章目录贝叶斯定理重新理解最大似然估计朴素贝叶斯半朴素贝叶斯分类器EM算法贝叶斯定理引言传送门,讲解到位:https://www.matongxue.com/madocs/279考虑这样一种情况事件A和事件B发生有交集(这里可以用集合概念)那必然有一个条件概率的公式,在A事件发生下,B事件发生的概率:P(B|A) = P(AnB) / P(A),这其实很好理解,用面积的知识,发生A事件的概率面积作为分母,A和B相交的事件概率作为分子,这就求出了A事件发生情况下,B事件发生的概率下面这个公式
2022-01-22 19:06:28 886
原创 python数据分析基础01——numpy基础、pandas数据清洗
文章目录Numpy常用属性索引和切片变形级联图片操作统计函数矩阵PandasSeriesDataFrame股票分析案例数据清洗空值数据重复数据异常数据Numpypython语言中做数据科学的基础库,注重数值的计算,大多数python科学计算库的基础# 数组和列表的区别# 数组中只可以存储相同类型的元素# 数组中出现不同类型的元素,会根据类型优先级进行数据转换# 数据优先级# 字符串>浮点型>整型# 创建数组的方式# 1、np.array()# 2、plt创建# 3、
2022-01-17 21:19:39 1401
原创 python入门基础05——迭代器、生成器、装饰器、二叉树
文章目录迭代器自定义迭代器推导式生成器装饰器二叉树迭代器迭代器是一种可以被遍历的对象,并且可作用在next()函数可被迭代的对象不一定是迭代器,如列表、字符串# 创建迭代器,字符串、列表和元组对象、自定义对象都可创建迭代器# 使用python内置iter()方法创建alist = [1, 2, 3, 4, 5]it = iter(alist)print(type(it))for i in it: print(i)# 迭代器作用???优点:节省内存,在内存中只占一个数据的空
2022-01-14 20:49:32 342
原创 python入门基础04——面向对象、链表、异常处理
文章目录面向对象类实例变量和类变量self类的方法对象关联关系封装、继承、多态type和isinstancenew方法和self成员保护和访问限制反射单例模式链表异常处理面向对象面向过程的程序设计核心就是过程(流水线思维),优点就是顺着执行步骤开发,缺点就是牵一发而动全身面向对象OOP,是一种程序思想,把对象作为程序基本单元,一个对象包含数据和操作数据的方法类用来描述相同属性和方法的对象的集合class 类名():# 类名首字母一般大写 pass实例变量和类变量定义在_
2022-01-13 21:34:55 425
原创 python入门基础03——函数、文件、模块/包
文章目录函数基本参数传递参数类变量的作用域代表函数Rang匿名函数递归函数文件操作模块和包模块/包常见模块函数# 一般格式def my_function(): 代码块 return xxx # 不写,默认为return None 代码块 # 注意,在return后面的语句不会执行 # 函数只有调用了才会执行def function1(): print('执行function1') def function2(): # 内部函数
2022-01-12 21:27:01 191
原创 python入门基础02——流程控制
文章目录流程控制举例子:猜数字排序算法冒泡排序选择排序插入排序二分查找时间复杂度流程控制# 条件判断 if # 单分支if 表达式: 代码块# 多分支age = input('输入年龄')age = int(age)if age>=18: print("成年")elif age>=12: print("少年")elif age<12: print("儿童")# 猜数字游戏num = 9guessNum = input('please
2022-01-09 21:10:15 279
原创 python入门基础01——数据类型
python3.x基础数据类型anaconda3搭建自寻anaconda3启动jupyterjupyter notebook --ip=0.0.0.0 --port=8080 --allow-root --no-browser输入输出# 输出传参name = 'xiao'age =22print("我的名字为%s,年龄为%d"%(name,age))# 键盘输入# input返回时字符串name = input('enter your name:')print("我的名字是
2022-01-08 21:30:37 707
原创 Spark3.x——入门基础(相关知识理解篇)
文章目录Spark3.XSpark Core运行环境历史服务配置高可用Yarn模式运行架构核心概念核心编程RDD五大属性并行度和分区Spark3.X需要scala2.12,基于内存的快速、通用、可扩展的大数据分析计算引擎14年成为Apache顶级项目采用内存的计算策略,两次MR中间结果不会落盘而是在内存中一次性的数据计算:各类的框架在处理数据的时候,会从存储的设备中读取数据,进行逻辑操作,然后将处理的结果重新存储到某种介质中spark是有其生态的存在,包含:core、sql、streamin
2021-12-28 21:44:13 1536
关于Azkaban学习视频的对照文档.pdf
2021-02-06
Hive离线分析项目.zip
2021-01-18
关于Hadoop自学视频的对照文档.zip
2021-01-02
shell编程.pptx
2020-12-15
大数据虚拟机安装文档.zip
2020-12-12
java基础09-正则表达式.pptx
2020-12-09
Java基础[08-反射].ppt
2020-12-09
Java基础[07-网络编程].ppt
2020-12-09
Java基础[06-多线程].ppt
2020-12-09
Java基础[05-IO流].ppt
2020-12-09
Java基础[04-集合框架].ppt
2020-12-09
Java基础[03-面向对象].ppt
2020-12-09
Java基础[02-Java基础语法2].ppt
2020-11-30
Java基础[02-Java基础语法1].ppt
2020-11-30
Java基础[01-Java概述].pptx
2020-11-30
数据中心机房风冷空调AI节能
2023-10-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人