自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 资源 (6)
  • 收藏
  • 关注

原创 读决战大数据-车品觉

决战大数据

2022-09-11 16:13:13 870 1

原创 Spark SQL中Dataframe join操作含null值的列

Spark DataFrame Join

2022-08-21 23:16:41 1464

原创 熟悉Pod的相关的概念

Pod相关概念

2022-08-21 23:14:31 845

原创 K8s之Kubectl工具相关命令

Kubectl相关命令

2022-08-21 23:10:22 220

原创 Kubernetes的Yaml的构成

yaml文件

2022-08-21 23:09:22 124

原创 谈谈Kubernetes的内核

K8s的内核

2022-08-21 23:08:03 418

原创 容器的基础学习

容器的基础学习

2022-07-31 09:40:59 268

原创 Docker 崛起和容器的发展

Docker 崛起和容器的发展

2022-07-31 09:39:16 268

原创 容器技术的发展

容器技术的发展

2022-07-31 09:37:28 323

原创 程序员职业发展和晋升指南

程序员的诗和远方

2022-07-17 23:08:24 2213

原创 8-Kafka的消息丢失场景和保证消息无丢失

Kafka消息丢失情况和解决办法。

2022-07-10 12:24:48 224

原创 7-Kafka解压缩算法的实践

Kafka解压缩算法小记

2022-07-10 11:37:23 615

原创 6-生产者消息分区机制原理剖析

消息分区策略

2022-07-10 10:43:56 116

原创 5-Kafka 集群配置-Topic 参数配置

Kafka Topic 参数配置

2022-07-07 11:35:50 1252

原创 4-kafka集群参数配置-Broker 端参数

Broker参数配置详解

2022-07-05 23:01:39 375

原创 3-kafka版本的选择

kafka有哪些版本?

2022-07-04 23:21:44 1571

原创 2-kafka的组件和术语

Kafka组件介绍

2022-07-03 22:21:15 325

原创 1-Kafka的学习路线

kafka框架学习的路线图

2022-07-03 21:41:17 309

原创 大数据岗位必备知识点总结

大数据知识技能总结

2022-07-03 18:27:32 681

原创 1-读取小文件的函数wholeTextFiles

wholeTextFiles函数的作用

2022-04-18 15:03:13 319

原创 构建RDD的几种方式

RDD构建方式

2022-04-18 15:02:13 280

原创 Pyspark WordCount 经典案例

WordCount Pyspark词频统计

2022-04-12 17:47:36 909

原创 PySpark 相关基础知识

主要介绍Pyspark相关的知识,Pycharm配置Spark,Conda管理Python环境

2022-04-12 16:19:25 13720

原创 Spark SQL UNION,EXPECT,INTERSECT之间的区别

Spark SQL EXPECT UNION INTERSECT

2022-04-11 13:56:34 2251

原创 Python处理时间的神器-----Pendulum

学习Python 时间处理包Pendulum

2022-03-10 13:59:05 873

原创 mongodb相关的sql操作

mongodb简单的sql命令操作

2022-03-08 13:39:21 1318

原创 大数据apache-spark问题总结

主要介绍Apache-Spark相关知识点

2022-03-06 23:09:08 1723

原创 安装Airflow

主要介绍了在Windows 10 WSL环境下安装Airflow的过程,希望可以帮到你!!!

2022-03-04 14:27:43 1348

原创 Windows 安装和配置 WSL的方法步骤

2022年Windows 安装和配置 WSL的方法步骤

2022-03-03 20:17:21 745

原创 如何使用进行Django迁移向model添加新字段

如何使用进行Django迁移向model添加新字段随着Django 1.7中引入的新迁移,为了在模型中添加一个新的字段,您可以简单地将该字段添加到模型中,使用 ./ manage.py makemigrations 初始化迁移,然后运行 ./ manage.py migrate ,新的字段将添加到您的数据库。为避免处理现有机型的错误,您可以使用 - fake :1)初始化现有模型的迁移:python manage.py makemigrations myapp2)现有模型的假迁移:python

2021-11-05 11:41:06 1232

原创 HDFS的读写流程

HDFS的读写流程一HDFS的写的流程1.client发起文件上传的请求,通过RPC与NameNode 建立通讯,NameNode 检查目标文件是否已经存在,父目录是否存在,返回是否可以上传2.client 请求第一个block 该传输到哪些DataNode服务器上3.NameNode根据配置文件中指定的备份数量以及副本放置的策略进行文件分配,返回可用的DataNode的地址, 比如A,B,C4.client 请求3台DataNode 的一台A上传数据,A收到请求会继续调用B,然后B调用C ,将整

2021-05-28 14:19:27 166

原创 分布式和集群的区别

分布式和集群的区别分布式和集群,这两个概念确认容易被人搞混。而且分布式和集群,这两者,经常是我中有你,你中有我。分布式系统大家从网络上看到的学术定义简单来说就是一套由一组计算机协同工作,让用户感觉像是一个统一的整体的系统。但是,由于这个定义定的过于简练,很多初入门的人会毫无感知的潜意识就会混淆了分布式系统的概念。什么意思?我这里问下,当我们用 keepalived 做高可用集群的时候,我们是在搞分布式系统吗?当我们并发不够,搞了一堆机器做负载均衡,我们是在搞分布式系统吗?当你心里默默回答是,或者

2021-05-26 15:54:49 150

原创 大数据的生态现状

大数据的生态现状一大数据的概念*数据*数据是可以获取和存储的信息,直观而言,表达某种客观事实的数值是最容易被人们识别的数据(因为那是“数”)。但实际上,人类的一切语言文字、图形图画、音像记录,所有感官可以察觉的事物,只要能被记下来,能够查询到,就都是数据(data)。相关的计算单位1Byte = 8bit 1K(千)= 1024Byte 1MB(兆)=1024K 1G(吉) = 1024M1T(太)=1024G 1P(拍)=1024T 1E(艾)=1024P 1Z(泽)=102

2021-05-26 15:23:33 147

转载 UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 121903: illegal multibyte

当我们做爬虫的时候,需要把抓取的数据保存到文件里,但在用IDE, pycharm的时候,由于系统默认采用新生成的文件是采用gbk编码,所以我们会出现类似的错误,我们需要对默认编码进行修改, 如有遇到此问题,请参考此文章最后标红的地方Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法转载  发布时间:2015年04月2...

2018-05-28 21:34:26 1498

原创 如何修改git空文件夹的错误

投票接受了票+100方法一解决此类问题第1步:做一个.git的备份(实际上,我在每一个改变某些内容的步骤之间都会这样做,但是使用新的副本名称,例如.git-old-1,.git-old-2等) :cp -a .git .git-old第2步:运行 git fsck --fullnathanvan@nathanvan-N61Jq:~/workspace/mcmc-chapter$ git fsck...

2018-05-28 21:17:35 1968

IDEA的开发工具的使用和配置.docx

开发工具的使用

2021-11-23

Zookeeper学习总结.xmind

主要介绍了zookeeper 的概述,特点,作用,角色,安装,shell命令

2021-05-31

libdb-5.3.zip

安装yum的时候报错,缺失了这个so文件,自己搞好长时间编译了这个共享库文件

2021-01-22

glibc-2.14.1-rpm-all.tar.gz

安装支持的2.14版本的

2021-01-22

2021gcc.tar.gz

需要编译来安装软件,但需要gcc 验证可以安装使用,包括(gcc-4.4.7-17.el6.x86_64.rpm,gcc-c++-4.4.7-17.el6.x86_64.rpm等相关文件)

2021-01-22

ip地址(满足大家日常开发所需要的ip地址测试)

ip更新到2018年08年25号,最新的ip地址库,大约有46多万数据。信息很全。

2018-09-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除