云百佰
码龄5年
  • 65,069
    被访问
  • 47
    原创
  • 97,069
    排名
  • 159
    粉丝
关注
提问 私信

个人简介:平平淡淡的码农

  • 加入CSDN时间: 2017-03-07
博客简介:

qq_37797234的博客

查看详细资料
  • 3
    领奖
    总分 239 当月 36
个人成就
  • 获得27次点赞
  • 内容获得14次评论
  • 获得109次收藏
创作历程
  • 1篇
    2022年
  • 9篇
    2021年
  • 19篇
    2020年
  • 22篇
    2019年
成就勋章
TA的专栏
  • 大数据
    1篇
  • 机器学习
    4篇
  • python
    9篇
  • java
    6篇
  • etl
    1篇
  • canal
    1篇
  • 数据治理
    2篇
  • linux
    15篇
  • dremio
    1篇
  • spark
    5篇
  • 算法
    2篇
  • hadoop
    7篇
  • docker
    7篇
  • PyQt5
    1篇
  • scala
    1篇
  • 职业生涯
  • manjaro
    4篇
兴趣领域 设置
  • 大数据
    hadoophivesparkbig dataetl
  • 数据库管理
    数据仓库
  • 前端
    vue.js
  • 后端
    架构
  • 小程序
    小程序
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

CDH6.3.2 组件Maven依赖版本

maven添加仓库:<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVer
原创
发布博客 2022.05.12 ·
9 阅读 ·
0 点赞 ·
0 评论

朴素贝叶斯分类算法_商品多分类_数据集.txt

发布资源 2021.12.06 ·
txt

npm ERR! gyp ERR! stack Error: Can‘t find Python executable “D:\python\Python36\Python36“, you can s

报错npm ERR! gyp ERR! stack Error: Can't find Python executable "D:\python\Python36\Python36", you can set the PYTHON env variable.解决方法:通过npm install -g cnpm --registry=https://registry.npm.taobao.org cnpm install
原创
发布博客 2021.10.13 ·
424 阅读 ·
0 点赞 ·
0 评论

canal 全量/增量数据同步说明

一、日志文件完整1、全量数据同步1、修改\canal.deployer-1.1.5\conf\example下的instance.properties通过以下三个配置实现canal全量数据同步# mysql日志文件canal.instance.master.journal.name=mysql-bin.000001# 获取日志的起始位置canal.instance.master.position=0# 获取日志的起始时间戳canal.instance.master.timestamp=16
原创
发布博客 2021.09.29 ·
1844 阅读 ·
1 点赞 ·
0 评论

通过第三方仓库安装Git

Git第三方仓库安装方式(IUS)1.安装使用里面说的自动化安装脚本curl https://setup.ius.io | sh2.然后可以看到 git2u相关内容yum search git 3.执行安装,并查看下版本yum remove -y git | yum -y install git2u#或yum remove -y git | yum -y install git2224.检查git是否安装成功,和查看版本git --version...
原创
发布博客 2021.09.07 ·
22 阅读 ·
0 点赞 ·
0 评论

问题 sparksql Caused by: java.lang.OutOfMemoryError: GC overhead limit exceeded

在/sparkconf/spark-defaults.conf添加配置增加内存和核数spark.driver.memory 3gspark.executor.memory 2gspark.driver.cores 2spark.sql.broadcastTimeout=300 # 心跳检测间隔,以防数据量过大,超时报错
原创
发布博客 2021.06.07 ·
137 阅读 ·
0 点赞 ·
0 评论

朴素贝叶斯分类算法——商品多分类(代码)

python环境:3.6.8import csvimport jiebadef lst_strip(lst):#去掉多余的空格。如果 a=[' 123','ttt,'vv ','',' '],如何实现a=['123','fuck','cvm'],因为strip()是对字符串操作,现在是一个list L=[] for v in lst: v = str.strip(v) if v: L.append(v) return
原创
发布博客 2021.04.21 ·
855 阅读 ·
0 点赞 ·
3 评论

python postgresSQL的psycopg2:参数初始化编码格式

编码格式参数为client_encoding=“UTF-8”连接时如下:import psycopg2con = psycopg2.connect(dbname="test", user="user", password="password", port="5678", host="192.168.56.45", client_encoding="UTF-8")client_encodingThis sets the client_encoding configuration parameter
原创
发布博客 2021.03.15 ·
339 阅读 ·
3 点赞 ·
0 评论

centos mysql环境彻底清除

清除命令如下:yum remove mysql* mariadb* -y rm /etc/my.cnf rm -rf /var/lib/mysql rm -rf /usr/share/mysql rm -rf /usr/lib/mysql #查询mysql服务
原创
发布博客 2021.03.12 ·
59 阅读 ·
1 点赞 ·
0 评论

scala-2.11.12.rar

发布资源 2021.01.22 ·
rar

spark 启动thrift server实现hive on spark

在 spark的conf下 创建 hive-site.xml不过在CDH中,hive是默认为hive on spark的,而不是mr新增下面内容:<configuration> <property> <name>hive.metastore.client.connect.retry.delay</name> <value>5</value> </property> <
原创
发布博客 2021.01.21 ·
310 阅读 ·
0 点赞 ·
0 评论

Apache ATLAS 安装与配置 Part 2

发布视频 2021.01.21

Apache ATLAS 安装与配置 Part 1

发布视频 2021.01.21

eclipse环境下报错:log cannot be resolved

转载于:https://blog.csdn.net/fjz_lihuapiaoxiang/article/details/83622934在eclipse环境下使用@Slf4j注解时,出现了log cannot be resolved这个异常。经过排查发现是缺少lombok插件的问题。解决方式当然是在eclipse中安装lombok插件啦。这里报错是因为没有lombok-1.16.20.jar这个插件下载完成以后,在eclipse的安装目录里找到eclipse.ini文件,E:\Tools\ecl
转载
发布博客 2020.11.18 ·
292 阅读 ·
0 点赞 ·
0 评论

python通过setup.py安装模块

步骤打开cmd到达安装目录python setup.py buildpython setup.py install
原创
发布博客 2020.11.16 ·
89 阅读 ·
0 点赞 ·
0 评论

python离线安装外部依赖包

1.制作requirement.txt  pip freeze > requirement.txt  内网安装外部依赖包办法:例如:安装pytest包得时候会顺带安装pytest依赖包离线下载安装包下载单个离线包 - pip download -d your_offline_packages <package_name>批量下载离线包 - pip download -d your_offline_packages -r requirements.txt离线安装安装单个离线
转载
发布博客 2020.11.13 ·
267 阅读 ·
0 点赞 ·
0 评论

数据治理平台Apache Atlas搭建与导入hive表

一、Atlas2.1.0编译编译环境:环境准备,jdk8_151以上,maven3.6.6下载源码包:国内下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/atlas/2.1.0/官方下载地址:http://atlas.apache.org/Downloads.html编译:解压源码包,进入解压后源码包的目录。cd /optsudo tar -zxvf apache-atlas-2.1.0-sources.tar.gz #重命名mv
原创
发布博客 2020.10.30 ·
1056 阅读 ·
0 点赞 ·
0 评论

dremio详细部署流程

独立集群模式架构图:环境要求Linux:RHEL (Tarball):Red Hat Enterprise Linux(红帽企业版)CentOS 6.7+ and 7.3+ (RPM))(在使用RHEL or CentOS机器上使用Dremio Linux RPM installer可以部署)Java:jdk8浏览器:Google Chrome 54+、Microsoft Edge 14+(用于访问UI管理界面,Dremio UI 在 http://hostname:9047)Dremio
原创
发布博客 2020.10.30 ·
827 阅读 ·
1 点赞 ·
0 评论

windows10家庭版 Hyper-V 的安装与完全关闭

windows10家庭版装Hyper-V方法:pushd "%~dp0"dir /b %SystemRoot%\servicing\Packages\*Hyper-V*.mum >hyper-v.txtfor /f %%i in ('findstr /i . hyper-v.txt 2^>nul') do dism /online /norestart /add-package:"%SystemRoot%\servicing\Packages\%%i"del hyper-v.txtDi
原创
发布博客 2020.07.07 ·
2275 阅读 ·
0 点赞 ·
0 评论

jd-gui.exe

发布资源 2020.06.15 ·
rar
加载更多