Data_IT_Farmer
码龄14年
关注
提问 私信
  • 博客:5,615,793
    社区:86
    问答:69
    5,615,948
    总访问量
  • 93
    原创
  • 1,442,431
    排名
  • 853
    粉丝
  • 6
    铁粉

个人简介:BJUT 2014级 计算机学院小硕一枚,现为某上市金融公司--高级大数据开发工程师一枚。自20170701开始记录自己的技术工作生涯!广结天下技术之友,笑对未来技术之难题!

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河南省
  • 加入CSDN时间: 2010-11-26
博客简介:

helloxiaozhe的博客

博客描述:
信者通达,数据为王,自强不息,解码未来——数据码农宣言
查看详细资料
  • 原力等级
    当前等级
    7
    当前总分
    3,682
    当月
    8
个人成就
  • 获得1,782次点赞
  • 内容获得365次评论
  • 获得8,107次收藏
  • 代码片获得4,112次分享
创作历程
  • 2篇
    2024年
  • 9篇
    2023年
  • 6篇
    2022年
  • 28篇
    2021年
  • 38篇
    2020年
  • 65篇
    2019年
  • 156篇
    2018年
  • 52篇
    2017年
  • 1篇
    2016年
成就勋章
TA的专栏
  • sparksql
    15篇
  • 性能调优
    3篇
  • DNS
    2篇
  • 域名配置
    2篇
  • 数据结构
    5篇
  • leetcode
    4篇
  • ip转int
    1篇
  • tableau
    1篇
  • 数据架构
  • 分析函数
    1篇
  • 高并发
    4篇
  • CAP理论
    2篇
  • 分布式系统
    2篇
  • 科普
    1篇
  • CRM
    1篇
  • 布隆过滤器
    1篇
  • smtp
    1篇
  • alias
    1篇
  • 理财有道
  • hadoop HA集群安装
    1篇
  • rdd
    1篇
  • sort函数
    1篇
  • sorted函数
    1篇
  • 合并单元格
    1篇
  • xlwt
    1篇
  • Sublime
    1篇
  • sftp
    1篇
  • sqoop
  • Hadoop
    25篇
  • MAC shell
    5篇
  • Spark
    44篇
  • Python
    84篇
  • Linux
    29篇
  • 推荐算法
    3篇
  • 多文档摘要
  • 机器学习
    11篇
  • mac
    3篇
  • 键盘失灵
    1篇
  • mysql
    64篇
  • 数据库
    64篇
  • JetBrains激活
  • 新手编码习惯
    11篇
  • Hbase
    12篇
  • thrift
    2篇
  • hive
    49篇
  • MapReduce
    6篇
  • Streaming
    2篇
  • shell
    19篇
  • azkaban
    4篇
  • openpyxl
    3篇
  • NLP
    1篇
  • Flume
    3篇
  • Kafka
    1篇
  • 大数据处理平台
    20篇
  • MaxCompute
    1篇
  • rz
    1篇
  • sz
    1篇
  • Crontab
    1篇
  • 动态分区插入
    2篇
  • 多表插入
    1篇
  • 字段拼接函数
    1篇
  • shutil
    1篇
  • 文件操作
    3篇
  • 深度学习
    2篇
  • 前向传播算法
    1篇
  • 后向传播算法
    1篇
  • sigmoid函数
    1篇
  • 日期字符函数
    2篇
  • 静态方法
    2篇
  • 类方法
    2篇
  • property
    1篇
  • 职场趣事杂感
    1篇
  • MacDown
    1篇
  • rowkey设计
    1篇
  • 程序员的思考
    14篇
  • MongDB
  • git
    2篇
  • PHP
    1篇
  • nginx
    2篇
  • Pandas
    1篇
  • Matplotlib
    1篇
  • 数据可视化
    2篇
  • 创建表
    1篇
  • 时间戳转换
    2篇
  • 外部分区表
    1篇
  • tree
    1篇
  • VMware
    1篇
  • 打开异常
    1篇
  • UltraEdit
    1篇
  • 注册激活
    1篇
  • JAVA
    6篇
  • 技术概念
    4篇
  • mycat
    2篇
  • 云计算
  • OpenStack
  • requests
    2篇
  • 返回状态码
    3篇
  • case语句
    1篇
  • DECIMAL
    1篇
  • DataFrame
    10篇
  • get请求
    2篇
  • post请求
    2篇
  • 字段类型
    1篇
  • 网络知识
    3篇
  • 电商指标
    1篇
  • crontab任务重复执行
    1篇
  • 动态规划
    2篇
  • aggregateByKey
    1篇
  • aggregate
    1篇
  • Redis
    1篇
  • 数据仓库
    13篇
  • xshell
  • 文件属性变化监控
    2篇
  • 目录同步
    3篇
兴趣领域 设置
  • 大数据
    hivesparkflink
  • 人工智能
    机器学习
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hive collect_set()、collect_list()列转行,并对转换后的行值排序

Hive collect_set()、collect_list()列转行,和concat_ws()使用,并对转换后的行值排序
原创
发布博客 2024.01.30 ·
2612 阅读 ·
8 点赞 ·
0 评论 ·
16 收藏

Spark Doris Connector 可以支持通过 Spark 读取 Doris 数据类型不兼容报错解决

Spark Doris Connector 可以支持通过 Spark 读取 Doris 数据,但部分doris类型spark doris connector不兼容报错解决方案 .spark.exception.ConnectedFailedException: Connect to Doris BE{host='172.xxx.yyyy.10', port=9060}failed.
原创
发布博客 2024.01.12 ·
1870 阅读 ·
25 点赞 ·
0 评论 ·
25 收藏

hive和spark-sql中 日期和时间相关函数 测试对比

hive和spark-sql中 日期和时间相关函数 测试对比
原创
发布博客 2023.11.12 ·
2118 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Gogs安装和部署教程-centos上

Gogs 是一款极易搭建的自助 Git 服务。Gogs安装和部署教程-centos上
原创
发布博客 2023.11.11 ·
4670 阅读 ·
4 点赞 ·
0 评论 ·
5 收藏

hive有经典的列转行,但行转列也不应该忽略

hive有经典的列转行,但行转列也不应该忽略
转载
发布博客 2023.11.10 ·
321 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

free -h详解与内存swap理解

free -h详解与内存swap理解
转载
发布博客 2023.10.22 ·
7635 阅读 ·
7 点赞 ·
0 评论 ·
24 收藏

hive和presto的求数组长度函数区别及注意事项

hive和presto的求数组长度函数区别及注意事项
原创
发布博客 2023.10.19 ·
1985 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

hive建表指定列分隔符为多字符分隔符实战(默认只支持单字符)

Hive多字符的列分隔符支持示例,清洗入hive表的过程中,发现字段之间的单一字符的分割符号已经不能满足列分割需求,因为字段值本身可能包含分隔符。
原创
发布博客 2023.10.10 ·
3954 阅读 ·
4 点赞 ·
0 评论 ·
21 收藏

和subline快捷键冲突:win10按快捷键ctrl+shift+L会显示“性能录制已开始”,怎么把这个快捷键关掉?

和subline快捷键冲突:win10按快捷键ctrl+shift+L会显示“性能录制已开始”,怎么把这个快捷键关掉?
原创
发布博客 2023.09.24 ·
5572 阅读 ·
6 点赞 ·
0 评论 ·
4 收藏

Hive中SQL通配符like与正则匹配rlike(regexp)的区别

Hive 中可以用 like 和 rlike 进行模糊匹配,like 采用的是 SQL 通配符,而 rlike (regexp)采用的是正则匹配。
转载
发布博客 2023.04.15 ·
3969 阅读 ·
0 点赞 ·
1 评论 ·
9 收藏

windows10上安装mysql 5.7.37

windows10上安装mysql 5.7.37,及可视化客户端Navicat安装
转载
发布博客 2023.03.06 ·
851 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

shell脚本中用hive -e执行sql出现「cannot recognize input near ‘<EOF>‘ in select clause」问题

1、shell脚本中用hive -e执行sql出现「cannot recognize input near ‘<EOF>‘ in select clause」问题2、解决方案修改hive -e ${sql}为hive -e "${sql}"3、原因分析若没有使用双引号进行包括,则"hive -e"会认为后面的sql内容解析为多个参数造成错误。而使用双引号后,整个sql将作为一个单独的参数传给hive。
转载
发布博客 2022.11.09 ·
3083 阅读 ·
4 点赞 ·
0 评论 ·
3 收藏

python中list 转set和tuple遇到的坑和 python占位符使用

python中list 转set和tuple遇到的坑和 python占位符使用
原创
发布博客 2022.11.08 ·
885 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive表生成函数explode、stack、lateral view和json_tuple、parse_url_tuple示例

hive表生成函数explode、stack、lateral view和json_tuple、parse_url_tuple示例
转载
发布博客 2022.11.08 ·
3438 阅读 ·
5 点赞 ·
1 评论 ·
17 收藏

hive分箱函数ntile()使用案例

ntile()函数的作用是等频分箱,把观测值进行有序排列(默认升序),根据观测值的总个数等分为k部分,每部分当作一个分箱,即百分位数的概念,可以根据箱号选取前或后n分之几的数据。
转载
发布博客 2022.11.07 ·
2465 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

Callable和Runnable的区别(面试常考),看完就懂

Callable和Runnable的区别
转载
发布博客 2022.08.30 ·
268 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

JAVA客户端与服务端demo

java 服务端和客户端连接demo
转载
发布博客 2022.08.30 ·
839 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

linux expect远程自动登录以及执行命令

1、什么是expect?在做系统管理时,我们很多时候需要输入密码,例如:连接 ssh,连接ftp,那么如何能做到不输入密码吗?ssh远程登录一台主机后,会在know_hosts中新增1条记录,下次再登录时就不用输入用户名密码。但是有一个问题,如果我需要在100台新机器上登录,那就需要输入100次用户名密码,这之后才不用输入,这太麻烦了,因此就用到了expect来解决。我们需要有一个工具,能代替我们实现与终端的交互,那么,就是它:expect,管理员的最好的朋友之一,通过expect将代码分发至
转载
发布博客 2021.12.03 ·
4563 阅读 ·
1 点赞 ·
0 评论 ·
7 收藏

hive 和 spark-sql 如何写SQL求出中位数平均数和众数(count 之外的方法)

1、概念介绍 平均数、中位数、众数都是度量一组数据集中趋势的统计量。所谓集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势就是寻找数据一般水平的代表值或中心值。而这三个特征数又各有特点,能够从不同的角度提供信息。平均数特点:计算用到所有的数据,它能够充分利用数据提供的信息,它具有优秀的数学性质,因此在实际应用中较为广泛。但它受极端值的影响较大。应用场合:没有极端值的情况下数据集中趋势的刻画。如:小明五次测试的成绩为87、88、89、93、94你认为小明这五次测试成绩怎样?...
转载
发布博客 2021.11.24 ·
8057 阅读 ·
0 点赞 ·
1 评论 ·
15 收藏

csdn排名规则改了?从上一周的1700多名,在这一周断崖式下降到6400多名,这个是什么骚操作呢,大家来吐槽哈

发布问题 2021.08.03 ·
2 回答
加载更多