麦田里的虫子
码龄14年
关注
提问 私信
  • 博客:55,888
    55,888
    总访问量
  • 11
    原创
  • 674,189
    排名
  • 7
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2011-06-28
博客简介:

麦田里的虫子

查看详细资料
个人成就
  • 获得7次点赞
  • 内容获得4次评论
  • 获得38次收藏
创作历程
  • 1篇
    2019年
  • 10篇
    2018年
  • 1篇
    2017年
成就勋章
TA的专栏
  • javascript
  • 数据仓库学习
    2篇
  • mysql
    7篇
  • linux
    1篇
  • hive
    1篇
兴趣领域 设置
  • 大数据
    hadoophivestormsparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

sparkSql动态插入hive分区表

前提条件:hive中创建分区表,并指定分区键create table test(id stirng)partitioned by (name string)stored as orc;创建sparksession,不需要认证的话去掉config中内容 SparkSession ss = SparkSession.builder() .ap...
原创
发布博客 2019.08.14 ·
7895 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

记一次linux 根目录扩容

系统版本: cat /etc/redhat-release CentOS Linux release 7,2,15,11现状: 磁盘有2块 sda 、sdb, 现只有sda被分为sda1、sda2分别为root、swap,因为root分区马上就满了所以准备对磁盘sda扩容,将sdb合并到sda中 原理: 使用lvm对磁盘扩容 通过转置sdb的pe到sda中达到对...
原创
发布博客 2018.07.08 ·
10902 阅读 ·
2 点赞 ·
2 评论 ·
23 收藏

MySQL的binlog日志

binlog 基本认识 MySQL的二进制日志可以说是MySQL最重要的日志了,它记录了所有的DDL和DML(除了数据查询语句)语句,以事件形式记录,还包含语句所执行的消耗的时间,MySQL的二进制日志是事务安全型的。一般来说开启二进制日志大概会有1%的性能损耗(参见MySQL官方中文手册 5.1.24版)。二进制有两个最重要的使用场景: 其一:MySQL Replication在...
转载
发布博客 2018.06.19 ·
302 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql order by limit 的一个坑

需求:一次对表中单行的值进行计数排序发现的问题: 对单个无索引的字段进行排序后,取前3行的数据发现当被排序字段有相同值时并且在limit范围内,取的值并不是正常排序后的值,也就是说,当排在第N行的数据可取key1、 key2 时 , 排序结果可能是key1,也可能是key2。select * from cnt_table order by cnt desc想要的结果 排序...
原创
发布博客 2018.06.08 ·
16739 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

MySQL: [Err] 1366 - Incorrect decimal value: '' for column '' at row -1

发生在一次迁移表数据时,原表字段类型为text,目标表字段类型为double, 在转换数据类型时用了cast(col as decimal(20, 2))导致mysql报1366错误, 导入不了数据浏览了很多博客发现只有用 round(value, 2) 转换才可以正常导入,不知道为什么。。...
原创
发布博客 2018.05.28 ·
6826 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

mysql 以不同编码存储汉字长度测试

1.以utf8编码存储汉字(一个汉字占3字节) 创建测试表CREATE TABLE `dist` ( `id` int(11) NOT NULL AUTO_INCREMENT, `col2` varchar(2) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,) ENGINE=InnoDB AUTO_INCREMEN...
原创
发布博客 2018.05.25 ·
582 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql 临时表使用

语法 : create temporary table temptable_name1.和实体表一样有主键、索引 2.在一次查询中不能同时使用2次临时表 (Can’t reopen table) 3.生命周期只在一个连接中,断开连接临时表会被释放 4.临时表分内存临时表和磁盘临时表,当临时表存储空间大于 ‘tmp_table_size’ 值时,会在磁盘上创建临时表,从而效率下降...
原创
发布博客 2018.05.24 ·
2839 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

存储过程调用权限

SQL SECURITY DEFINER 创建存储过程默认调用权限以definer执行,即调用者以存储过程创建者的权限来执行,mysql检查创建者的执行权限 SQL SECURITY INVOKER 存储过程以调用者的权限来执行,mysql检查调用者是否有执行存储过程定义语句的权限ps:以上两种都需要调用者有存储过程的EXECUTE权限...
原创
发布博客 2018.05.21 ·
1563 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

记一次使用mysql变量为分组后的数据配自增id

SELECT (@i:=case when @col3 = col3 then @i+1 else 1 end) as rownum, (@col3:= col3 ), //为变量赋值等于上一个字段的值 col3, col4, idFROM `test_table` , (select @i:=0, @col3:=0) t1 //初始化变量值g...
原创
发布博客 2018.05.17 ·
2462 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

抓取斗鱼直播弹幕

主要PYTHON代码登录弹幕服务器,并发送TCP包和心跳包class danmaku(object): def __init__(self): self.douyu_service_ip = ('117.148.167.219', 8601) self.type_douyutoMe = 690 self.type_metoDouy...
原创
发布博客 2018.03.14 ·
2624 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

分析斗鱼弹幕礼物发送情况

分析斗鱼弹幕礼物发送情况一.数据来源 python抓取斗鱼直播间3168536的弹幕获得 二.数据处理 对得到的数据维度建模、ETL过程最终得到事实表dw_fact_analysis,取2017-12-17日 17时 ~ 24时直播弹幕数据 三.描述性分析 1.房间内每5分钟观众赠送礼物数量 SQL、PYTHON代码部分:select date...
原创
发布博客 2018.03.08 ·
2664 阅读 ·
3 点赞 ·
1 评论 ·
2 收藏

数据仓库设计

一、分析目标: 斗鱼弹幕礼物发送情况二、设计思路: 参考了数据仓库工具箱第三版设计思想1.选择业务过程(通常用行为动词表示) 用户输入文字,礼物并发送。2.声明粒度(如何描述事实表中每个行的内容) 每个用户发送的信息用一行表示。3.确定维度(如何描述业务事件产生的度量的数据) 1.用户维度 2.房间维度 //3.数据来源维度...
原创
发布博客 2017.12.30 ·
343 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏