自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 sparkSql动态插入hive分区表

前提条件:hive中创建分区表,并指定分区键create table test(id stirng)partitioned by (name string)stored as orc;创建sparksession,不需要认证的话去掉config中内容 SparkSession ss = SparkSession.builder() .ap...

2019-08-14 20:54:46 7772

原创 记一次linux 根目录扩容

系统版本: cat /etc/redhat-release CentOS Linux release 7,2,15,11现状: 磁盘有2块 sda 、sdb, 现只有sda被分为sda1、sda2分别为root、swap,因为root分区马上就满了所以准备对磁盘sda扩容,将sdb合并到sda中 原理: 使用lvm对磁盘扩容 通过转置sdb的pe到sda中达到对...

2018-07-08 19:07:08 10795 2

转载 MySQL的binlog日志

binlog 基本认识 MySQL的二进制日志可以说是MySQL最重要的日志了,它记录了所有的DDL和DML(除了数据查询语句)语句,以事件形式记录,还包含语句所执行的消耗的时间,MySQL的二进制日志是事务安全型的。一般来说开启二进制日志大概会有1%的性能损耗(参见MySQL官方中文手册 5.1.24版)。二进制有两个最重要的使用场景: 其一:MySQL Replication在...

2018-06-19 14:36:28 268

原创 mysql order by limit 的一个坑

需求:一次对表中单行的值进行计数排序发现的问题: 对单个无索引的字段进行排序后,取前3行的数据发现当被排序字段有相同值时并且在limit范围内,取的值并不是正常排序后的值,也就是说,当排在第N行的数据可取key1、 key2 时 , 排序结果可能是key1,也可能是key2。select * from cnt_table order by cnt desc想要的结果 排序...

2018-06-08 19:16:26 16647

原创 MySQL: [Err] 1366 - Incorrect decimal value: '' for column '' at row -1

发生在一次迁移表数据时,原表字段类型为text,目标表字段类型为double, 在转换数据类型时用了cast(col as decimal(20, 2))导致mysql报1366错误, 导入不了数据浏览了很多博客发现只有用 round(value, 2) 转换才可以正常导入,不知道为什么。。...

2018-05-28 11:55:02 6741 1

原创 mysql 以不同编码存储汉字长度测试

1.以utf8编码存储汉字(一个汉字占3字节) 创建测试表CREATE TABLE `dist` ( `id` int(11) NOT NULL AUTO_INCREMENT, `col2` varchar(2) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL,) ENGINE=InnoDB AUTO_INCREMEN...

2018-05-25 10:00:37 555

原创 mysql 临时表使用

语法 : create temporary table temptable_name1.和实体表一样有主键、索引 2.在一次查询中不能同时使用2次临时表 (Can’t reopen table) 3.生命周期只在一个连接中,断开连接临时表会被释放 4.临时表分内存临时表和磁盘临时表,当临时表存储空间大于 ‘tmp_table_size’ 值时,会在磁盘上创建临时表,从而效率下降...

2018-05-24 18:43:14 2781

原创 存储过程调用权限

SQL SECURITY DEFINER 创建存储过程默认调用权限以definer执行,即调用者以存储过程创建者的权限来执行,mysql检查创建者的执行权限 SQL SECURITY INVOKER 存储过程以调用者的权限来执行,mysql检查调用者是否有执行存储过程定义语句的权限ps:以上两种都需要调用者有存储过程的EXECUTE权限...

2018-05-21 11:22:54 1527

原创 记一次使用mysql变量为分组后的数据配自增id

SELECT (@i:=case when @col3 = col3 then @i+1 else 1 end) as rownum, (@col3:= col3 ), //为变量赋值等于上一个字段的值 col3, col4, idFROM `test_table` , (select @i:=0, @col3:=0) t1 //初始化变量值g...

2018-05-17 18:52:04 2428

原创 抓取斗鱼直播弹幕

主要PYTHON代码登录弹幕服务器,并发送TCP包和心跳包class danmaku(object): def __init__(self): self.douyu_service_ip = ('117.148.167.219', 8601) self.type_douyutoMe = 690 self.type_metoDouy...

2018-03-14 10:37:20 2570

原创 分析斗鱼弹幕礼物发送情况

分析斗鱼弹幕礼物发送情况一.数据来源 python抓取斗鱼直播间3168536的弹幕获得 二.数据处理 对得到的数据维度建模、ETL过程最终得到事实表dw_fact_analysis,取2017-12-17日 17时 ~ 24时直播弹幕数据 三.描述性分析 1.房间内每5分钟观众赠送礼物数量 SQL、PYTHON代码部分:select date...

2018-03-08 23:36:52 2620 1

原创 数据仓库设计

一、分析目标: 斗鱼弹幕礼物发送情况二、设计思路: 参考了数据仓库工具箱第三版设计思想1.选择业务过程(通常用行为动词表示) 用户输入文字,礼物并发送。2.声明粒度(如何描述事实表中每个行的内容) 每个用户发送的信息用一行表示。3.确定维度(如何描述业务事件产生的度量的数据) 1.用户维度 2.房间维度 //3.数据来源维度...

2017-12-30 23:11:23 314

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除