盛装吾步
码龄13年
  • 618,977
    被访问
  • 94
    原创
  • 983,416
    排名
  • 75
    粉丝
关注
提问 私信
  • 加入CSDN时间: 2009-09-28
博客简介:

kw-home

博客描述:
人生若只如初见
查看详细资料
个人成就
  • 获得137次点赞
  • 内容获得31次评论
  • 获得537次收藏
创作历程
  • 2篇
    2020年
  • 14篇
    2019年
  • 21篇
    2018年
  • 63篇
    2017年
  • 26篇
    2016年
成就勋章
TA的专栏
  • odps
    2篇
  • hadoop
    19篇
  • hive
    11篇
  • spark
    7篇
  • hbase
    8篇
  • java
    31篇
  • Spring
    11篇
  • oracle
    10篇
  • mysql
    8篇
  • tomcat
    3篇
  • kylin
    4篇
  • Linux
    7篇
  • python
    3篇
兴趣领域 设置
  • 数据库管理
    数据仓库
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

group by、grouping sets、rollup和cube方法详解

在平时的工作中,经常有按照不同维度筛选和统计数据的需求。拿视频会员订单数据来说吧,运营人员要查看深圳市的成功下单数或则深圳市某一种产品的成功下单数或者某一种产品的所有成功下单数时,每天的订单数又很大,现查的话按照不同的维度去查询又很慢。此时本篇文章或许会帮助到你。group by:主要用来对查询的结果进行分组,相同组合的分组条件在结果集中只显示一行记录。可以添加聚合函数。 grouping sets:对分组集中指定的组表达式的每个子集执行group by,group by A,B grouping s
原创
发布博客 2020.11.18 ·
993 阅读 ·
0 点赞 ·
0 评论

ODPS-SQL多维度交叉的优化方法探究

一、背景odps是阿里集团的大数据计算平台,odps-sql语法类似于hive。最近做了一个***的需求,需求中用到了大量的维度交叉,等到需求实现后却发现新的问题——cube的交叉维度太多了(最初有17个),而且指标的计算逻辑比较复杂,造成数据加工太慢了,举例1天的增量表大概8个小时,需求中还有自然月和30天时间粒度的,根本没法实现,因此投入大量时间做了优化,最终结果:11个维度,1天表的加工时间是30分钟,7日表1个小时,30天表3个小时。二、两种SQL方式实现聚合查询有两种方式,一种是使
原创
发布博客 2020.11.18 ·
493 阅读 ·
0 点赞 ·
0 评论

spring+mybatis useGeneratedKeys返回主键

在数据库操作中,当我们插入数据时往往需要当前插入数据的主键id,初学时比较笨,在插入之后再做一遍查询来获取id,这样会出现很多的问题。其实java提供了useGeneratedKeys方法,可以直接返回id,直接上代码:正常插入语句是这样的<insert id="addTeacher" parameterType="com.kk.demo.bean.Teacher">...
原创
发布博客 2019.11.26 ·
1524 阅读 ·
1 点赞 ·
0 评论

Java多线程——FutureTask+ExecutorService

1.Java并发编程:Callable、Future和FutureTask创建线程的2种方式,一种是直接继承Thread,另外一种就是实现Runnable接口。这2种方式都有一个缺陷就是:在执行完任务之后无法获取执行结果。如果需要获取执行结果,就必须通过共享变量或者使用线程通信的方式来达到效果,这样使用起来就比较麻烦。而自从Java 1.5开始,就提供了Callable和Futur...
原创
发布博客 2019.10.30 ·
320 阅读 ·
0 点赞 ·
0 评论

Spring——IOC(控制反转)、DI(依赖注入)

一、概述1.1、IoC是什么  Ioc—Inversion of Control,即“控制反转”,不是什么技术,而是一种设计思想。在Java开发中,Ioc意味着将你设计好的对象交给容器控制,而不是传统的在你的对象内部直接控制。如何理解好Ioc呢?理解好Ioc的关键是要明确“谁控制谁,控制什么,为何是反转(有反转就应该有正转了),哪些方面反转了”,那我们来深入分析一下:  ●谁控制谁,控...
原创
发布博客 2019.09.27 ·
161 阅读 ·
0 点赞 ·
0 评论

SpringBoot + Cache缓存

本文介绍Spring boot 如何使用redis做缓存,如何对redis缓存进行定制化配置(如key的有效期)以及spring boot 如何初始化redis做缓存。使用具体的代码介绍了@Cacheable,@CacheEvict,@CachePut,@CacheConfig等注解及其属性的用法。1.部署Cache1.1配置redis依赖和数据源配置pom.xml<...
原创
发布博客 2019.08.29 ·
153 阅读 ·
0 点赞 ·
0 评论

SpringBoot常用注解

一、注解(annotations)列表@SpringBootApplication:包含了@ComponentScan、@Configuration和@EnableAutoConfiguration注解。其中@ComponentScan让springBoot扫描到Configuration类并把它加入到程序上下文。@Controller用于标注控制层组件,@Service用于标注业务层组...
原创
发布博客 2019.07.30 ·
194 阅读 ·
0 点赞 ·
1 评论

mysql实现窗口函数功能

有时候我们想要得到每个分组的前几条记录,这个时候oracle中row_number函数使用非常方便,可惜MYSQL从8.0版本开始才支持窗口函数。本文介绍一些通过sql实现窗口函数效果的方法。1.利用用户变量实现数据自增表flow_task有phaseno(序列号),objectno(编号)等几个字段,我们想实现根据编号字段分组,然后组内根据序列号排序功能select @rownum...
原创
发布博客 2019.04.22 ·
4567 阅读 ·
0 点赞 ·
1 评论

Hbase批量查询-scan介绍

1.scan原理HBase的查询实现只提供两种方式:1、按指定RowKey 获取唯一一条记录,get方法(org.apache.hadoop.hbase.client.Get)Get 的方法处理分两种 : 设置了ClosestRowBefore 和没有设置的rowlock .主要是用来保证行的事务性,即每个get 是以一个row 来标记的.一个row中可以有很多family 和colu...
原创
发布博客 2019.04.16 ·
30813 阅读 ·
19 点赞 ·
3 评论

手机号码归属地查询接口

1、淘宝网((精确到省份)API地址: http://tcc.taobao.com/cc/json/mobile_tel_segment.htm?tel=手机号码2、百度(精确到地市)API地址:http://mobsec-dianhua.baidu.com/dianhua_api/open/location?tel=手机号码import jsonimport urlli...
原创
发布博客 2019.03.26 ·
1553 阅读 ·
1 点赞 ·
0 评论

Phoenix简介

HBase 提供很方便的shell脚本,可以对数据表进行 CURD 操作,但是毕竟是有一定的学习成本的,基本上对于开发来讲,sql 语句都是看家本领,那么,有没有一种方法可以把 sql 语句转换成 hbase的原生API呢? 这样就可以通过普通平常的 sql 来对hbase 进行数据的管理,使用成本大大降低。Apache Phoenix 组件就完成了这种需求,官方注解为 “Phoenix – ...
原创
发布博客 2019.03.12 ·
797 阅读 ·
0 点赞 ·
0 评论

Python执行系统命令的方法

1.os.system使用os.system(cmd)即可在python中使用linux命令os.system(cmd)的返回值。如果执行成功,那么会返回0,表示命令执行成功。否则,则是执行错误。使用os.system返回值是脚本的退出状态码,该方法在调用完shell脚本后,返回一个16位的二进制数,低位为杀死所调用脚本的信号号码,高位为脚本的退出状态码(查看文章尾部扩展资料[1]),...
原创
发布博客 2019.03.12 ·
16208 阅读 ·
2 点赞 ·
0 评论

Hadoop HA高可用集群搭建及常见问题处理

最近研究了下公司的hadoop集群并模仿搭建了一个在本地测试使用的hadoop集群。本文介绍下详细的搭建过程以及各种常见问题的处理解决。 1 ,  前期准备1.1  ,  准备Linux环境,配置虚拟机网络环境,修改虚拟机IP地址(最好使用第一种配置,简单且不容易出错)        注意,修改之前建议使用 root 管理员权限登陆,这样会避免特别多问题,等集群搭建好之后在用普通用户登...
原创
发布博客 2019.02.13 ·
881 阅读 ·
1 点赞 ·
0 评论

Python的datetime模块详解

datetime模块用于是date和time模块的合集,datetime有两个常量,MAXYEAR和MINYEAR,分别是9999和1.datetime模块定义了5个类,分别是1.datetime.date:表示日期的类2.datetime.datetime:表示日期时间的类3.datetime.time:表示时间的类4.datetime.timedelta:表示时间间隔,即两个时间点...
原创
发布博客 2019.02.13 ·
1314 阅读 ·
5 点赞 ·
1 评论

Linux内存信息详解

1. toptop命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。  可以直接使用top命令后,查看%MEM的内容。可以选择按进程查看或者按用户查看,如想查看oracle用户的进程内存使用情况的话可以使用如下的命令:  $ top   第一部分 系统信息栏 :  第一行(top):    “11:15:5...
原创
发布博客 2019.01.16 ·
2681 阅读 ·
0 点赞 ·
0 评论

proxifier for Mac(含注册码、使用图解)

发布资源 2019.01.15 ·
zip

python 获取环境变量

用Python Shell设置或获取环境变量的方法:一、设置系统环境变量1、os.environ['环境变量名称']='环境变量值' #其中key和value均为string类型2、os.putenv('环境变量名称', '环境变量值')二、获取系统环境变量1、os.environ['环境变量名称']2、os.getenv('环境变量名称')环境变量vi /etc/pr...
原创
发布博客 2019.01.15 ·
12901 阅读 ·
1 点赞 ·
0 评论

Hbase存储详解

Hbase存储详解一、概述  Hbase是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。  它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。  与hadoop一样,Hbase目标主要依靠横向扩展,...
原创
发布博客 2018.12.22 ·
1766 阅读 ·
1 点赞 ·
0 评论

Hbase存储详解

Hbase存储详解一、概述  Hbase是建立的hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。  它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。  与hadoop一样,Hbase目标主要依靠横向扩展,...
原创
发布博客 2018.12.22 ·
1766 阅读 ·
1 点赞 ·
0 评论

python爬取淘宝商品信息

本文实现了用python爬取淘宝信息的功能,主要涉及访问网页、正则匹配、json格式化等技术。# -*- coding: utf-8 -*import requests# import bs4import reimport jsondef open(keywords, page): headers = { "User-Agent": "Mozilla/...
原创
发布博客 2018.12.22 ·
1243 阅读 ·
1 点赞 ·
0 评论
加载更多