自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Oracle 用工具表实现列拆分多行

算出每行逗号的个数,并且关联工具表,限制逗号个数大于等于工具表的行数(几个号码就会扩展成几行),并新增一列字段(用来取第几个数)。注:利用工具表实现循环,工具表行数需要大于逗号个数。之后就可以用正则获取对应的电话号码。

2023-09-14 09:46:00 296 1

原创 Oracle的分析函数over()

问题:各市随即抽样5000条数据聚合函数用group by分组,每个分组返回一个统计值。但不能对每行进行分析,得不到问题的结果。而分析函数采用partition by分组,并且每组每行都可以返回一个统计值。辅助row_number()函数和生成随机数函数,取rownum<=5000的数据。select *from (select ROW_NUMBER() over(partition by 市代码 order by RAND()) row_num ,t1.* from 表

2022-03-04 16:25:10 1178

转载 aop面向切面编程

假如没有aop,在做日志处理的时候,我们会在每个方法中添加日志处理,比如但大多数的日子处理代码是相同的,为了实现代码复用,我们可能把日志处理抽离成一个新的方法。但是这样我们仍然必须手动插入这些方法。但这样两个方法就是强耦合的,假如此时我们不需要这个功能了,或者想换成其他功能,那么就必须一个个修改。通过动态代理,可以在指定位置执行对应流程。这样就可以将一些横向的功能抽离出来形成一个独立的模块,然后在指定位置插入这些功能。这样的思想,被称为面向切面编程,亦即AOP。为了在指定位置执行这些横向的功能

2021-07-29 15:26:35 147

原创 hadoop中使用lzo压缩算法

在hadoop中使用lzo的压缩算法可以减小数据的大小和数据的磁盘读写时间,不仅如此,lzo是基于block分块的,这样他就允许数据被分解成chunk,并行的被hadoop处理。这样的特点,就可以让lzo在hadoop上成为一种非常好用的压缩格式。lzo本身不是splitable的,所以当数据为text格式时,用lzo压缩出来的数据当做job的输入是一个文件作为一个map。但是sequencefile本身是分块的,所以sequencefile格式的文件,再配上lzo的压缩格式,就可实现lzo文件方式的sp

2021-07-29 14:50:08 1650

原创 pandas datetime格式只获取日期或时间

假设有字段“日期”,给新字段添加值,值为只获取日期data[‘new_column’] = pd.to_datetime(data.日期, format=’%Y/%m/%d’).dt.date另外还有dt.time,dt.hour,dt.day,dt.year

2021-06-21 17:42:05 1635

转载 Centos安装python3.7

https://blog.csdn.net/weixin_42109012/article/details/102655926

2021-04-26 22:44:04 160

转载 Secondary NameNode的作用

原文出自:https://blog.csdn.net/jenrey/article/details/80738389看到一篇好文,借此学习一下。Secondary NameNode:它究竟有什么作用?NameNodeNameNode主要是用来保存HDFS的元数据信息,比如命名空间信息,块信息等。当它运行的时候,这些信息是存在内存中的。但是这些信息也可以持久化到磁盘上。上面的这张图片展示了NameNode怎么把元数据保存到磁盘上的。这里有两个不同的文件:fsimage - 它是在NameNode

2020-09-03 16:40:58 399

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除