自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 HIVE优化操作总结

hive数据倾斜优化策略1、Map端部分聚合 (mapjoin)set hive.map.aggr=true 默认是true。例子:select gender,count(1) from user group by gender;适合场景:groupby_key是不散列,首先对map端进行汇总是有意义的。不适合场景:不是所有的聚合都需要这个优化。 groupby_key是用户ID...

2019-08-30 18:34:22 350

原创 python的实用开发工具jupyter和pycharm

一、Jupyter Notebook 的失败运行之前是安装了jupyter,直接启动之后运行代码,没有结果。后来知道是只是安装了jupyter ,没有安装notebook二、 Jupyter Notebook 的失败运行由于上面的安装缺失,下面重新介绍下安装过程。1、pip方式安装Jupyter(记得是分开安装2个)pip install jupyterpip install ...

2019-08-30 10:24:20 5098

原创 Python的使用总结

1、 改变print自动换行template = "零一二三四五六七八九" s = input()for c in s: print(template[eval(c)], end="")print()中增加end=""参数表示输出后不增加换行,多个print()可以连续输出。2、 产生循环遍历的方式tempStr 是字符串1)for …infor i in tempSt...

2019-08-29 19:50:30 915

原创 python的高级特性总结

Python高级特性使用总结:1、在Python中,函数的参数可以有默认值,也支持使用可变参数,所以Python并不需要像其他语言一样支持函数的重载,在参数名前面的*表示args是一个可变参数2、python里面的分片,针对list,tumple和numpy都适用slice(1, 3)相当于[1:3]list=[1,4,3,4,5]list[1:3]等效于list[slice(1,3)...

2019-08-23 10:37:43 172

原创 网络工具系列之(一)MAC和window通过有线连接传输文件

MAC和window通过有线连接传输文件,以下是ssh命令行的方式。1、打开windows的命令行win+R 输入ipconfig找到对应的ip地址。2、在mac终端命令行上输入ifconfig之后两边双向ping 对方的ip,看能否ping 通。3、打开mac的远程登录1、首先,在苹果Mac电脑上的“系统偏好设置”窗口中打开“共享”功能,接着在共享窗口中的左侧点击启用“屏幕共享...

2019-08-22 11:43:58 6766

原创 vim的常用操作技巧

vim命令总结记得实操一遍加深记忆1.删除字符要删除一个字符,只需要将光标移到该字符上按下"x"。2.删除一行删除一整行内容使用"dd"命令。删除后下面的行会移上来填补空缺。3.删除换行符在Vim中你可以把两行合并为一行,也就是说两行之间的换行符被删除了:命令是"J"。4.撤销如果你误删了过多的内容。显然你可以再输入一遍,但是命令"u" 更简便,它可以撤消上一次的操作。5.重做...

2019-08-21 17:05:45 184

原创 Nodepad++的常用文本操作技巧

Notepad++相关的功能和技巧总结 DOWNLOAD Nodepad++1.Base64编解码编码:插件§ -> MIME Tools -> Base64 Encode解码:插件§ -> MIME Tools -> Base64 Decode详细操作步骤请参考:Notepad++插件Base64编解码2.HTML元字符转义TextFX -> ...

2019-08-21 16:36:45 1352

原创 python常用的模块

一、date在一个hive使用python脚本进行etl的代码中感受到了各个语言的相通性。对于使用python语言的小伙伴去做etl工程师也丝毫无压力。时间戳转成标准时间1、时间转换1)输出格式是yyyy-MM-dd HH:mm:ss datetime.datetime.fromtimestamp(float('某个时间戳'))2)输出格式是yyyyMMddHHmmss(yyyy...

2019-08-15 16:06:31 133

原创 Linux的实用命令(四)之替换sed命令和特殊字符处理

Linux中的特殊字符的处理1、windows和linux环境下的换行符号处理:Windows系统中有如下等价关系: 用enter换行 <====> 程序写\n <====> 真正朝文件中写\r\n(0x0d0x0a) <====>程序真正读取的是\nlinux系统中的等价关系: 用enter换行 <====> 程序写\n &l...

2019-08-15 14:01:29 12806

原创 Linux用到的大数据相关命令

5、大数据相关的命令1、hdfs文件down到本地hadoop dfs -getmerge hdfs_path/* nas_path/temp2、远程集群复制 distcp /跨机器复制 scp1)本来是远程复制的hadoop distcp 复制的地址1 复制目的地地址2因为两个集群都是有认证的,彼此不通所以方案一取消查看要复制的文件大小:hadoop dfs -du -s...

2019-08-15 10:41:52 889

hbase安装和基本介绍

安装详情

2017-07-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除