- 博客(6)
- 收藏
- 关注
转载 hive常用sql优化参数
hive优化参数 --HIVE_CONFIG= set hive.exec.parallel=true; set mapred.max.split.size=50000000; -- 决定每个map处理的最大的文件大小,单位为B,即调整mapper的多少 需要先确定一个mapper处理的大...
2018-04-18 15:37:00 192
转载 hive如何用sql写一个初始化历史数据为拉链表的语句
虽然已经在知乎上面提了问题,但是没有一个人回答,目前我也把结果做了出来了。 还是需要展示一下. 第一步,将半年的数据分成单月取初始化,如下只是201801的数据,其他就不展示了,改下日期就可以了: --HIVE_CONFIG=set hive.exec.parallel=true;set...
2018-04-18 14:50:00 1232
转载 Python + Phantomjs+Selenium
phantomjs 简介 phantomjs是一个基于webkit内核的无头浏览器,即没有UI界面,即它就是一个浏览器,只是其内的点击、翻页等人为相关操作需要程序设计实现。 (1)常用内置几大对象: var system=require('system'); //获得系统操作对...
2017-12-18 09:41:00 159
转载 Python Selenium安装到使用
一.安装和测试 直接使用pip安装 pip install selenium 或者从https://pypi.python.org/pypi 搜索selenium下载: https://pypi.python.org/pypi/selenium/3.8.0 用 Chrome 浏览...
2017-12-15 11:15:00 119
转载 python xlsxwriter创建excel图表(转载)
#-*-coding=utf-8-*-import xlsxwriterdef demo1(): #创建 workbook = xlsxwriter.Workbook('demo.xlsx') worksheet = workbook.add_worksheet...
2017-12-14 11:32:00 193
转载 Python对excel进行copy,包含单元格格式
#-*-coding=utf-8-*-#################################Func:读取零售集市数据字典,并重新写入excel,实现快速调整#Author:winnie#Date:2017年12月12日##########################...
2017-12-14 09:15:00 6159
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人