自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 时间

time.time()time.localtime(time.time())time.struct_time(tm_year=2019, tm_mon=3, tm_mday=27, tm_hour=19, tm_min=45, tm_sec=58, tm_wday=2, tm_yday=86, tm_isdst=0)time.strftime('%Y-%m-%d ', time....

2019-03-27 19:49:04 144

转载 python 行列选择

行选择切片[a:b]索引 iloc(iloc[]适用于数据进行了筛选后造成索引号与原来不一致的情况)data.iloc[1]data.iloc[1]['Price']price是一个列的名字指定位置 locdata.loc[0]列选择用name选择单列data['Price']用name选择多列data[['Price','Time']]用列的索引号d...

2019-03-07 14:09:56 3006

原创 Python学习笔记

筛选列:df[‘id’] = df [df[id]>5] 其中涉及到了嵌套,因为里面的df是为了展示整个表其他的字段。筛选行 df1.iloc[a:b,c:d] : a和b是取从a行到b行的数 c和d是取c-d列的数。升序降序:df1.sort_index(by=[‘manager’]) 常用还是sort_value...

2019-01-29 16:22:19 117

原创 标准差和方差的区别

举个例子:一个班级里有60个学生,平均成绩是70分,标准差是9,方差是81,成绩服从正态分布,那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分,通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826,即约等于下图中的34.2%*2 通过标准差和平均成绩就可以直观的得到学生的成绩分布情况 ...

2018-10-24 11:01:38 3096

原创 hive学习笔记 - collect_list、collect_set

1.collect_list 是把所有的列转行 并且不去重2.collect_set是会去重操作 图片显示为去重之后的

2018-10-23 14:48:41 753

原创 Hive上常用的日期函数

 date_sub(next_day(to_date(CURRENT_TIMESTAMP),'MO'),7) --本周1-- date_sub(next_day(to_date(CURRENT_TIMESTAMP),'MO'),14) --上周1-- date_sub(next_day(to_date(CURRENT_TIMESTAMP),'MO'),0) --下周1-- date_add(nex...

2018-07-13 15:51:47 4735

转载 Juypter快捷键

Jupyter Notebook 的快捷键Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。命令模式 (按键 Esc 开启)Enter : 转入编辑模式Shift-Enter : 运行本单元,选中下个单元Ctrl-Enter : 运行本单元Alt-Enter : 运行本单元,在...

2018-06-26 11:50:57 794

原创 SQL执行顺序

SQL 其执行顺序为:FROMWHEREGROUP BYHAVINGSELECTDISTINCTUNIONORDER BY    **需要注意的是 SELECT 执行顺序是在WHERE 和  GROUP BY、HAVING之后 所以决定了 GROUP BY   不能用SELECT中命名的字段...

2018-06-22 18:12:22 103

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除