- 博客(8)
- 收藏
- 关注
原创 时间
time.time()time.localtime(time.time())time.struct_time(tm_year=2019, tm_mon=3, tm_mday=27, tm_hour=19, tm_min=45, tm_sec=58, tm_wday=2, tm_yday=86, tm_isdst=0)time.strftime('%Y-%m-%d ', time....
2019-03-27 19:49:04 144
转载 python 行列选择
行选择切片[a:b]索引 iloc(iloc[]适用于数据进行了筛选后造成索引号与原来不一致的情况)data.iloc[1]data.iloc[1]['Price']price是一个列的名字指定位置 locdata.loc[0]列选择用name选择单列data['Price']用name选择多列data[['Price','Time']]用列的索引号d...
2019-03-07 14:09:56 3007
原创 Python学习笔记
筛选列:df[‘id’] = df [df[id]>5] 其中涉及到了嵌套,因为里面的df是为了展示整个表其他的字段。筛选行 df1.iloc[a:b,c:d] : a和b是取从a行到b行的数 c和d是取c-d列的数。升序降序:df1.sort_index(by=[‘manager’]) 常用还是sort_value...
2019-01-29 16:22:19 117
原创 标准差和方差的区别
举个例子:一个班级里有60个学生,平均成绩是70分,标准差是9,方差是81,成绩服从正态分布,那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分,通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826,即约等于下图中的34.2%*2 通过标准差和平均成绩就可以直观的得到学生的成绩分布情况 ...
2018-10-24 11:01:38 3098
原创 hive学习笔记 - collect_list、collect_set
1.collect_list 是把所有的列转行 并且不去重2.collect_set是会去重操作 图片显示为去重之后的
2018-10-23 14:48:41 754
原创 Hive上常用的日期函数
date_sub(next_day(to_date(CURRENT_TIMESTAMP),'MO'),7) --本周1-- date_sub(next_day(to_date(CURRENT_TIMESTAMP),'MO'),14) --上周1-- date_sub(next_day(to_date(CURRENT_TIMESTAMP),'MO'),0) --下周1-- date_add(nex...
2018-07-13 15:51:47 4736
转载 Juypter快捷键
Jupyter Notebook 的快捷键Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。命令模式 (按键 Esc 开启)Enter : 转入编辑模式Shift-Enter : 运行本单元,选中下个单元Ctrl-Enter : 运行本单元Alt-Enter : 运行本单元,在...
2018-06-26 11:50:57 795
原创 SQL执行顺序
SQL 其执行顺序为:FROMWHEREGROUP BYHAVINGSELECTDISTINCTUNIONORDER BY **需要注意的是 SELECT 执行顺序是在WHERE 和 GROUP BY、HAVING之后 所以决定了 GROUP BY 不能用SELECT中命名的字段...
2018-06-22 18:12:22 103
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人