- 博客(3)
- 资源 (1)
- 收藏
- 关注
转载 shell脚本常用命令
转载自:https://www.cnblogs.com/chen-lhx/p/5743438.html 1 Shell中的特殊符号 1.1 $ 美元符号。用来表示变量的值。如变量NAME的值为Mike,则使用$NAME就可以得到“Mike”这个值。 1.2 # 井号。除了做为超级用户的提示符之外,还可以在脚本中做为注释的开头字母,...
2018-07-30 21:41:44 437
原创 Hive分析窗口(开窗函数)
Hive中提供了很多分析函数,用于完成负责的统计分析。先看看基础的sum,avg,min,max,用于实现分组内所有和连续累计的统计。 sum(columns) over (partition by col1 order by col2 rows between n/unbounded preceding and m following/current row ) 如果不指定rows betw...
2018-07-30 21:36:05 2017
原创 机器学习中数值型特征做特征归一化
今天去某外卖平台面试机器学习算法工程师,二面时面试官问到数值型特征工程,提到归一化,按常规想法就是MinMaxScaler或Zscore。本以为回答完美,但被面试官追问,为什么做归一化,做与不做,有什么区别?这让我猝不及防,就按自己的理解说,某些特征的数值相较其他特征数值范围差异大,在算法的训练中,对结果受影响。面试官又问什么程度是大?被这追问问的头皮发麻。后面又提到数值型特征也可以用对数?又被问...
2018-07-30 20:55:43 1468
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人