关于大数据一些新手入门知识的整理记录
关于Linux系统里面的私钥和公钥
系统的私钥和公钥一般默认储存在".ssh/"目录中,该目录为隐藏目录 cd .ssh/ --> ls 可以看到 id_rsa 和 id_rsa.pub 两个文件,id_rs 是私钥,自己使用的,id_rsa.pub 是公钥,上传到其他设备上的,使用cat id_rsa 或者直接vi id_rsa 可以直接查看内容,私钥不要给别人。
关于hive SQL的聚合函数的一些理解
写hive SQL聚合函数的时候,有时候会报错,或者结果不准确,因为对原理的不理解,后来自己在网上查了下,参考了别人的文档,自己也总结了一下:使用聚合函数时,null值将会被忽略,可以使用coalesce来将null值替换微某一个默认值;聚合函数经常与select语句的groupby子句一起使用,使用groupby 是因为使用了聚合函数,如果不使用groupby,那就没法聚合,所以使用了聚合函数的查询语句,该select字段要么在groupby 里面,要么在聚合函数里面。
自己是野路子出身,以上是不专业的人用不专业的语句写出的不专业的理解,有错误不当之处,欢迎指正。