使用篇-使用shell统计文件行数的几种方法和spark读取csv的常用注意点分享
1.shell命令统计文件行数的几种方式wc -l # wc的-l命令 lineawk 'END{print NR}' # awkawk '{print NR}' |tail -n1 #awkgrep -n ""|awk -F: '{print '}|tail -n1 #awksed -n '$=' # sed2.spark读取csv文件时常用的option参数解释optiondescheader默认false 将第一行作为列名sep默认, 指定单个字符
复制链接