Linux下做数据分析常用操作

1、查询文件中某一列,包含某个字符串的个数
cat data.txt | awk -F ',' '{print $8}' | grep '路由器' | wc -l
2、查询文件中某一列去重后的数据个数
cat data.txt | awk -F ',' '{print $1}' | sort | uniq | wc -l
3、查询文件有多少行
wc -l data.txt
4、将两个文件的并集输出到另一个文件
cat 1.txt  2.txt | sort |uniq > 5.txt
5、将两个文件的交集(某行相同的值)输出到另一个文件
cat 1.txt  2.txt | sort |uniq -d > 6.txt
6、去掉两个文件中的交集部分,剩下的部分输出到另一个文件
cat 1.txt 2.txt | sort | uniq -u > 7.txt
7、按行合并文件
cat 1.txt  2.txt  > 8.txt
8、按列合并文件
文件中间用tab键分开
paste 1.txt  2.txt  > 9.txt
文件中间用逗号分开
paste 1.txt 2.txt -d ','  > 10.txt
9、重复行
重复行保留一行输出
sort file | uniq
重复行全部去掉
sort file | uniq -u
10、批量替换文件中某个字符
将3.txt文件中的tab键换为逗号
sed  -i 's/\t/,/g' 3.txt
将3.txt文件中的空格换为逗号
sed  -i 's/ /,/g' 3.txt
将3.txt文件中的tab键换为逗号
perl -pi -e"s/\t/,/g" 3.txt

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值