1、ll –tr (会显示文件的权限 用户名和大小)
查看当前目录下的所有文件
2、fasttext predict-prob textmodel.bin test.txt > predict_result
将test.txt的预测结果追加到predict_result上去。
3、head predict_result
4、paste -d "\t" predict_result test.txt > result
Paste可以简单的理解为将两个文件的内容按列合并,与cat命令直接将不同文件按照先后顺序接起来不同,paste可以非常快速的将两个文件中的内容按照文件顺序从左往右排起来。
直接拼接:paste file1 file2 >result (将file1和file2中的内容按列拼接后,追加到result中,若是不追加到result中,则会直接在终端显示)
拼接时使用指定符号隔开各个文件的内容
paste –d ’:‘ file1 file2
5、用xshell远程连接服务器
将服务器上面的文件传送给本机电脑
sz
sz filename在你本机的 下载 目录。
将本机电脑上的文件传给服务器
Rz
6、批量删除一个文件夹下面x开头的文件
rm –rf x*
清空文件夹 rm *
删除文件A
rm A
7、用linux split命令将a.txt文件按照4:1切分成两个文件
Eg:文件大小4000
Split –b 3000 a.txt
一般情况下split切分,用cat合并。
就会生成两个文件,大小约为4:1。
8、find命令
find –name s*
找出s开头的文件。
9、用mv将A重命名B
mv A B
10、查找source_data/6994_cps.data中的关键词“磨牙棒”
grep “磨牙棒” 6994_cps.data
grep -v "磨牙棒" 6994_cps.data 查找不含有磨牙棒行
11、将文件夹item_data中的文件全部打乱并追加到上一级目录的6994_cps.data中。
[admin@A01-R03-I186-88 item_data]$
cat * | sort -R > ../6994_cps.data
12、查看item_data的中的文件总数
13、保存.sh生成的日志文件到相应的log文件中。
查看log日志:
tail -f A.log
14、linux命令查看一个文件夹中有多少文件2
1)查看有多少文件和文件夹:ls | wc -w
2)查看有多少个文件 : ls | wc -c
15、查找6994_cpssrc.data文件中 7029和仓鼠的文本行
方法二:
16、将file文件内容打乱,放到file1中: sort -R file > file1
将file1中的前n行放到file2中,head -n file1 > file2
删除file1的前n行。放到file3中,sed -i 1,nd file1 > file3
17、
将f2中与f1相同的删除
18、将f1文件中满足条件的内容6994替换成6998
例如:
这是我查出来需要改的,怎么用命令啊,一次性把一个文件夹中的满足带有龙猫条件的这几个的13967改成13964。
答:grep "13967" f1 |grep "龙猫">f2 (从f1中查找出带有13967和龙猫的文本存到f2中)
grep -vf f2 f1>f3 (将f1中和f2中相同的部分删除,并保存到分f3中)
vim f2
输入 :%s /13967/13964/g(打开vim并在底端输入下面命令将f2中的13967换成13964)
cat f2 f3 >f4 (将f2和f3合并成f4)
则f4就是结果
15、 查看进程: pos
16、查看JAVA进程:
[root@ipdetl-d684256f lirui]# ps -f|grep java
[root@ipdetl-d684256f lirui]# hadoop fs -ls /user/lirui/sentiment/lcs/12218/model_data_diff
17、linux命令,vim打来一个文件,复制命令是yyp
18、 cat 6994_cps.data | cut -f1| sort | uniq -c|sort -rnk1
看文本的前几列。
19、sort | uniq 去重
20、只查看test.txt文件(100行)内第20到第30行的内容(企业面试)
[root@Gin scripts]# awk '{if(NR>=20 && NR<=30) print $1}' test.txt
awk -F ":" '{ print $1 }' /etc/passwd |
表示打印/etc/passwd 的内容
21、cat 6994_cps.data | cut -f1| sort | uniq -c|sort -rnk1
打开6994_cps.data文件,提取出第一个域
22、linux cut的用法
其语法格式为:
cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file]
cut 命令从文件的每一行剪切字节、字符、字段,并将这些字节、字符、字段写到标准输出。
如果不指定file参数,cut将读取标准输入,必须指定 -b -c -f。
-b 字节 -c 字符 -d 自定义分隔符 -f 与-d一起使用,指定显示那个区域。
[rocrocket@rocrocket programming]$ cat /etc/passwd|head -n 5
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[rocrocket@rocrocket programming]$ cat /etc/passwd|head -n 5|cut -d : -f 1
root
bin
daemon
adm
lp
23、linux sort
将文本文件内容加以排序,sort可针对文本文件的内容,以行为单位来排序。
24、linux下备份一个目录下所有文件及目录
cp -rf 源目录 备份目录
cp是复制命令
-r 递归处理,指定目录下的文件和子目录一并处理
-f 强行复制,无论目标是否存在
在同一个目录下复制同一个文件A
方法一:cp -f A
方法二:cp A A.bak
25、linux文本操作界面 vim面板如何复制一行
1)把光标移动到要复制的行上
2)按yy
3)把光标移动到要复制的位置
4)按p
按u可以退回,就是将复制的删除。
26、查看文本中不重复的标签
awk '{print $1}' txt | sort | uniq > tt
27、去除item中<fell>的数据
mv 1429 tt
ls *1429
\rm *1429
mv tt 1429
28、vim 中现实tab键
:set list
tab键被显示成^I ,末尾被显示成$。
29、Python pandas
pandas中为我们提供了丰富的读取文件的接口,对数据处理极为的方便
30、2/8分词命令
31、awk 获取文本中的第一列。
awk是文本行处理命令
-F'\t' 以 \t 分割
‘{print $1}’打印第一列 $2表示第二列
32、去重
cat a.txt |sort|uniq
33、查看gpu的使用情况
nvidia-smi
34、查看目前的进程
ps -f
34 查看pip安装的包
pip list
35 、看我们的进程
top
36、将两个文件种不同的部分取出存入AAA中
diff file1.txt file2.txt >AAA
37、后台运行一个代码:nohup sh run_camera.sh &
38、看生成文件的大小:
du -sh *
39、杀死后台进程
1、查找到后台进程 [admin@A01-R03-I186-88 codelirui]$ ps -ef |grep run_camera.sh
2、杀死他 kill -9 8058
3、在查一下,看看有没有杀死 ps -ef |grep run_camera.sh