linux shell命令awk 提取文档第一列内容

本文介绍了一种从文本文件中提取指定列的方法,并演示了如何利用awk命令完成这一任务。此外,还提供了如何对提取的数据进行去重处理的具体步骤。
部署运行你感兴趣的模型镜像

1. 原文档内容格式:

词组 拼音 次序
阿爸 a1'ba4 18137
阿昌族 a1'chang1'zu250849
阿斗 a1'dou3 42632
阿飞 a1'fei1 48603
阿富汗 a1'fu4'han43461
阿訇 a1'hong1 34432
阿拉伯数字 a1'la1'bo2'shu4'zi435937
阿拉伯语 a1'la1'bo2'yu330476
阿妈 a1'ma1 16220
阿门 a1'men2 47913
阿Q a1'qiu1 20845
阿司匹林 a1'si1'pi3'lin240294
阿嚏 a1'ti4 54643


2. 共3列内容,现在只提取第一列词表,并存入另一文件:

awk '{print $1}' ./CH_word_ls.txt > ./out.txt
其中 ./CH_word_ls.txt是输入文件名 


3. 如果想提取前两列,只需

awk '{print $1,$2}' ./CH_word_ls.txt > ./out.txt

4. 然后对文本进行去重并输出到文件CH_words:

sort out.txt | uniq > CH_words




您可能感兴趣的与本文相关的镜像

Qwen-Image

Qwen-Image

图片生成
Qwen

Qwen-Image是阿里云通义千问团队于2025年8月发布的亿参数图像生成基础模型,其最大亮点是强大的复杂文本渲染和精确图像编辑能力,能够生成包含多行、段落级中英文文本的高保真图像

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值