正则表达式应用
实验思路
将文件中时间、地区及对应PM值锚定提取
将时间日期等通过正则表达式进行格式替换
实验步骤
-
原始网页文件中含有大量<*>标签内容将其除去
cat webweather.txt| sed -e 's/<[^<>]*>/ /g' > simple.txt
-
将多个awk命令编写为文件flow.awk
-
使用awk命令筛选目标内容
awk -f flow.awk simple.txt >getwea.txt
- 将多个命令写入文件,使用sed命令进行格式替换
s/年/-/g
s/月/-/g
s/日//g
s/时/:00:00/g
s/更新://g
s/μg\/m³//g
sed -f correct.cmd getwea.txt > weather.txt
总结
在使用正则表达式进行替换 ug/m^3 时 忘记对/ 前加转义字符,在实验中尝试使用vim编辑命令文件,有点不习惯,易手抖在编辑模式按左右键,通过实验尝试使用vim编辑、正则表达式等基本工具。