问题描述:
python计算机二级综合应用,考点数据提取,素材文件Webpage.txt中提取JPG图片URL。
问题解答:
本人写的答案可能比标准答案拙劣,仅提供一种解题思路。
第一问:关键点在于JPG
#
# 请在此文件作答
#
fi =open("webpage.txt","r")
lines=fi.readlines()
sum=0
for line in lines:
if "JPG" in line:
sum = sum+1
print(sum)
第二问:关键点在于"src="和".JPG"
#
# 请在此文件作答
#src="http://image.ngchina.com.cn/2019/1104/thumb_469_352_20191104020119838.JPG" width="469px" />
fi =open("webpage.txt","r")
fo=open("images.txt","w")
lines=fi.readlines()
for line in lines:
if "JPG" in line:
line=line.strip()
line=line.split('src="')[1]
line=line.split('.JPG')[0]
line=line+".JPG"
fo.write(line+"\n")
fi.close()
fo.close()
__________________________________________________________________
需要注意的一点,读文件不关闭,不会影响读取,写文件如果不关闭,会导致内容写不进去,如下: