这里以豆瓣网中的top1《肖申克的救赎》为例:1994 / 美国 / 犯罪 剧情
假设你已经爬取到,那么如何精确截取你想要的内容呢
我这里就定义一个变量了:
Nationality = ' 1994 / 美国 / 犯罪 剧情 '
- 首先使用strip去除前后空格:
Nationality = Nationality.strip()
输出:1994 / 美国 / 犯罪 剧情
- 在使用replace把中间的空格替换掉:
Nationality = Nationality.replace(' ','')
输出:1994/美国/犯罪剧情
- 最后使用split按指定字符分割:
Nationality = Nationality.split('/')
输出:'1994' '美国' '犯罪剧情'
- 想要提取里面的数据可以使用下标获取:
Nationality = Nationality.split('/')[1]
输出:美国