思考一下,以下代码还有什么更加简洁的写法?
import requests
from lxml import etree
import pandas as pd
urls = ['https://book.douban.com/subject/1084336/comments/hot?p={}'.format(str(i)) for i in range(1, 6)]
# 通过观察的url翻页规律,使用for循环得到5个链接,保存到urls列表中
comment = [] # 初始化用于保存短评的列表
for url in urls: # 使用for循环分别获取每个页面的数据
r = requests.get(url).text # 请求获取文本数据
s = etree.HTML(r) # 用于解析HTML对象
file = s.xpath('//div[@class="comment"]/p/text()')
comment = comment + file
df = pd.DataFrame(comment) # 把comment列表转换为pandas DataFrame
df.to_excel('短评数据.xlsx') # 使用pandas把数据保存到excel表格