日常抓取数据经常需要用的数据格式化方式,
之后给大家更新一个scrapy完整爬虫项目。。。。。。
## 优化代码4
# 抓取的发布时间
ori_date = selector.xpath('//div[@class="short_r"]/text()')
list_date = "".join([str(x) for x in ori_date])
# 日期格式化核心代码
list_time = time.mktime(time.strptime(list_date, "%Y-%m-%d"))
crawl_time = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(list_time))
# 将str中的汉字换掉
time = time.replace(r'年','-').replace(r'月','-').replace(r'日','')
30、Python日常抓取数据的高效代码
最新推荐文章于 2024-05-21 09:48:56 发布