文章的发布时间无法获取,但是检查页面源码的时候明明是有时间的,如图所示:
<em id="publish_time" class="rich_media_meta rich_media_meta_text"></em>
原来它是网页前端用js生成的时间。
如果想要获取该文章的日期,有一个思路是:
①搜狗微信搜文章,输入关键字
②查看网页源代码,找到
<script>document.write(timeConvert
③用正则表达式获取posix_time 数字
④posix_time转换成想要的日期格式
#附转换日期格式的代码demo
time_string = "<script>document.write(timeConvert('1649771917'))</script>"
import datetime as dt
tt = float(re.findall(r'\d+', time_string)[0])
_date = dt.datetime.utcfromtimestamp(tt).strftime("%Y-%m-%d")
_timestamp = dt.datetime.utcfromtimestamp(tt).strftime("%Y-%m-%d %H:%M:%S")