datawhale数据分析task1(2)使用pandas读取数据并统计论文数据
1、python datetime处理时间
1.1获取指定的时间和日期。
datetime(%Y,%m,%d,%H,%M,%S)
datetime共有6个参数,分别代表的是年月日时分秒。其中年月日是必须要传入的参数,时分秒可以不传入,默认全为零。
datatime(2017,9,24)
Out:datatime.datatime(2017,9,24,0,0)
1.2将Str和Unicode转化为datetime。
datetime(str,format)
很多情况下,原始数据中的时间和日期并不是时间类型的,如excel中可能是Unicode,csv中可能是Str。因此我们在进行时间切片之前首先要将非时间类型的时间数据转换为时间类型。
2、爬虫需要的HTML基础
html详细描述
最基本的标签说明
标签基本格式:<标签名 属性名1="属性值" 属性名2="属性值" ...>文档内容</标签名>
<! DOCTYPE html>: 用于代码开头指定html版本等信息;
<