使用pandas读取数据并统计论文数据(2)2021-01-17

这篇博客是datawhale数据分析task1的第二部分,主要讲解如何使用Python的datetime库处理时间,包括获取指定时间日期和将字符串转为datetime类型。此外,还介绍了爬虫所需的HTML基础知识和正则表达式的应用。
摘要由CSDN通过智能技术生成

datawhale数据分析task1(2)使用pandas读取数据并统计论文数据

github

1、python datetime处理时间

CSDN博客详细介绍

1.1获取指定的时间和日期。

datetime(%Y,%m,%d,%H,%M,%S)

datetime共有6个参数,分别代表的是年月日时分秒。其中年月日是必须要传入的参数,时分秒可以不传入,默认全为零。
datatime(2017,9,24)
Out:datatime.datatime(2017,9,24,0,0)

1.2将Str和Unicode转化为datetime。

datetime(str,format)

很多情况下,原始数据中的时间和日期并不是时间类型的,如excel中可能是Unicode,csv中可能是Str。因此我们在进行时间切片之前首先要将非时间类型的时间数据转换为时间类型。

2、爬虫需要的HTML基础

html详细描述
最基本的标签说明


标签基本格式:<标签名 属性名1="属性值" 属性名2="属性值" ...>文档内容</标签名>
<! DOCTYPE html>: 用于代码开头指定html版本等信息;
<
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值