- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 重学pandas(一)之读取数据DataFram的简单使用
文章目录前言案例解读读取数据文本文件excel文件数据库jsonDataFrame构造根据字典根据numpy构造根据列表构造属性方法四则运算转换前言工作了一段时间,天天写sql,玩linux上的脚本;已经快忘记python怎么写了,pandas忘记的更是干净,便打算写一写博客来复习一下pandas的API。案例解读读取数据文本文件 ''' Flat file 平面文件->文...
2020-02-16 16:55:24 2531
原创 python爬取视频网站中video标签的m3u8文件与ts文件
文章目录网站分析代码参数配置下载m3u8文件下载ts文件解密合并转换为MP4网站分析许多网站使用的都是video加载的视频,无法获得视频的源地址。但是通过抓包可以获得两类文件,一类是m3u8,相当于ts文件的索引将不同的ts文件串起来;另一类是很多个ts片段,由这些片段构成我们观看的视频。上图的m3u8文件显示的ts文件是未加密的,所以下载下来的ts文件可以直接播放;下载的时候还能注意...
2020-02-06 17:18:14 5291
原创 python多线程requests下载数据的模版代码
python用requests爬取的时候,可以用多线程提高速度。这里封装了一个文件,只需修改具体的业务url就可以直接拿去使用。import requestsimport timeimport threading# 使用 threading 模块创建线程import queue#优先级队列模块#线程优先级队列(Queue)from config import *from retr...
2020-02-06 17:16:43 2230 3
原创 requests一个简单封装解决失败重试问题
python在用requests请求的时候可能会出各种各样的异常,我这个封装能抓住这些异常然后自动重试。其中超时时间应该根据业务的请求时间进行调整,连接用时久的超时时间也适当加长,否则会自动断掉重试。 @retry() # 利用retry装饰函数,使得抛出异常的时候自动重试知道成功。 def my_request(url): requests.adapters.DEFAU...
2020-02-06 16:01:09 1007
callLog项目数据生产工具
2019-07-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人