自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 重学pandas(一)之读取数据DataFram的简单使用

文章目录前言案例解读读取数据文本文件excel文件数据库jsonDataFrame构造根据字典根据numpy构造根据列表构造属性方法四则运算转换前言工作了一段时间,天天写sql,玩linux上的脚本;已经快忘记python怎么写了,pandas忘记的更是干净,便打算写一写博客来复习一下pandas的API。案例解读读取数据文本文件 ''' Flat file 平面文件->文...

2020-02-16 16:55:24 2531

原创 python爬取视频网站中video标签的m3u8文件与ts文件

文章目录网站分析代码参数配置下载m3u8文件下载ts文件解密合并转换为MP4网站分析许多网站使用的都是video加载的视频,无法获得视频的源地址。但是通过抓包可以获得两类文件,一类是m3u8,相当于ts文件的索引将不同的ts文件串起来;另一类是很多个ts片段,由这些片段构成我们观看的视频。上图的m3u8文件显示的ts文件是未加密的,所以下载下来的ts文件可以直接播放;下载的时候还能注意...

2020-02-06 17:18:14 5291

原创 python多线程requests下载数据的模版代码

python用requests爬取的时候,可以用多线程提高速度。这里封装了一个文件,只需修改具体的业务url就可以直接拿去使用。import requestsimport timeimport threading# 使用 threading 模块创建线程import queue#优先级队列模块#线程优先级队列(Queue)from config import *from retr...

2020-02-06 17:16:43 2230 3

原创 requests一个简单封装解决失败重试问题

python在用requests请求的时候可能会出各种各样的异常,我这个封装能抓住这些异常然后自动重试。其中超时时间应该根据业务的请求时间进行调整,连接用时久的超时时间也适当加长,否则会自动断掉重试。 @retry() # 利用retry装饰函数,使得抛出异常的时候自动重试知道成功。 def my_request(url): requests.adapters.DEFAU...

2020-02-06 16:01:09 1007

callLog项目数据生产工具

在linux当中每隔10S生成一行callLog的数据,用'java -cp calllogs-0.0.1-SNAPSHOT.jar product.AutoDataGen ./nam_num.csv ./calllog.csv'运行,其中nam_num.csv为姓名手机号映射的文件

2019-07-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除