2020年02月_喜欢coding的谢同学

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创重学pandas(一)之读取数据DataFram的简单使用

文章目录前言案例解读读取数据文本文件excel文件数据库jsonDataFrame构造根据字典根据numpy构造根据列表构造属性方法四则运算转换前言工作了一段时间，天天写sql，玩linux上的脚本；已经快忘记python怎么写了，pandas忘记的更是干净，便打算写一写博客来复习一下pandas的API。案例解读读取数据文本文件 ''' Flat file 平面文件->文...

2020-02-16 16:55:24 2531

原创 python爬取视频网站中video标签的m3u8文件与ts文件

文章目录网站分析代码参数配置下载m3u8文件下载ts文件解密合并转换为MP4网站分析许多网站使用的都是video加载的视频，无法获得视频的源地址。但是通过抓包可以获得两类文件，一类是m3u8，相当于ts文件的索引将不同的ts文件串起来；另一类是很多个ts片段，由这些片段构成我们观看的视频。上图的m3u8文件显示的ts文件是未加密的，所以下载下来的ts文件可以直接播放；下载的时候还能注意...

2020-02-06 17:18:14 5291

原创 python多线程requests下载数据的模版代码

python用requests爬取的时候，可以用多线程提高速度。这里封装了一个文件，只需修改具体的业务url就可以直接拿去使用。import requestsimport timeimport threading# 使用 threading 模块创建线程import queue#优先级队列模块#线程优先级队列(Queue)from config import *from retr...

2020-02-06 17:16:43 2230 3

原创 requests一个简单封装解决失败重试问题

python在用requests请求的时候可能会出各种各样的异常，我这个封装能抓住这些异常然后自动重试。其中超时时间应该根据业务的请求时间进行调整，连接用时久的超时时间也适当加长，否则会自动断掉重试。 @retry() # 利用retry装饰函数，使得抛出异常的时候自动重试知道成功。 def my_request(url): requests.adapters.DEFAU...

2020-02-06 16:01:09 1007

callLog项目数据生产工具

在linux当中每隔10S生成一行callLog的数据,用'java -cp calllogs-0.0.1-SNAPSHOT.jar product.AutoDataGen ./nam_num.csv ./calllog.csv'运行，其中nam_num.csv为姓名手机号映射的文件

2019-07-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人