- 博客(2)
- 收藏
- 关注
原创 python+Selenium2+chrome构建动态网页爬虫工具
网页爬虫分为静态网页爬虫和动态网页爬虫,前者是指索要获取的网页内容不需要经过js运算或者人工交互,后者是指获取的内容必须要经过js运算或者人工交互。这里的js运算可能是ajax,人工交互不需要解释了。 静态爬虫现在已经很成熟了,借助于python中的urllib和beautifulsoup可以很容易实现,爬到的内容通过python的字符串处理写入数据库,甚至可以通过web
2013-06-30 11:23:49 49349 6
原创 基于nginx的hls直播系统
之前写了一篇基于nginx的hls点播系统,本质上是把一个媒体文件做成m3u8索引,对应的文件都是提前做好放在服务器上的。nginx充当的是个Http 服务器的角色,之所以说是基于nginx的,是因为它可以设置限速。本文主要是描述一个直播系统,核心在于m3u8和里面对于的ts链接都是实时的,可以刷新。类似于cntv里面的直播。这里分按顺序分几个部分讲述:软件编译,rtmp源的提供,ng
2013-06-22 20:04:31 55469 15
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人