- 博客(3)
- 收藏
- 关注
原创 基于wxbot微信框架的微信遥控电视程序
最近买了个树莓派,打算在上面部署一点小应用。因此,想到了这个基于wxbot微信框架的遥控电视程序。程序的原理比较简单:对wxbot类进行继承,修改其中的信息处理函数,使其对自己给自己发送的消息进行处理,再根据发送的内容,调用selenium打开chrome浏览器,并播放相应的视频。程序的启动和退出均可通过微信命令遥控。然而,在开发完之后才发现树莓派上的Raspberry pi系统上装不
2016-08-28 13:55:59 4054
原创 多线程爬虫——爬取Bing画廊
http://www.bing.com/gallery/ 里搜集了Bing首页的近5年的壁纸大图,大部分是1920x1200的。右侧就是Bing的壁纸,大多数是1920x1200的大图,少部分没有大图。对这个网站的爬取有一点难度。这个页面用js语句锁死了右侧图片栏的右键菜单,所以只能通过左侧打开chrome的元素菜单,然后再取得图片缩略图的地址。图片缩略图的地址通常
2016-08-14 18:51:57 2640 1
原创 爬取msdn.itellyou.cn网站
最近一直在琢磨爬虫,从最早的BeautifulSoup爬取游民福利图,后来要爬取的动态网页多了,就逐渐过渡到了selenium+chromedriver/phantomJs的爬虫组合。偶然间听基友说有个msdn.itellyou.cn里收集了各种微软程序的ed2k安装包,因此便开始了对它的爬取之旅。这个网站的页面结构还是挺复杂的。通过观察,发现软件的名称和地址都在右侧内容项中的label>ch
2016-08-13 20:23:21 19258
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人