- 博客(8)
- 收藏
- 关注
原创 公众号rss
公众号在手机上查看非常不方便,历史文章多的公众号查找更是头疼,基于这点整合了一个pc端查看公众号历史文章的站点,可以生成公众号rss地址,在订阅器内查看关注的公众号最新文章推送,相比市面上的其它公众号rss服务,或者历史文章集成站点,该站收录的公众号比较齐全,对于没有收录的公众号,直接进行提交基本在5分钟内直接自动收录,非常的方便,能够在pc上查看公众号的全部历史文章,翻页及其方便1.首页2.搜索收录的账号比较多,而且明确了更新时间,更新也比较及时,文章数也有展示3.公众号文章列表,
2022-03-18 17:24:13 3188
原创 浏览器上查看微信公众号的所有历史文章
微信公众号的历史文章一直不是特别好抓取,之前写了一篇文章是关于公众号文章的抓取的公众号文章的爬虫,现在已经过去一年多了,之前的方式还可以使用,但是效率不行,跟账号绑定的,容易封账号,要满足现在11万左右的公众号及时更新的需求根本不可能,于是更新了方案公众号历史文章https://www.vreadtech.com/, 1.首页(未登录状态)标题2.搜索公众号(绝大多数公众号...
2019-01-14 16:29:28 17222 2
转载 手把手|100行Python代码自动抢火车票!(包教包会)
http://www.gzhshoulu.wang/article/1418146Python爱好者社区又到一年一度春运大会,2017年春运抢火车票还是那么难,各大互联网公司都推出抢票服务,只要加钱给服务费就可以增加抢到票的几率,有些代售火车票点,说给100元服务费,可以帮抢到,看来这水很深啊!下面我们利用自己学的技术来自动抢票,本次脚本基于Python3.6+sp
2018-01-16 10:34:29 7309 3
原创 python监测mysql,并自动重启
最近一朋友的mysql偶尔宕机,便用python写了个小监测程序 linux中自带python,以及subprocess模块,原理就是分析服务器上service mysql status的返回值进行状态分析# -*- coding: utf-8 -*- import commandsimport osimport timeimport subprocessn=1flag=0while
2017-06-15 15:36:01 922
原创 python2中的编码
抓取网站中有些unicode编码 u’\n \u201c\u515c\u5e95\u5f0f\u589e\u6301\u201d\u662f\u5927\u80a1\u4e1c\u201c\u9633\u8c0b\u201d\uff1f\n ‘这样的文字直接取出就可以显示正确的文字,不会出现乱码但是有时出现 u’\xe9\x94\x8c\xe7\x8e\xb0\xe8\x
2017-06-09 10:59:22 696
原创 公众号文章的爬虫
微信在4月的时候更新了一版,以前的公众号爬虫没有 那么好用了,现在微信开始针对个人账号了,频繁的访问会导致账号被封,查看公众号历史的时候会出现“页面无法打开”的提示,但是大概两天之后又可以查看了,所以现在的做法就是控制访问频率+多微信账号进行采集以前制作的公众号采集站好久没打理了,整理下代码吧.获取文章链接:Get_list.py# -*- coding: UTF-8 -*-import rei
2017-06-08 10:59:19 3383
原创 python 时间戳转标准时间
#coding:UTF-8import timetimestamp = '1462451389'#转换成localtimetime_local = time.localtime(int(timestamp))#转换成新的时间格式(2016-05-05 20:28:54)dt = time.strftime("%Y-%m-%d %H:%M:%S",time_local)print dt注意ti
2017-06-07 11:35:17 559
原创 Flask中图片的刷新
最近需要爬虫去抓取公众号的文章,需要获取公众号的唯一id,从某个网站抓取了一些,只是很少的一部分,最后还是得从搜狗去抓这个id,而公众号的文章通过客户端抓包去抓取,去抓搜狗会出现验证码,用flask搭建了一个服务,专门去做验证码的处理,由于缓存的问题,图片覆盖了,但是前端页面刷新还是以前的旧图。 index.html<body> <div class="main"> <img id='imgs
2017-06-06 11:06:04 2883 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人