mystery_Dg-CSDN博客

原创公众号rss

公众号在手机上查看非常不方便，历史文章多的公众号查找更是头疼，基于这点整合了一个pc端查看公众号历史文章的站点，可以生成公众号rss地址，在订阅器内查看关注的公众号最新文章推送，相比市面上的其它公众号rss服务，或者历史文章集成站点，该站收录的公众号比较齐全，对于没有收录的公众号，直接进行提交基本在5分钟内直接自动收录，非常的方便，能够在pc上查看公众号的全部历史文章，翻页及其方便1.首页2.搜索收录的账号比较多，而且明确了更新时间，更新也比较及时，文章数也有展示3.公众号文章列表，

2022-03-18 17:24:13 3188

原创浏览器上查看微信公众号的所有历史文章

微信公众号的历史文章一直不是特别好抓取，之前写了一篇文章是关于公众号文章的抓取的公众号文章的爬虫，现在已经过去一年多了，之前的方式还可以使用，但是效率不行，跟账号绑定的，容易封账号，要满足现在11万左右的公众号及时更新的需求根本不可能，于是更新了方案公众号历史文章https://www.vreadtech.com/， 1.首页（未登录状态）标题2.搜索公众号（绝大多数公众号...

2019-01-14 16:29:28 17222 2

转载手把手｜100行Python代码自动抢火车票！（包教包会）

http://www.gzhshoulu.wang/article/1418146Python爱好者社区又到一年一度春运大会，2017年春运抢火车票还是那么难，各大互联网公司都推出抢票服务，只要加钱给服务费就可以增加抢到票的几率，有些代售火车票点，说给100元服务费，可以帮抢到，看来这水很深啊！下面我们利用自己学的技术来自动抢票，本次脚本基于Python３.６+sp

2018-01-16 10:34:29 7309 3

原创 python监测mysql，并自动重启

最近一朋友的mysql偶尔宕机，便用python写了个小监测程序 linux中自带python，以及subprocess模块，原理就是分析服务器上service mysql status的返回值进行状态分析# -*- coding: utf-8 -*- import commandsimport osimport timeimport subprocessn=1flag=0while

2017-06-15 15:36:01 922

原创 python2中的编码

抓取网站中有些unicode编码 u’\n \u201c\u515c\u5e95\u5f0f\u589e\u6301\u201d\u662f\u5927\u80a1\u4e1c\u201c\u9633\u8c0b\u201d\uff1f\n ‘这样的文字直接取出就可以显示正确的文字，不会出现乱码但是有时出现 u’\xe9\x94\x8c\xe7\x8e\xb0\xe8\x

2017-06-09 10:59:22 696

原创公众号文章的爬虫

微信在4月的时候更新了一版，以前的公众号爬虫没有那么好用了，现在微信开始针对个人账号了，频繁的访问会导致账号被封，查看公众号历史的时候会出现“页面无法打开”的提示，但是大概两天之后又可以查看了，所以现在的做法就是控制访问频率+多微信账号进行采集以前制作的公众号采集站好久没打理了，整理下代码吧.获取文章链接：Get_list.py# -*- coding: UTF-8 -*-import rei

2017-06-08 10:59:19 3383

原创 python 时间戳转标准时间

#coding:UTF-8import timetimestamp = '1462451389'#转换成localtimetime_local = time.localtime(int(timestamp))#转换成新的时间格式(2016-05-05 20:28:54)dt = time.strftime("%Y-%m-%d %H:%M:%S",time_local)print dt注意ti

2017-06-07 11:35:17 559

原创 Flask中图片的刷新

最近需要爬虫去抓取公众号的文章，需要获取公众号的唯一id，从某个网站抓取了一些，只是很少的一部分，最后还是得从搜狗去抓这个id，而公众号的文章通过客户端抓包去抓取，去抓搜狗会出现验证码，用flask搭建了一个服务，专门去做验证码的处理，由于缓存的问题，图片覆盖了，但是前端页面刷新还是以前的旧图。 index.html<body> <div class="main"> <img id='imgs

2017-06-06 11:06:04 2883 1

qq_23279427的博客