记一次贴吧签到脚本的编写

  第一次发文,排版什么的完全不懂呀~~

  暑假在家很是无聊,于是就写了这么个小脚本练练手,坑爹勿喷 。。。。。。

  因为手动签到所有的贴吧是一件很麻烦的事,所以准备写这个脚本,我是基于cookie编写的,也就是说没有考虑到登录获取cookie的过程,cookie是直接在浏览器取的。

  首先是贴吧签到抓包的过程,我用的大chrome神器(ps:chrome F12之后的network,大家都懂得),分分钟发现了这么个玩意儿

,向http://tieba.baidu.com/sign/add通过post请求发送的包,再看它发送的包,一群header头无需赘述(cookie也在里面),而发送的实体却是类似于ie=utf-8&kw=%E8%A1%8C%E4%B9%A6&tbs=b6c2f3c4a2cdbcb51407919376形式的这么个东西,kw后面的值当然是贴吧名的编码,tbs却是个什么玩意儿?搜了一下资料,原来在贴吧每次进行的类似于发帖,回帖,签到之类的动作都需要一个tbs值,它是随机生成的,每次访问都不一样,而它的获取方式大致有两种:

1.获取相对的贴吧网页源码,用正则表达式取出来:

首先通过get请求得到网页源码,然后我是直接通过chrome的search功能直接寻找“tbs”这个值,最后找到了这个

然后大家都懂得,直接正则取出来就行了.

2.直接发送get请求http://tieba.baidu.com/dc/common/tbs网页,响应得到json数据就ok了.

既然签到时发送的包的问题解决了,然后就是整个脚本的构成了。

这里我先通过get请求http://tieba.baidu.com/f/like/mylike这个页面得到包含所有贴吧链接的源码,很简单的通过审查元素可以看到:类似于<a href="/f?kw=%C8%D5%D3%EF%D1%A7%CF%B0" title="日语学习">日语学习</a>则为一个关注贴吧,通过正则表达式把所有的链接取出来

preg_match_all("/<a href=\"\/f\?kw=(.*?)\" /", $result, $matches,PREG_PATTERN_ORDER)

接下来的事就简单了,通过一个循环挨个向http://tieba.baidu.com/sign/add发送post请求就行了。

得到的response响应是一个json数据,其中no:1010是返回码,error:解释了错误原因。

csdn自带的文章编辑界面完全不会用,好蛋疼啊%>_<%

下面是我上传的脚本:

http://download.csdn.net/detail/programming_hao/7750385

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值