技术撩妹 | 我是如何用Python搞定女神的联系方式的？

chiyi0787

于 2018-05-16 13:10:00 发布

阅读量101

点赞数

文章标签：爬虫 python 人工智能

原文链接：https://my.oschina.net/u/3770883/blog/1813444

版权

访问flyai.club，一键创建你的人工智能项目

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1

作者 | IFTC

源自 | https://www.jianshu.com/p/bdcd11afcc2b

前言

这个没什么技术难度，懂爬虫的人和程序员都可以用学的语言写出来。

只是很多安全问题的存在，的确影响着我们的生活。

希望大家可以认识到一些网站的后台密码的规则与自己的安全性。

简单的说，就是是程序员的懒，让用户的信息暴露在互联网上。

还有一点：

就是希望正在接触python，和快要放弃学习的同学，可以试试换种思路，

来试试爬虫，这样有成就感的累积，可以慢慢提升你的自信。

爬虫开始前的准备：

python2.7
库文件（xlwt，urllib2，BeautifulSoup4，xlrd）

安装库文件的方法：

最好在你的python2.7/script/下面打开power shell(可以shift+右击) 执行下面的：

安装库文件

pip install *** ***是指上面的库文件，下面不一定都用，只要上面的，以后出什么错，你就继续pip install

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1

观察网站结构（密码规则）

首先这个规则是针对大二和已经毕业了的

密码规则没有添加验证码（其实添加验证码也没什么用，只是添加了爬取门槛）

规则是用户名==密码

符合条件

这里的用户信息

不要在意这些细节（马赛克）朦胧美一直是我的追求

具体思路：模拟登陆 ==》制作学号规则==》信息查询（爬取）==》存入xls模拟登陆：因为我们是用爬虫取信息，每次访问，肯定是登陆了以后才可以访问我们的信息 ==》模拟登陆

当我们用脚本访问下一个页面，需要一个cookie信息，就好比，当你打开qq空间，其实是想腾讯那里提交了自己的信息，而我们的信息就存在cookie中

python 中cookie维持会话访问：

模拟登陆

具体网址不分享，避免带来不必要的麻烦

学号的列表

用户信息的获取

这里用的的是beautifulsoup库

写入xls(这个是思路)测试用的函数

因为在写的时候因为编码问题，不能写入中文

开始行动

添加上延迟访问： time.sleep(1)

因为爬虫访问的不和人一样，访问会很快，这样可以避免被封ip，还有避免给站点带来不好的影响。

程序执行结束：

部分截图：有图有真相，避免无知的喷子

学号规则很好找的，这样就获取半个学校的call和qq啦，至于能干嘛，自己脑补。。。

640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1

— End —

转载于:https://my.oschina.net/u/3770883/blog/1813444

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
技术撩妹 | 我是如何用Python搞定女神的联系方式的？

访问flyai.club，一键创建你的人工智能项目作者 | IFTC 源自 | https://www.jianshu.com/p/bdcd11afcc2b 前言这个没什么技术难度，懂爬虫的人和程序员都可以用学的语言写出来。只是...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。