- 博客(3)
- 资源 (11)
- 收藏
- 关注
原创 爬虫-知乎用户关系之关注
首先进行分类 主要分为 main (函数主入口), urlManger(URL管理), urlParse(URL解析),urlOUT(最后的输出结果格式)注意的几个坑 关注了和关注者的列表 不能简单从html标签里获取,否则永远只是每个用户往下扒的三个数据而已 从主页点击关注了,查看networks,发现get了一个非常复杂的链接,我们应该使用这个链接,并且get该链接返回的json数据
2017-11-22 16:01:40 958
原创 第一个爬虫-知乎用户关系之登录
这是第一个爬虫,所以由很多地方还需要改进,暂时先总结一下自己的小心得。登录因为想把自己的账号作为一个seed,所以session保持登录cookies,顺便练习一下验证码。 1.使用chorme F12 查看networks, 输入账户 点击登录,查看发送地址是什么,发现手机号是发送的https://www.zhihu.com/login/phone_num,email 则是 https://w
2017-11-22 15:46:42 1215
原创 python初学习+《利用python进行数据分析》 +《机器学习实践》pca
1.数据类型Numbers(数字)String(字符串)“”List(列表)[]Tuple(元组)()tup1 = () # 空元组 tup2 = (20,) # 一个元素,需要在元素后添加逗号Sets(集合){}(空)Dictionaries(字典){空}键值对2.字符串不可以被改变 但是列表可以被改变 元组元素不能被修改 3.切片是前闭后开[1:1]输出为空
2017-11-02 14:35:11 405
Java8 API.chm
2017-09-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人