- 博客(5)
- 资源 (9)
- 收藏
- 关注
原创 爬取微信好友信息
在写程序之前,需要安装Pillow、itchat、pandas三个模块。此三个模块可以直接使用pip进行安装,将生成信息写进csv文件中,或将信息生成字典(有代码),或将每条信息写进自己的数据库都皆可用于分析好友男女比例与获取好友备注、昵称、所在城市以及个性签名等信息。import itchatfrom pandas import DataFrameitchat.login()frie...
2018-05-24 13:51:43 1794 2
原创 利用Scrapy框架爬取博客园精选区前n页的博客题目、点赞数、链接
将数据写入数据库或生成*.xml文件 代码#Scrapy框架模板# import pymongoimport scrapy# client = pymongo.MongoClient()# mydb = client['mydb']# cnblogs = mydb['cnblogs']class CnBlogSpider(scrapy.Spider): name = ...
2018-05-12 22:21:34 425
原创 Python学习之Ajax技术,爬取Pexels图片存放至本地
1、什么是Ajax技术 Ajax 即“Asynchronous Javascript And XML”(异步 JavaScript 和 XML),是指一种创建交互式网页应用的网页开发技术.通俗理解就是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。(百度解释) 我们也可以通过网站查看,网页链接为https://www.pexels.com/ 我们在想继续查看
2018-05-09 00:43:18 810
原创 使用单/双/四进程爬虫爬取嗅事百科
1.本例子为一个单/双/四进程爬虫耗时对比 2.顺带练习了爬取嗅事百科生成字典写入文件中的方法 3.练习正则表达式的使用
2018-05-05 00:58:05 258
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人