python爬虫
uuyytg
自强不息,厚德载物。
展开
-
python模拟爬虫
老规矩,向上库(requests,号称为人类而设计,这个库的作者长的还是很帅的,有兴趣的可以去看看)import requests headers = {“user-agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari原创 2017-07-13 11:58:40 · 392 阅读 · 0 评论 -
python爬取花瓣妹子信息
因为花瓣妹子信息是动态加载的,所以如果用原始方法直接爬取网页的方法是爬不到的,这里我们用selenium来自动化处理。 import requests from bs4 import BeautifulSoup from selenium import webdriver import timeurl = ‘http://huaban.com/boards/favorite/beauty/’原创 2017-07-13 16:45:27 · 1098 阅读 · 1 评论 -
python爬取百度百科
来源于imooc教程实例,课程地址http://www.imooc.com/learn/563 以下是自己经过每一步分析,最后成功完成,代码模块化结构分明,不过自己一开始分析还是有点晕晕的,毕竟还不太习惯,以后多练习吧,每一份的收获都来之不易,但收获的喜悦总是弥足珍贵,好了,下面就开始我们的程序。 0,爬取目标1)百度百科词条标题和简介;2)链接页面的词条标题和简介;3)总共爬取1000个页面。转载 2017-07-15 14:12:19 · 1546 阅读 · 0 评论 -
python的itchat模块
今天一不小心发现的python的好玩模块itchar 首先,安装:pip install itchat 1,搜索微信好友信息import itchatitchat.auto_login(hotReload=True) #登入friends_info = itchat.get_friends(update=Ture)for i in friends_info: print(i) #原创 2017-07-18 15:37:27 · 5302 阅读 · 2 评论 -
sublime text3下搭建Python IDE--Anaconda插件(自动补全)
今天自己想在sublime text3下装个python自动补全插件,当安装一个包管理器时(Package Contral)时,ctrl+shift+p输入Install Package时,总是报错说没有这个包,在网上也找了很多解决办法,有人说时ipv6的问题,etc...咕哝了一波后,最后还是没解决(尴尬),最后参考了一下这个博客,http://www.cnblogs.com/nx520zj/p转载 2017-07-22 17:35:45 · 9338 阅读 · 1 评论 -
解决matplotlib中文显示问题(windows版)
找到python的安装目录,比如我的安装目录是E:\anaconda3\Lib\site-packages\matplotlib\mpl-data然后打开文件C:\windows\Fonts,找到中文字体文件,将文件复制到E\anaconda3\Lib\site-packages\matplotlib\mpl-data\fonts\ttf下。接着找到matplotlibrc文件,将文件中的font...原创 2018-04-27 18:26:02 · 1462 阅读 · 0 评论