Python—实例
hunhun1122
每天进步一点点。
展开
-
python爬虫实例项目大全
WechatSogou [1]- 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。 DouBanSpider [2]- 豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到Excel不同的Sheet转载 2017-11-02 09:21:42 · 6000 阅读 · 1 评论 -
Python 小说内容抓取
环境 Python27 pycharm2017.2 代码如下: # encoding=utf8 import sys reload(sys) sys.setdefaultencoding('utf-8') import urllib import urllib2 from bs4 import BeautifulSoup if __name__ == '__main__':原创 2017-10-21 12:30:11 · 1258 阅读 · 0 评论 -
python 淘宝MM抓取
python 淘宝MM抓取 环境:Python27 、win7、pycharm2017.2 代码: 代码是复制的别人的,自己调了一下。。。啊哦! 1、处理页面标签 tool.py # -*- coding:utf-8 -*- import re # 处理页面标签类 class Tool: # 去除img标签,1-7位空格, removeImg = re.c原创 2017-10-21 10:43:24 · 475 阅读 · 0 评论 -
Python 豆瓣影评抓取
Python 豆瓣影评抓取 环境:win7 、Python:2.7 、pycharm:2017.2 代码如下: # encoding=utf8 import urllib2 request=urllib2.Request("https://movie.douban.com/nowplaying/hangzhou/") response=urllib2.urlopen(request)原创 2017-10-21 10:28:36 · 973 阅读 · 0 评论 -
Python 豆瓣pip使用
eg: pip install -i https://pypi.douban.com/simple pandas 可以试试这个更新一下你们设置一下默认 pip 源为豆瓣源,速度很快,方法百度或者 google 下原创 2017-10-20 14:29:49 · 1111 阅读 · 0 评论 -
Python-jieba分词
一. Selenium爬取百度百科摘要 简单给出Selenium爬取百度百科5A级景区的代码: 1 # coding=utf-8 2 """ 3 Created on 2015-12-10 @author: Eastmount 4 """ 5 6 import time 7 import re转载 2017-10-20 14:08:37 · 1821 阅读 · 0 评论