python写一个简单爬虫程序
先看输出结果:
D:\应用集合\python>1.py
小说名称:诡秘之主
小说名称:超神机械师
小说名称:九星毒奶
小说名称:第一序列
小说名称:明天下
小说名称:烂柯棋缘
小说名称:亏成首富从游戏开始
小说名称:我师兄实在太稳健了
小说名称:轮回乐园
小说名称:当医生开了外挂
小说名称:学霸的黑科技系统
小说名称:我真没想重生啊
小说名称:手术直播间
小说名称:圣墟
小说名称:沧元图
小说名称:黎明之剑
小说名称:庆余年
小说名称:伏天氏
小说名称:斗罗大陆IV终极斗罗
小说名称:小阁老
D:\应用集合\python>
1.py
#coding=utf-8
import requests
from bs4 import BeautifulSoup
import os
import sys
reload(sys)
sys.setdefaultencoding('utf8')
def getHtmlurl(url): #获取网址
try:
r=requests.get(url)
r.raise_for_status()
r.encoding=r.apparent_encoding
return r.text
except:
return ""
def getpic(html): #获取图片地址并下载
soup =BeautifulSoup(html,'html.parser')
all_tag=soup.find('ul',class_='all-img-list cf').find_all('h4')
for tag in all_tag:
src=tag.string
src.decode('utf-8')
print ("小说名称:" + src)
def main():
url='https://www.qidian.com/all'
html=(getHtmlurl(url))
getpic(html)
main()
Python如何安装模块Beautifulsoup4的模块
未安装会报错:ImportError: No module named bs4错误
下载BS4模块:
http://www.crummy.com/software/BeautifulSoup/bs4/download/4.3/beautifulsoup4-4.3.2.tar.gz
.解压到Python安装目录下的根目录中
C:\Python27\beautifulsoup4-4.3.2
python要在全局path中C:\Python27\ArcGISx6410.4
执行python setup.py install命令来进行安装
C:\Python27\beautifulsoup4-4.3.2>python setup.py install
```bash
C:\Python27\beautifulsoup4-4.3.2>python setup.py install
running install
running build
running build_py
creating build
creating build\lib
creating build\lib\bs4
copying bs4\dammit.py -> build\lib\bs4
copying bs4\diagnose.py -> build\lib\bs4
copying bs4\element.py -> build\lib\bs4
copying bs4\testing.py -> build\lib\bs4
copying bs4\__init__.py -> build\lib\bs4
creating build\lib\bs4\builder
copying bs4\builder\_html5lib.py -> build\lib\bs4\builder
copying bs4\builder\_htmlparser.py -> build\lib\bs4\builder
copying bs4\builder\_lxml.py -> build\lib\bs4\builder
copying bs4\builder\__init__.py -> build\lib\bs4\builder
creating build\lib\bs4\tests
......
----the—end—
参拷地址:https://blog.csdn.net/Jerry_liu20080504/article/details/86703662