python抓取网页内容到excel,python如何抓取网页数据

Rtee1

于 2024-03-02 20:41:33 发布

阅读量324

点赞数 4

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Rtee1/article/details/136422021

版权

大家好，给大家分享一下python 爬虫抓取网页数据导出excel，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！

自学Python的时候,在网上看见一篇比较简单的爬虫小项目,于是自己便也想跟着别人的代码来学一下.

看着这位博主的代码敲的以下代码,基本上都一致.

第一部分:根据URL进行数据的爬取

# -*-coding:utf-8-*-

import urllib2

import sys

from bs4 import BeautifulSoup

# 写入Excel表需要使用的库

from openpyxl import Workbook

reload(sys)

sys.setdefaultencoding('utf-8') # 设置系统默认编码

print sys.version # 打印当前版本信息

sys.setdefaultencoding('utf-8')

# 为了方便翻页将网址代码分成两部分

urlstart = 'http://my.yingjiesheng.com/index.php/personal/xjhinfo.htm/?page='

urlend = '&cid=&city=21&word=&province=0&schoolid=&sdate=&hyid=0'

setSQLData = []

# 爬取数据总页数64,为了练习,就取20页

for i in range(1, 11):

url = urlstart + str(i) + urlend

print '正在打印:' + url;

request = urllib2.urlopen(url)

html = request.read()

bs = Bea

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。