python写一个简单的爬虫样例_第一个python爬虫示例：用pycharm在phthon环境下做的一个简单爬虫...

最新推荐文章于 2023-11-21 14:45:00 发布

孙泊川

最新推荐文章于 2023-11-21 14:45:00 发布

阅读量430

点赞数

文章标签： python写一个简单的爬虫样例

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36357157/article/details/113970464

版权

用pycharm在phthon环境下做的一个简单爬虫

Python版本： Python3.7

运行平台： Windows

IED: pyCharm 2020.3

import requests

from lxml import etree

from bs4 import BeautifulSoup

import re

import urllib.request

def getArtical():

url = 'http://www.cntour.cn/'

# 用 GET 方式获取数据; 将获取到的数据存到 strhtml 变量中

strhtml = requests.get(url)

# strhtml.text 表示网页源码

print(strhtml.text)

soup = BeautifulSoup(strhtml.text, 'lxml')

# data = soup.select('#main > div > div.mtop.firstMod.clearfix > div.centerBox > ul.newsList > li > a')

# 获取所有a标签

data = soup.find_all('a')

print(data)

with open('./中国旅游网.txt', 'w', encoding='utf-8') as f:

# 遍历获取的所有a标签

for item in data:

# 提取标签的正文用 get_text() 方法

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python写一个简单的爬虫样例_第一个python爬虫示例：用pycharm在phthon环境下做的一个简单爬虫...

用pycharm在phthon环境下做的一个简单爬虫Python版本： Python3.7运行平台： WindowsIED: pyCharm 2020.3import requestsfrom lxml import etreefrom bs4 import BeautifulSoupimport reimport urllib.requestdef getArtical():url = 'htt...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。