Python爬虫学习(一)----简单的爬虫实践

爬虫

爬虫通俗的理解就是抓取你在网页上看到的信息。俗称爬爬爬嘛。所有网站皆可爬,第一次我们先做一下简单的爬虫尝试,让你初步对爬虫的原理或源代码有所熟悉。

平台和需求

我采用的平台是
MacOS
Pycharm 2016
python3.6

另外需要你对Python的基础语法有所了解,另外懂html的标签和css选择器。

基础爬虫代码实践

#!/usr/local/bin/python3
# -*- coding: UTF-8 -*-
__author__ = 'Gary'

# Python 简单爬虫(Python 3.6 MacOS)

import urllib.request

# 网址
url = "http://www.baidu.com"

# 请求
request = urllib.request.Request(url)

# 爬取结果
response = urllib.request.urlopen(request)

data = response.read()

#设置编码方式fp.write(str(response.geturl()))
data = data.decode('utf-8')

#打印结果
print(data)

#打印爬取网页的各类信息
# print(type(response))
# print(response.geturl())
# print(response.info())
# print(response.getcode())


fp = open('./baidu.txt','w')
fp.write(str(type(response)))
fp.close()
print('已经保存在本地')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值