python爬虫论文摘要怎么写_Python爬虫:编写简单爬虫之新手入门

最近整理了一下python的基础知识,大家一般对“爬虫”这个词,一听就比较熟悉,都知道是爬一些网站上的数据,然后做一些操作整理,得到人们想要的数据,但是怎么写一个爬虫程序代码呢?相信很多人是不会的,今天写一个针对新手入门想要学习爬虫的文章,希望对想要学习的你能有所帮助~~废话不多说,进入正文!

一、准备工作

1、首先代码使用python3.x编写的,要有一个本地的python3环境。

python下载地址页面:https://www.python.org/downloads/release/python-370/

2、然后要有一个开发工具,推荐PyCharm,一款很好的Python交互IDE。Python自带编译器 -- IDLE也可以。

PyCharm下载地址页面:https://www.jetbrains.com/pycharm/download/

3、准备工作都做好就可以做开发在IDE里编写代码程序了。

二、简单爬虫代码开发

以豆瓣网为例,爬取豆瓣官网页面,看看能获取到什么东西,代码如下:

代码:

# -*- coding: utf-8 -*-

import urllib.request

# 1、网址url --豆瓣网

url = 'http://www.douban.com'

# 2、直接请求 返回结果

response = urllib.request.urlopen(url)

# 3、获取状态码,如果是200表示获取成功

print ('状态码:',response.getcode())

# 4、读取内容

data = response.read()

# 5、设置编码

data = data.decode('utf-8')

# 6、打印结果

print (data)

运行结果:

截取部分代码如下,第一行是状态码:200,表明获取成功,下面是爬取到的豆瓣页面代码,由于内容过多,故截取以下部分内容。a4b3e71005d1e7d3b0f17e4f8898af01340acdd6.png

感兴趣的小伙伴可以动手试试,欢迎(+薇 hailou1666 )交流学习~~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值