Python爬虫入门 | 1 Python环境的安装

转载 2018年04月14日 00:00:00

点击上方蓝色字体,关注我们

15


这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源。看着文章,打开电脑动手实践,平均45分钟就能学完一节,如果你愿意,今天内你就可以迈入爬虫的大门啦~

话不多说,正式开始我们的第一节课《Python环境的安装》吧~

啦啦啦开课啦,看黑板,都看黑板~

1. 安装Anaconda

在我们的教学中,我们使用的版本是Python3,至于为什么要选Python3,哼哼!

工欲善其事,必先利其器,在学习爬虫之前,你得先搭建自己的编程环境。废话不多说,按照下面的方法搭建吧:

1.1 下载Anaconda

打开Anaconda网页后,看到这样的页面:

根据你的电脑系统,选择相应版本的 Anaconda(记住选择 Python 3.6 的版本),Mac OS 用户选择 Mac 版本即可,如果不想麻烦,请选择  Graphical Installer。

1.2 安装 Anaconda

选择默认位置安装即可:

两个选择框都勾上,安装:

1.3 在开始菜单中查看 Anaconda

Anaconda 装好之后,可以在开始菜单查看。可以看到包含了如下图所示的组件:

之后我们会用到的主要是:

Anaconda Prompt:Anaconda 自带的命令行

Jupyter Notebook:一个简单易用、适合入门的 IDE

2. 安装常用包

2.1 安装 Python 包 requests

打开 cmd 终端,输入 pip install requests,若安装不成功,可以尝试:conda install requests

出现 Successfully installed,即表示成功安装。若需检测,先输入 Python,再输入 import requests,未出现报错,表示安装成功,可以正常使用。注:操作完记得退出:quit()。

如果安装时显示 conda 不是内部或外部命令,用下面的方式安装(如未报错则不必用下面的方法)

  • 在开始菜单打开 Anaconda Prompt:

  • 在 Anaconda Prompt 输入 conda install requests:

2.2 安装 Python 包 lxml

同样在终端输入: conda install lxml,出现 Successfully installed,即表示成功安装,若不能成功安装,请尝试如下方法。

  • 前往 http://www.lfd.uci.edu/~gohlke/pythonlibs/,手动下载需要安装的第三方包(注意对应你的python版本是32位还是64位)。

  • 在下载下来的文件所在目录按住shift并点击鼠标右键,选择在此处打开Powershell窗口,在此命令行中使用 pip install + 下载下来文件全名 ,即可完成安装。

所以你该知道如何安装 Python 包了吧,通用方法是,在终端输入:conda install + 包名称   或者   pip install + 包名称。出现特殊的不能安装的情况,可以去下载之后进行安装。

3. Jupyter Notebook

3.1 开启Jupyter Notebook

在开始菜单打开 Jupyter Notebook:

Jupyter 将会在网页中自动打开:

3.2 Jupyter Notebook 界面

Files:你当前工作环境下的所有项目(代码)、默认存储的文件都在这里:


Runing:你目前正在运行的项目都在这里:

3.3 新建一个文档,开始写代码

依次点击右上方 :New > Python 3,即新建了一个 Ipython 文件,如图:

点击上方 Utitled 可以更改文档的名称,下面的空间就可以写代码啦:

3.4 Jupyter Notebook 功能简介

4. 创建第一个实例:爬取百度首页

仅用四行代码,我们就可以把百度首页的内容下载下来:

1.导入 requests 库;2.下载百度首页内容;3.更改编码;4.打印内容

具体爬虫原理及代码的内涵,在下一节的案例中详细讲解~


好了,这节课就到这里



Python爬虫一(入门综述、基础)

转载:静觅 » Python爬虫入门一之综述 首先爬虫是什么? 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维...
  • freeking101
  • freeking101
  • 2017-03-01 21:27:37
  • 752

安装Python及爬虫入门介绍

【Python数据挖掘课程】一.安装Python及爬虫入门介绍 标签: python数据挖掘网络爬虫环境配置 2016-09-19 12:12 1568人阅读 评论(4) 收藏 举报 ...
  • believe646875970
  • believe646875970
  • 2016-12-01 15:52:19
  • 2851

Ubuntu下python网络爬虫及机器学习环境安装

最近在学习分布式爬虫和机器学习,其中用到数据库,神经网络等知识,在windows环境下经历了一段挣扎的环境搭建,和python2的各种乱码,最后果断弃暗投明,在windows10的电脑上装上Ubunt...
  • rui_x_knight
  • rui_x_knight
  • 2017-04-16 16:53:29
  • 848

Python爬虫:入门+进阶大纲

第一章:Python 爬虫入门1、什么是爬虫 网址构成和翻页机制 网页源码结构及网页请求过程 爬虫的应用及基本原理 2、初识Python爬虫 Python爬虫环境搭建 创建第一个爬虫:爬取百度首页 爬...
  • shuiyuejihua
  • shuiyuejihua
  • 2017-12-26 18:17:21
  • 969

python爬虫环境准备-安装anaconda

在windows环境下,比较头疼的就是包管理和Python不同版本的问题,为了解决这些问题,有不少发行版的Python,比如WinPython、Anaconda等,这些发行版将python和许多常用的...
  • qq_29186489
  • qq_29186489
  • 2017-11-15 17:48:11
  • 123157

Python 基础爬虫简介(测试环境为 Python 2.7)

1、什么是爬虫?爬虫是一种自动访问互联网,并提取数据的一个程序。归根结底,所谓爬虫,不过是我们用Python语言编写的一个小程序而已。 针对的问题:有些网页需要我们登陆后才能访问,而有些网页则不需要。...
  • skylake_
  • skylake_
  • 2017-02-11 21:56:12
  • 836

Python爬虫(入门+进阶)学习笔记 1-1 什么是爬虫?

爬虫的定义:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。网页的两种加载方法同步加载:改变网址上的某些...
  • kissazhu
  • kissazhu
  • 2018-03-27 16:33:42
  • 456

Python爬虫(一):环境配置

Python爬虫(一):环境配置由于项目需要,最近开始学习和使用Python写web爬虫。要理解网络爬虫最好的例子就是使用最多的搜索引擎,网络爬虫是搜索引擎最重要的一部分。搜索引擎根据用户的输入关键字...
  • laishaofa
  • laishaofa
  • 2016-02-29 11:13:09
  • 3209

python写网络爬虫的环境搭建(windows完整版)

网上找了好多资料,都不全,通过资料的整理,包括自己的测试,终于把环境打好了,真是对于一个刚接触爬虫的人来说实属不易,现在分享给大家,若有不够详细之处,希望各位网友能补充。 第一步,下载python, ...
  • u011139117
  • u011139117
  • 2016-10-11 15:55:02
  • 4766

python pip下安装Requests;实现单线程爬虫

1、打开python安装路径; 2、电脑cmd下,进入python安装路径下的Scripts文件下;(前题安装好pip,一般自动安装) 3、运行 pip install requests 完成re...
  • July_whj
  • July_whj
  • 2017-03-13 15:44:52
  • 380
收藏助手
不良信息举报
您举报文章:Python爬虫入门 | 1 Python环境的安装
举报原因:
原因补充:

(最多只允许输入30个字)