从零到入职-番外篇-Python-网络爬虫1

环境问题

Python的第三方的库比较多,我们必须安装到Python环境中才能使用。
所以我们的解决办法是
为不同的项目配置不一样的环境
例如我们的爬虫可以配置一个单独的环境。

所以我们就用到了之前我们说过的一个Python的环境管理工具
Anaconda3
我们利用它创建一个完全单独的Python环境
在这里插入图片描述
在这里插入图片描述
叫啥,我们是写网络爬虫,我这里就命名spider
然后
选择版本,我这里选择的是3.8版本,然后等他自己从服务器把Python环境下载完成即可。
如果报错,从新来一次就好。

如果可视化界面打不开咋办,
cmd命令就可以
在这里插入图片描述
mypython 就是创建的名字, python=3.6选用的版本在这里插入图片描述
下载中会有问你这个,y就好了,就是yes的意思。
在这里插入图片描述
查看是否下载完成。
在这里插入图片描述

然后我们用我们新创建的环境的时候在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这样就可以使用了。
然后我们要用到一个内置库在这里插入图片描述
在这里。
我们需要引入
在这里插入图片描述
然后我们的urlopen打开网页内置函数不可用
我们需要在这里面去找到他在这里插入图片描述
ctrl+F搜索,输入urlopen
在这里插入图片描述
一直点回车,直到找到它
在这里插入图片描述
引入再精确一点,引入文件。
但是还不饿能用,我们要用全路径名
在这里插入图片描述
完整代码放出来,可以自己试验一下
下面展示一些 内联代码片

// A code block
var foo = 'bar';
import urllib.request

# 通过url获取它的HTML源码

url = 'https://www.csdn.net/'
# 打开指定的url,返回指定内容
response = urllib.request.urlopen(url)
# 打印获取到的HTML,二进制表示
# print(response.read())
# 字符转换
print(response.read().decode('utf-8'))
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值