python初级：爬虫准备、anaconda安装与Jupyter使用

最新推荐文章于 2024-01-25 09:07:17 发布

带只拖鞋去流浪

最新推荐文章于 2024-01-25 09:07:17 发布

阅读量1.1k

点赞数 1

分类专栏： Python基础文章标签： anaconda python 人工智能

本文链接：https://blog.csdn.net/weixin_43148062/article/details/104561461

版权

Python基础专栏收录该内容

23 篇文章 1 订阅

订阅专栏

爬虫准备

编写爬虫离不开requests和BeautifulSoup4
在这里插入图片描述

anaconda安装

下载地址：跳转官网首页，点Download按钮就可以下载
在这里插入图片描述

打开jupyter，点new，然后选择python3；你以为到这就结束了吗？

会发现创建失败，原因：没有配置环境！

环境配置完成，创建成功，然后就可以开始编程了。

相关方法

在jupyter中演示如下：

from bs4 import BeautifulSoup
html_sample='\
<html> \
    <body> \
    <h1 id="title">hello world</h1> \
    <a href="#" class="link">This is link1</a> \
    <a href="# link2" class="link">This is link2</a> \
    </body> \
</html>'
soup = BeautifulSoup(html_sample)

在这里插入图片描述

print(soup.text)

print(soup.contents)

print(soup.select('html')[0])

# 标签选取
print(soup.select('h1'))
print(soup.select('h1')[0])
#第一个获取到的是列表，第二个获取到的是字符串

#id选取
print(soup.select('#title'))
print(soup.select('#title')[0])

# 类选取
print(soup.select('.link'))
print(soup.select('.link')[0])
print(soup.select('.link')[1])

实践是一切真理的唯一标准

以小米官网首页，试一试：
在这里插入图片描述
netword清空刷新页面，点开了index.html，可以看到requests method是get，所以复制url，打开jupyter进行以下操作：

import requests
res = requests.get("https://www.mi.com/index.html")
print(res.text)

在这里插入图片描述

带只拖鞋去流浪

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
python初级：爬虫准备、anaconda安装与Jupyter使用

爬虫准备编写爬虫离不开requests和BeautifulSoup4anaconda安装下载地址：跳转官网首页，点Download按钮就可以下载打开jupyter，点new，然后选择python3；你以为到这就结束了吗？会发现创建失败，原因：没有配置环境！环境配置完成，创建成功，然后就可以开始编程了。...
复制链接

扫一扫