python 爬虫获取网络上的信息

最新推荐文章于 2024-01-23 11:32:57 发布

_ZHANGJUNPING

最新推荐文章于 2024-01-23 11:32:57 发布

阅读量299

点赞数 2

分类专栏： Python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_36355271/article/details/85276734

版权

Python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本人开发环境： python 3.7.1 和pyChar

准备首先安装requests： pip install requests

安装lxml ：pip install lxml

安装 BeautifulSoup ：pip install BeautifulSoup4

安装成功后编写如下代码：

（如果对 pip 不熟悉可以看下这个文章了解模仿使用 https://blog.csdn.net/qq_36355271/article/details/85260645）

import requests
import timeimport random
from bs4 import  BeautifulSoup


context=requests.get('https://movie.douban.com/top250?start=0&filter=')
# print(context.text)

baetu=BeautifulSoup(context.text,'lxml')
# lis=list[]
lis=baetu.select('.grid_view li')
for li in lis:
    time.sleep(random.random()+1)
    span_list=li.select('.star span')
    print("-"*50)
    com_num=span_list[3].text.replace('人评价','')
    print(int(com_num))

此处获取的豆瓣top250 电影评论人数：

（爬虫的本质是解析网络语言 html ，从中提取有用信息）

如果对web开发有一定了解上面代码非常简单，否则简易先去简单了解下 web端页面的html

上面同样的道理可以获取很多你需要的其他信息。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

_ZHANGJUNPING

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
python 爬虫获取网络上的信息

本人开发环境： python 3.7.1 和pyChar 准备首先安装requests： pip install requests 安装lxml ：pip install lxml 安装 BeautifulSoup ：pip install BeautifulSoup4 ...
复制链接

扫一扫