python里面beautifulsoup4_python学习笔记——提取网页信息BeautifulSoup4

1 BeautifulSoup概述

beautifulSoup是勇python语言编写的一个HTML/XML的解析器,它可以很好地处理不规范标记并将其生成剖析树(parse tree);

它提供简单而又常见的导航(navigating),搜索及修改剖析树,此可以大大节省编程时间

2 BeautifulSoup安装

2.1 安装

pip install beautifuilsoup4

当安装不成功时,首先查看windows的命令提示符是否是以管理员身份打开的。

然后再检查其他因素

2.2 使用

from bs4 import BeautifulSoup

这是由于“造”库函数所致,其他引用方法易致错。

没有安装成功!当时显示安装包已经在文件夹中

C:\Windows\system32>pip install beautifulsoup4

Requirement already satisfied: beautifulsoup4in c:\users\admin\appdata\local\programs\python\python36-32\lib\site-packages (4.6.0)

C:\Windows\system32>python

Python3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 16:07:46) [MSC v.1900 32bit (Intel)] on win32

Type"help", "copyright", "credits" or "license" formore information.>>> import bs4 importBeautifulSoup

File"", line 1

import bs4 importBeautifulSoup^SyntaxError: invalid syntax>>> importBeautifulSoup

Traceback (most recent call last):

File"", line 1, in ModuleNotFoundError: No module named‘BeautifulSoup‘

>>>

3 beautifulsoup与lxml比较

lxml    C实现,只会局部遍历,快;        复杂,语法不太友好;

BS4     Python实现,会加载整个文档,慢; 简单,API人性化;

详细信息可以参考beautifulsoup文档:Beautiful Soup 4.2.0 文档

原文:https://www.cnblogs.com/gengyi/p/9074396.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值