利用lxml解析库的etree.parse方法加载本地html文件的路径输入问题

原创 2018年04月15日 22:41:55

学习Matplotlib的时候,我也慢慢学习崔庆才的爬虫教程点击打开链接

其中有个需要利用lxml解析库的 etree.parse方法加载本地./test.html文本文件的例子。
(为什么其中的例子的文件名写成./test.html ?? 多余的./是作什么的? 百度无果,求大神解答下!感谢!)
代码参考如下:
from lxml import etree
html = etree.parse('./test.html', etree.HTMLParser())
result = etree.tostring(html)
print(result.decode('utf-8'))

运行后发生文件加载错误。

联想到上次“利用Python的 with open功能加载读取py本地当前目录文件问题点击打开链接

于是代码中添加全路径文件地址,还是发生加载错误问题。


貌似显示文件目录地址输入方法不正确,于是再次参考error说明中的样式输入html文本地址。

from lxml import etree
html = etree.parse('D:/python3.6/scrapy/./test.html', etree.HTMLParser())
result = etree.tostring(html)
print(result.decode('utf-8'))

加载成功,解析成功。

本地测试用的 test.html 文本代码如下:

div
    ul
         li class=item-0a href=link1.htmlfirst itemali
         li class=item-1a href=link2.htmlsecond itemali
         li class=item-inactivea href=link3.htmlthird itemali
         li class=item-1a href=link4.htmlfourth itemali
         li class=item-0a href=link5.htmlfifth itema
     ul
 div




python html parser库lxml的介绍和使用(快速入门)

lxm是python的一个html/xml解析并建立dom的库,lxml的特点是功能强大,性能也不错,xml包含了ElementTree ,html5lib ,beautfulsoup 等库,但...
  • marising
  • marising
  • 2010-08-18 15:16:00
  • 45131

使用Beautifulsoup解析本地html文件

有时候网络上的资源可以通过html保存在本地,然后再解析本地html文件,提取有用的信息。...
  • fwj_ntu
  • fwj_ntu
  • 2017-12-19 16:08:09
  • 1155

python lxml库etree解析html

在用python爬取数据时重要的一个环节就是从获得的html页面中分析提取出所需要的数据。 一个常用的方法是使用正则表达式,进行匹配提取,这是一种通用的字符串匹配分析方式。但对于html页面来说并没有...
  • brink_compiling
  • brink_compiling
  • 2016-07-18 13:18:22
  • 2186

使用lxml解析HTML数据

HTML数据解析 诸如爬虫类场景下我们需要对抓取的HTML做内容解析,提取感兴趣的内容,python标准库提供了HTMLParser\SGMLParser两个模块用于解析HTML,然而这两个模块的实...
  • willyan2002
  • willyan2002
  • 2017-07-05 10:46:50
  • 522

使用由 Python 编写的 lxml 实现高性能 XML 解析

转载自:文章lxml 简介 Python 从来不出现 XML 库短缺的情况。从 2.0 版本开始,它就附带了 xml.dom.minidom 和相关的 pulldom 以及 Simple ...
  • hunyxv
  • hunyxv
  • 2016-10-04 21:34:33
  • 2862

lxml类库的介绍文档

作者:Shane 出处:http://bluescorpio.cnblogs.com   lxml takes all the pain out of XML. Stephan Richte...
  • uestcyao
  • uestcyao
  • 2012-08-17 17:59:51
  • 9369

爬虫工具lxml库的使用和Xpath语法

安装 pip install lxml Xpath 语法: Xpath是一门在XML文档中查找信息的语言。XPath可用来在XML文档中对元素和属性遍历。XPath是W3C XSLT标准的主要元...
  • wyisfish
  • wyisfish
  • 2017-02-20 21:53:22
  • 357

安卓漫漫路之读取本地html文件.

为什么放置到assets文件夹下:     Android资源文件大致可以分为两种:     第一种是res目录下存放的可编译的资源文件:     这种资源文件系统会在R.java里面自动生成该资...
  • HighForehead
  • HighForehead
  • 2017-01-05 23:28:42
  • 3347

使用WebView加载本地html操作本地数据

  • 2014年08月04日 18:36
  • 637KB
  • 下载

用swift 加载html文件

// 首先呢要把这个HTML文件加入到项目之中  class WebViewController: UIViewController {      override func viewDidLoa...
  • zhonggaorong
  • zhonggaorong
  • 2015-12-04 14:59:36
  • 1871
收藏助手
不良信息举报
您举报文章:利用lxml解析库的etree.parse方法加载本地html文件的路径输入问题
举报原因:
原因补充:

(最多只允许输入30个字)