- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 Can not find the tag library descriptor for "http://java.sun.com/jsp/jstl/core" 报错
出现 Can not find the tag library descriptor for "http://java.sun.com/jsp/jstl/core" 报错,如何处理?我自己装的eclipse-jee里面一个demo出现这个问题,我的解决方法:在WebContent目录下的WEB-INF下的lib中导入standard,jstl.jar文件下载目录:https://download....
2018-03-15 21:40:54 413 1
原创 信息提取的一般方法
方法一:完整解析信息的标记形式,再提取关键信息。XML JSON YAML需要标记解析器 eg: bs4库的标签树遍历优点: 信息解析准确缺点: 提取过程繁琐,速度慢。方法二: 无视任何标记形式,直接搜索关键信息。搜索对信息的文本查找函数即可。优点: 提取过程简洁,速度较快。缺点:提取结果准确性与信息内容相关。融合方法融合方法: 结合形式解析与搜索方法,提取关键信息。XML JS...
2018-02-25 20:48:33 744
原创 三种信息标记比较
XML实例<person> <firstName>Tian</firstName> <lastName>Song</lastName> <address> <streetAddr>关山大道5号街</streeAddr> &
2018-02-24 18:44:36 303
原创 BeautifulSoup库入门小结
1.概念要清晰BeautifulSoup库是用来解析HTML和XML文档的一些功能库2.使用方法from bs4 import BeautifulSoup #来引入BeautifulSoup的类型,并用这个类型加载相关的解析器,来解析一个变量出来soup = BeautifulSoup('<p>data</p>','.html....
2018-02-22 20:33:45 300
原创 bs4库的prettify()方法
基于bs4库HTML的格式输出如何让<html>页面更友好的显示prettify()方法:>>> import requests>>> r = requests.get("http://python123.io/ws/demo.html")>>> demo = r.text>>> demo
2018-02-22 14:43:17 17050
原创 标签树的平行遍历
标签树的平行遍历有四个属性,分别为:.next_sibling 返回按照HTML文本顺序的下一个平行节点标签.previous_sibling 返回按照HTML文本顺序的上一个平行节点标签.next_siblings 迭代类型,返回按照HTML文本顺序的后续所有平行节点标签.previous_siblings ...
2018-02-10 17:52:18 677
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人