rss
街头小贩
千里路行,始于足下
展开
-
不合规范的html段落php处理细则
最近业余时间在维护一个rss聚合应用,就发现很多网站feed的条目摘要存在各种问题,用strip_tags一刀切吧,对摘要的段落和样式扭曲了原创 2013-07-05 16:49:31 · 2089 阅读 · 1 评论 -
org.dom4j.DocumentException: Error on line 1 of document: 前言中不允许有内容
下面是大致的异常栈:org.dom4j.DocumentException: Error on line 1 of document : 前言中不允许有内容。 Nested exception: 前言中不允许有内容。 at org.dom4j.io.SAXReader.read(SAXReader.java:482) at org.dom4j.DocumentHelper.parse原创 2013-10-29 14:52:21 · 89486 阅读 · 5 评论 -
Dom4j 解析Atom 文档
第一种方法遍历Dom树,不使用xpathElement re=document.getRootElement();List es=re.elements("entry");for(int i=0;i<es.size();i++){ Element currentItem=(Element)es.get(i); Element title=(Element)currentI原创 2013-11-22 20:39:59 · 5443 阅读 · 0 评论 -
在java中sax读取远程xml
sax是基于事件回调模型的,比dom(document)更快捷。同时对解析过程有更多的控制。在java中可用的有原生态的包:javax.xml.parsers.SAXParser或者apache的Xerces中的。解析无非两件事:一个解析器(SAXParser,XMLReader),一个事件句析或者叫作回调函数。原创 2014-12-17 23:48:34 · 1706 阅读 · 4 评论 -
org.xml.sax.SAXParseException; lineNumber: 1; columnNumber: 1; Content is not allowed in prolog
org.xml.sax.SAXParseException; lineNumber: 1; columnNumber: 1; Content is not allowed in prolog.原创 2015-05-10 00:12:29 · 39430 阅读 · 0 评论 -
javax.ws.rs.NotAcceptableException: HTTP 406 Not Acceptable
javax.ws.rs.NotAcceptableException: HTTP 406 Not Acceptable原创 2017-01-06 18:52:50 · 2737 阅读 · 0 评论 -
使用Spring MVC的AbstractRssFeedView时注意
看一看源代码中的默认构造器的代码:注意这个MediaType的值,图中的值是:application/rss+xml. 我测试发现Win10 Edge和Chrome都可以解析这种响应内容类型.但Firefox不认识它会提示你下载. 按F12看到请求允许的内容类型如下: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0....原创 2019-09-22 16:41:37 · 212 阅读 · 0 评论