处理生成xml,遇到超出范围字符导致报错的问题

最新推荐文章于 2022-10-02 17:55:51 发布

冰刺猬

最新推荐文章于 2022-10-02 17:55:51 发布

阅读量1k

点赞数

分类专栏： golang

本文链接：https://blog.csdn.net/ciwei_ice/article/details/50597365

版权

golang 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

使用encoding/xml 对内容进行xml生成的时候，遇到2个问题

一个是给中文添加 CDATA 标签另外一个就是添加完cdata后，有些特殊的ascii字符导致xml解析失败的问题

CDATA的方法通过使用innerxml的tag标签可以解决，方案

给chardata结构给定一个innerxml的tag

xml结构体的chardata结构，里设置了innerxml tag，表示不作任何处理，进行数据直接展示，

然后写个func 给字符串增加上CDATA 就可以了

func NewCharData(s string) CharData {
	//	s = url.QueryEscape(s)

	return CharData{[]byte("<![CDATA[" + s + "]]>")}
}

<img src="https://img-blog.csdn.net/20160127235550827?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="" style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);" />

如图，上面的 us so 这种内容，导致解析xml报错，因为是ascii字符集里，有几个范围的内容，不被xml确认，所以需要把这堆内容通过正则匹配删除掉，

其实下午就在用正则匹配，但是死活不好用。。回家以后写了个测试，然后竟然又好用了，无言了。代码贴出来明天去公司再试试

import (
	"fmt"
	"regexp"
	//"strconv"
)

re, _ ：= regexp.Compile("[\x00\x01\x02\x03\x04\x05\x06\x07\x08\x0b\x0c\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f]")
src = re.ReplaceAllString(src, "")

冰刺猬

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
处理生成xml,遇到超出范围字符导致报错的问题

使用encoding/xml 对内容进行xml生成的时候，遇到2个问题一个是给中文添加 CDATA 标签另外一个就是添加完cdata后，有些特殊的ascii字符导致xml解析失败的问题CDATA的方法通过使用innerxml的tag标签可以解决，方案特殊字符尝试了多次。最后突然奇怪的好了。。如图，上面的 us so 这种内容，导致解析xm
复制链接

扫一扫