报错
在处理数据集时需要解析xml文件获取需要的数据,一开始采用python自带的xml模块来做,即xml.dom.minidom
,然后报错
entity not defined
也没显示是在xml文件哪一行,网上找了些办法也没解决,后来采用lxml模块来解析,还是报错,但有显示具体原因,及对应xml文件哪一行
Entity 'ndash' not defined
定位到xml文件对应的行数发现确实有这样的符号,替换掉即可,除了ndash
外,还有mdash
和&
都会到导致报错。
VScode批量替换多个文件中字符
由于文件较多,一个一个替换也不现实,所以采用VScode批量替换所有文件中的字符,打开对应的文件夹,按Ctrl Shift F
即可(還是要感嘆下VS的强大)