在一个爬虫项目中需要自定义爬取网站模板,并且在项目中使用到了xmlbeans,特此做一个总结
1.首先编写xml文件
2.可以使用XMLSPY和Stylus Studio都可以通过XML文件来生成Schema文件,当然作为开发人员我们可以自己编写xsd文件。
3.需要有.xsdconfig文件内容大致如下
<xb:config xmlns:xb="http://xml.apache.org/xmlbeans/2004/02/xbean/config">
<xb:namespace>
<xb:package>sample.xmlbean</xb:package>
</xb:namespace>
</xb:config>
4.
scomp是XMLBean提供的一个编译工具,它在bin的目录下. 通过这个工具,我们可以将以上的Schema文件生成Java Classes.scomp的语法如下:-
scomp [options] [dirs]* [schemaFile.xsd]* [service.wsdl]* [config.xsdconfig]*
-src [dir] -- 生成的Java Classes存放目录
-srconly -- 不编译Java Classes,不产生Jar文件
-out [jarFileName] -- 生成的Jar文件,缺省是xmltypes.jar
-compiler -- Java编译器的路径,即Javac的位置
schemaFile.xsd -- XML Schema文件位置
config.xsdconfig -- xsdconfig文件的位置, 这个文件主要用来制定生成的Java Class的一些文件名规则和Package的名称,在本文,包名是sample.xmlbean
scomp -src buid\src -out build\newXmlBean.har news.xsd -compiler c:\jdk..\bin\javac news.xsdconfig
即可生成对应jar包和源文件
更详细内容可以学习