昨天跟姜老师讨论了一些OAI-PMH协议方面的内容,收获还不少.
Dspace可以通过 http://localhost/dspace-oai/request 做为baseURL做为数据提供者(Data Provider)来为开放获取提供数据.可以用?verbs= '动作'的方式来指定所进行的操作,用harvester 进行收集时得到了系统内的所有记录(条目,item) 条目内的内容用<metadata>元素来描述,它下面的子元素是DC元数据,包括题名,作者,日期,标识(identify)等.用标识(indentify)就可以找到具体的条目. 猜想收集到的暴露元数据应该是可以设置的.即,只暴露想暴露的东西.
用了Harvest API来收集元数据,这个API较简单,它包括八个类,目录层次如下:
`-- org
`-- oclc
`-- oai
`-- harvester2
|-- app
| `-- RawWrite.java
`-- verb
|-- GetRecord.java
|-- HarvesterVerb.java
|-- Identify.java
|-- ListIdentifiers.java
|-- ListMetadataFormats.java
|-- ListRecords.java
`-- ListSets.java
其中RawWrite为一个具体的应用,verb中除HarvesterVerb为抽象内是该包中的所有其它类的父类外,其它六个类对应OAI-PMH的协议动作.
Dspace可以通过 http://localhost/dspace-oai/request 做为baseURL做为数据提供者(Data Provider)来为开放获取提供数据.可以用?verbs= '动作'的方式来指定所进行的操作,用harvester 进行收集时得到了系统内的所有记录(条目,item) 条目内的内容用<metadata>元素来描述,它下面的子元素是DC元数据,包括题名,作者,日期,标识(identify)等.用标识(indentify)就可以找到具体的条目. 猜想收集到的暴露元数据应该是可以设置的.即,只暴露想暴露的东西.
用了Harvest API来收集元数据,这个API较简单,它包括八个类,目录层次如下:
`-- org
`-- oclc
`-- oai
`-- harvester2
|-- app
| `-- RawWrite.java
`-- verb
|-- GetRecord.java
|-- HarvesterVerb.java
|-- Identify.java
|-- ListIdentifiers.java
|-- ListMetadataFormats.java
|-- ListRecords.java
`-- ListSets.java
其中RawWrite为一个具体的应用,verb中除HarvesterVerb为抽象内是该包中的所有其它类的父类外,其它六个类对应OAI-PMH的协议动作.