如何从文本和演示文稿模板中提取文本和元数据

使用GroupDocs从Java平台上的许多不同文本和表示模板中提取文本和元数据。用于Java API的解析器。支持以下模板格式:

  • dotx(模板)
  • dotm(Macro-enabled的模板)
  • ott(OpenDocument Text模板)
  • potx(模板)
  • potm(Macro-enabled的模板)
  • ppsm(Macro-enabled的幻灯片播放)
  • pptm(Macro-enabled的演示文稿)

下面的代码示例演示了如何从模板提取文本和元数据。

// Extracting Text
void extractText(String fileName) {
// Extract a text from the file
String text = Extractor.DEFAULT.extractText(fileName);
// Print an extracted text
System.out.println(text);
}
// Extracting Metadata
void extractMetadata(String fileName) {
// Extract metadata from the file
MetadataCollection metadata = Extractor.DEFAULT.extractMetadata(fileName);
// Print extracted metadata
for (String key : metadata.getKeys()) {
// Print a metadata key
System.out.print(key);
System.out.print(": ");
// Print a metadata value
System.out.println(metadata.get_Item(key));
}
}

除此之外,解析API还支持从PDF文档中检索表格,并允许识别安全的Office Open XML文档的媒体类型-http://bit.ly/2CCy7bX

原文链接:https://dev.to//groupdocs/how-to-extract-text-and-metadata-from-text-and-presentation-templates-3l1h

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值