IBM watson API解析2-Document Conversion(文本转换)

这篇博客详细介绍了如何使用IBM Watson Document Conversion API。首先,讲解了注册Bluemix账号、安装SDK以及创建服务凭证的步骤。接着,阐述了Document Conversion服务的基本概念和当前API版本。然后,通过Python代码示例演示了Convert a document和Index a document两个方法的使用,遇到的问题及cUrl命令行方式的替代方案。最后,博主分享了遇到的错误和对完整实现的期待。
摘要由CSDN通过智能技术生成

前期准备

1、注册Bluemix账号

需要一个IBM的Bluemix账号,已有账号的可直接登陆,若无账号,点击注册进行注册。
注册时国家或地区默认的,否则可能会出错。

2、安装watson-developer-cloud

pip install --upgrade watson-developer-cloud

3、创建应用服务

  1. 登录Bluemix后,点击左上角目录栏,点击”服务“,然后点击”Watson“。则会看到一系列服务。如图所示:这里写图片描述
  2. 点击Document Conversion
  3. 点击创建,则会创建一个相应的服务凭证
  4. 进入后,点击左边的服务凭证,则会看到创建的服务
  5. 点击查看凭证,则会显示服务的URL、用户名、密码,这些在调用相应API时会用到

Docuemnt Conversion

1、基本概念

Document Conversion 服务将单一的 HTML、PDF 或 Microsoft Word™ 文档转换为标准化的 HTML、纯文本或一组可用于其他 Watson 服务的 JSON 格式的答案单元

2、目前版本号

API 版本格式为:version=YYYY-MM-DD。以年月日作为版本号,目前版本号为:2015-12-15.

简单样例(Python实现)

Document Conversion API提供了两个方法,一下分别介绍这个两个方法。

1、Convert a document方法

用于将文档转换成为应答单位(answer units),HTML以及文本。

以下是使用Python进行简单实例,但是没有得到想要的结果,报了错误,现在将此贴出来。如有解决方法,请各位大神不吝赐教。之后将使用其他方法实现。
实现代码如下:

# encoding: UTF-8
import json
from watson_developer_cloud import DocumentConversionV1,WatsonException
document_conversion = DocumentConversionV1(
    username="324e088a-5375-4f53-a863-417453290f90",
    password="dTwCrjHosJn2",
    version="2015-12-15"
)
config = {
    'conversion_target': 'NORMALIZED_TEXT',
    # Use a custom configuration.
    'pdf':{
        'heading':{
            'fonts':[
                {
  'level':1,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值