stanford corenlp 使用时遇到编码问题：json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

最新推荐文章于 2024-09-11 20:55:40 发布

Barry-njr

最新推荐文章于 2024-09-11 20:55:40 发布

阅读量2.8k

点赞数 2

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014165082/article/details/110703450

版权

使用Stanford CoreNLP进行中文分词时，遇到json.decoder.JSONDecodeError错误，该错误通常发生在处理包含特殊字符的句子时。为解决此问题，可以通过先对输入句子进行URL编码，再进行分词操作。具体步骤包括导入`urllib.parse`中的`quote`函数，设置分词参数，然后使用`requests.post`发送请求，将编码后的句子作为数据发送，最后解析JSON结果并获取分词结果。

摘要由CSDN通过智能技术生成

安装好JDK等环境后，对中文句子进行分词，部分句子分词没问题，有的句子分词报错：json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

这些中文句子一般含有特殊字符。

解决办法：

将传入的句子先进行URL编码，将中文句子变成网页中编码的形式，例如：

具体方法如下：

利用quote函数将传入的句子（text）转换一下，在传入

from urllib.parse import quote

代码如下：

import requests

from urllib.parse import quote

url = "http://127.0.0.1:9000" # 使用本机端口需要先在stanford目录下运行java，见stanford nlp官网

params = {"propertie

最低0.47元/天解锁文章

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。