python中文字符串转list

本文介绍了如何利用keras preprocessing的text_to_word_sequence方法将中文字符串转化为list。由于中文字符间无空格,直接转换会导致整个字符串被视为一个元素。通过在每个中文字符后加空格作为分隔符,可以正确地将字符串拆分成多个元素的list。
摘要由CSDN通过智能技术生成

本文主要记录了将中文字符串转换为list的过程,其中我们使用了keras preprocessing中的text_to_word_sequence方法。这个方法是完全适配中文的。需要注意的是,中文语料一般字符之间是没有空格分割的,这与英文是不同的。如下所示,如果我们直接进行转换,由于没有空格分词,会将字符串默认为一个字符。

from tensorflow.keras.preprocessing.text import text_to_word_sequence
text = '我是人'
token = text_to_word_sequence(text)
print(token)
print(type</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值