对Tensorflow 分词器texts_to_matrix的理解

最新推荐文章于 2022-12-03 20:42:16 发布

风华明远

最新推荐文章于 2022-12-03 20:42:16 发布

阅读量730

点赞数

分类专栏： TensorFlow Python 文章标签： tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42272768/article/details/113766369

版权

在实现上，这个函数是调用了sequences_to_matrix，为了便于理解使用texts_to_matrix作为分析。毕竟单词比数字更直观。
对于下面的单词组：

texts=[['hello','world'],
		['hello','Jim','hello','Rose'],
		['home']
]

texts是一个二维数组，可以看作是文章的集合。如果我们要得到hello在每篇文章中的出现次数，要怎么处理？
显然texts_to_matrix是可以完成这个功能的。但是问题是如何生成参数是个问题。简单的输入[[‘hello’]]是得不到想要的结果的。这里要输入的是hello这个单词在每篇文章是否出现，如果出现就加入到数组中，代码如下:

text_hello=[]
for text in te

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。