文本情感分类python_pyhanlp文本分类与情感分析

最新推荐文章于 2024-04-10 23:11:57 发布

weixin_39954464

最新推荐文章于 2024-04-10 23:11:57 发布

阅读量609

点赞数

文章标签：文本情感分类python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39954464/article/details/111530780

版权

语料库

本文语料库特指文本分类语料库，对应IDataSet接口。而文本分类语料库包含两个概念：文档和类目。一个文档只属于一个类目，一个类目可能含有多个文档。比如搜狗文本分类语料库迷你版.zip，下载前请先阅读搜狗实验室数据使用许可协议。

用Map描述

这种关系可以用Java的Map来描述，其key代表类目，value代表该类目下的所有文档。用户可以利用自己的文本读取模块构造一个Map形式的中间语料库，然后利用IDataSet#add(java.util.Map)接口将其加入到训练语料库中。

用文件夹描述

这种树形结构也很适合用文件夹描述，即：

/**

* 加载数据集

*

* @param folderPath 分类语料的根目录.目录必须满足如下结构:

* 根目录

* ├── 分类A

* │ └──1.txt

* │ └──2.txt

* │ └──3.txt

* ├── 分类B

* │ └──1.txt

* │ └──...

* └──...

* 文件不一定需要用数字命名,也不需要以txt作为后缀名,但一定需要是文本文件.

* @param charsetName 文件编码

* @re

最低0.47元/天解锁文章

weixin_39954464

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
文本情感分类python_pyhanlp文本分类与情感分析

语料库本文语料库特指文本分类语料库，对应IDataSet接口。而文本分类语料库包含两个概念：文档和类目。一个文档只属于一个类目，一个类目可能含有多个文档。比如搜狗文本分类语料库迷你版.zip，下载前请先阅读搜狗实验室数据使用许可协议。用Map描述这种关系可以用Java的Map来描述，其key代表类目，value代表该类目下的所有文档。用户可以利用自己的文本读取模块构造一个Map形式的中间语料库，然...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。