Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。
Tensorflow 文本分类主要讲什么?
文本分类是一项为给定的文本片段分配合理的标签的任务。文本可以是一个短语、一个句子甚至一个段落。我们的目的是用一些文本作为输入,然后为输入打上标签。因为我们将用Tensorfow深度学习库,所以我们可以把这项文本分类任务叫作Tensorflow文本分类系统。看起来很简单不是吗~ 额,其实没那么简单。
分类任务涉及到训练一个包含有大量文本片段及其表达内容(标签)数据集的神经网络。我相信你们一定听过这个术语“情感分析”。我们将情感分析与文本分类任务相结合进行文本情感分析,这仅限于识别一个人说了什么。比如“这食物真实太棒啦!”这句话表达了积极的情感,相反,“这电影太差啦!”这句话表达了消极的情感;然而“太阳从东方升起”这句话蕴含的是中性情感
对于情感分析而言,标签一般包含积极、消极、中性三类。但是这只是文本分类的一项应用。如果你在构建其他像聊天机器人一样的的应用或者一个文档解析算法,你可能想要清楚每个特定的句子属于什么类别。比如:“您好”“您好吗?”可以被打上“打招呼”的类标签,“很高兴见到你”可以被打上“告别”类标签
你将要学什么?
你可以构建一个文本分类器来对一个给定的句子分类,打上为分类器训练的多个标签之一。在这个教程中,我们就要完成这个任务。我们将详细介绍你