一,学习目标
1.学会TF-IDF的原理和使用
2. 使用sklearn的机器学习模型完成文本分类
二,文本表示方法
之前只接触过图像处理,对于语音信号的表示方法不了解,刚好借此机会了解。
在深度学习中,主要的两个分支主要是基于CNN的图像处理,和基于RNN的语音信号处理。在图像处理中,主要通过CNN的卷积操作,提取特征图,进行后续的识别和其他操作。但是在自然语言领域,由于文本是不定长的,文本通常是表示为数字或向量,将不定长的文本转化到定长的空间中。
一,学习目标
1.学会TF-IDF的原理和使用
2. 使用sklearn的机器学习模型完成文本分类
二,文本表示方法
之前只接触过图像处理,对于语音信号的表示方法不了解,刚好借此机会了解。
在深度学习中,主要的两个分支主要是基于CNN的图像处理,和基于RNN的语音信号处理。在图像处理中,主要通过CNN的卷积操作,提取特征图,进行后续的识别和其他操作。但是在自然语言领域,由于文本是不定长的,文本通常是表示为数字或向量,将不定长的文本转化到定长的空间中。