自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 关于文本数据预处理的一些方法

最近在进行一个关于深度学习的文本情感分类的项目,从数据获取到清洗,以及文本标注这些都在准备。文本预处理是NLP中十分关键的一个流程,正所谓数据是否优质决定着神经网络的训练效果,以及后续对神经网络的调参,本文分享一些基本的文本预处理方法。文章目录数据浏览一、数据整合以及体量观测二、文本数据分词三、词云四、句长统计总结数据浏览由于项目上运用到的情感分类数据是要用于进行5分类的情感分类,数据体量较大,本文只选取其中很小一部分进行预处理,大体数据集合如下:一、数据整合以及体量观测这部分更多是对数据

2021-09-24 16:43:33 4647 1

原创 构建神经网络对鸢尾花进行多分类分析

鸢尾花数据在机器学习中经常会运用到,并且其中的数据可以进行3分类的操作,机器学习算法对其的应用例子特别多。最近在学习神经网络方面的知识,所以运用了神经网络方面的知识对其中数据的分析已经对神经网络构建训练对鸢尾花种类进行一个预测分析。文章目录问题描述一、pandas是什么?二、使用步骤1.引入库2.读入数据总结问题描述**利用机器学习算法构建模型,根据鸢尾花的花萼和花瓣大小,区分鸢尾花的品种。实现一个基础的三分类问题。**提示:以下是本篇文章正文内容,下面案例可供参考一、pandas.

2021-09-21 00:45:07 8240 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除