自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (2)
  • 收藏
  • 关注

原创 中文文本分类

        将文本进行分类是自然语言处理当中最主要的工作之一,本文处理很重要的一项工作就是对文本进行向量化,本文不做详细的介绍,只是采用TF-IDF的方法对文本进行向量化,然后分别采用SVM,  Bayes,  RandomForest,BP四种方法对文本进行分类。训练语料是在excel中存储的,格式见下图:data = pd.read_excel('../corpus.xlsx...

2018-11-25 11:37:45 673

原创 Minimal Centos安装后并没有ifconfig命令

首先,查看ip addrip addr显示如下:进入下面的目录,然后修改配置文件cd /etc/sysconfig/network-scriptsvi ifcfg-ens33将ONBOOT=no修改为yes,然后保存,退出。重新启动网络服务service network restar安装net-tools包yum install net-tools...

2018-11-24 20:35:54 397

原创 正则匹配Java程序的注释部分

\/\*[\w\W]*?\*\/|\/\/.*

2018-11-16 08:50:19 1378

GoogleNews-vectors-negative300网盘地址.txt

这是网络上的关于GoogleNews-vectors-negative300.bin.gz文件的百度网盘地址

2019-12-09

中文繁体转简体工具

此jar包可以将java程序中的繁体字转化成简体字,亲测可以使用

2018-07-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除