- 博客(3)
- 收藏
- 关注
原创 Win10+Ubuntu16.04 - 实现双系统安装
一.环境Windows10 64位VMware-workstation-14.1.1Ubuntu16.04.3-Server-amd64二.步骤2.1 下载VMare,安装VMware2.2 下载Ubuntu16.04.3 , 安装Linux系统(1) 在VMware中,选择“文件-开始-新建虚拟机”, 然后进入如下页面,选择完镜像文件与安装地址,开始安装。(2)Ubuntu安装...
2019-02-27 21:48:29 383
原创 基于Xgboost的文本分类——Python实现
1、背景 数据集大小为1万,其中训练集5000,测试集5000,共十类。 开发环境:Python3.6+Windows+PyCharm2、前期准备 获取1万数据集,分词,去停止词并存入MySQL数据库。3、从数据库读取数据def train_corpus_generator(): global db # coding:utf-8 n
2018-07-10 15:16:19 5483 7
原创 Full-text Search by ElasticSearch Ingest-Attachment in PDF format (ElasticSearch 5.3 载入PDF数据)
1.简介ElasticSearch只能处理文本,不能直接处理文档。要实现 ElasticSearch 的附件导入需要以下两个步骤: 一、对多种主流格式的文档进行文本抽取。 二、将抽取出来的文本内容导入 ElasticSearch。Ingest-Attachment是一个开箱即用的插件,替代了较早版本的Mapper-Attachment插件,使用它可以实现对(PDF,DOC等)主...
2018-07-10 12:06:01 3662 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人