html 分类检索,分词和分类检索平台使用手册

在2019年8月,我们GooSeeker团队发布了第3版分词打标软件,即现在的分词和分类检索平台,在原来文本分词处理的基础上,增加了可以像搜索引擎那样检索和查看数据的分类检索功能模块,分词选词模块则做了一些优化,下面介绍基本操作,希望大家能借助这个工具,发掘出数据的价值。

1.新建任务

1.1.在【我的任务】里,通过【新建任务】,导入要做分词处理或者是要分析的数据文件。

1.2.如果是导入Excel的话,序号和正文两列是必须要有的,其他列可以没有;注意单个文件不要超过10M大小,超过的话需要分成多个文件导入。

70d9b4e54bb366b3c6186c745c3d4be7.png

2.分词选词

2.1.这里会把“正文”一列进行分词。在【分词选词】->【筛选词语】页面上,词语会按词频从大到小排序,勾选会用到的词语,具体选哪些词语要根据研究主题来定,每一页选完点击【确定】提交就会切换到下一页。

77982d4ec9793c89d85bc1b84a4923ec.png

tips:点击词语,在右侧就会看到包含该词的数据,点击右侧数据会弹窗显示完整内容,这样就能边看数据边选词。

ab3ce11e37ffd220a500ed712893d2e1.png

2.2.在【选词结果】中查看结果,如果需要补充词语,可以直接点【添加词语】来补充,或者回到筛选词语那里勾选。

070cd9dda5050f8bb89727c36b265153.png

3.下载分词选词的数据

3.1.选完词语后,在选词结果或打标结果或分词效果的页面上,点击【下载】按钮,就能下载到分词选词的数据压缩包。

41f7908ef73fbfb47c76071814a73030.png

tips:有选词的话,数据包里会有切词表、分词效果表、选词结果表、打标结果表四张表;没有选词的,下载就只有切词表、分词效果表,没有选词结果表和打标结果表。

1dd9e00b4eda4222fc5b6abb8a8e6217.png

(1)切词表

8113cb174b85e8ef4fce7d7ff9e74c0c.png

(2)分词效果表

e913cffc49d59e510774c84221022934.png

(3)选词结果表

01fc15a0ca9582bd32f5c104318690c1.png

(4)打标结果表

4c25a9ae5e65f036d5235326988bf6a1.png

3.2.在打标结果页面上,点击【下载匹配矩阵表】按钮,可以下载到正文与所选词语的匹配对应关系表。

5da449d3880da335e57af70961c9f8ae.png

(5)匹配矩阵表(表里的正文与词语如果匹配上就会标记1,没匹配上标记为0)

da928305a2f47923e3f39a55a6956221.png

3.3.在分词效果页面上,点击【下载打标匹配表】按钮,下载到打标匹配表。

49e5450122f646be232daf7b65e8b06d.png

(6)打标匹配表

42dae9c7f84ea58a22607ac18f40b378.png

4.分类检索

4.1.前面新建任务所导入的数据,在【分类检索】中可以像搜索引擎那样进行搜索查看,也可以进行收藏,收藏后在【收藏管理】里查看和导出。

bff2d9691c888cf03b4d6b4ff2da1be5.png

4.2.如果您在【分类管理】中创建领域->主题->标签词三级分类结构,系统会自动把正文与标签词做匹配,再关联主题和领域进行分类。

tips:可以把前面分词选词所下载到的选词结果表进行分类整理,也可以通过其他方式整理到Excel表里,然后【批量导入】即可。

eb90a709f5f5faeffc540fabfdc49d14.png

然后在【分类检索】->【关注】里,就可以对分类匹配到的数据进行筛查,还可以导出分类数据表。

c80620409b6a9894c1f40e77087c4e3b.png

(7)分类数据表

f18c44e2b465cc7ec6505888d134724d.png

5.关于任务管理

5.1.切换任务

在导航栏,可以选择其他任务,也可以输入任务搜索来切换。

821ee3a356139d33a7acad216dd1fb5a.png

5.2.导入数据

在除“我的任务”外的每一个菜单中都有【导入数据】按钮,通过它可以导入新数据到当前任务里。

5.3.删除任务

在【我的任务】里,选中任务的【删除】按钮,就可以删除该任务。

5e7681c7dafe4a07f3313c456c2ba2a6.png

6.下载到的数据怎么用

前面下载到的数据,可以用于进一步的统计分析、数据建模、情感分析等,我们发布了一些数据的分析案例,大家感兴趣的可以到《GooSeeker分词和分类检索平台使用攻略》里查看。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值