自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一休哥的专栏

关注前沿,努力积累

  • 博客(5)
  • 资源 (6)
  • 收藏
  • 关注

原创 spark pipeline原理学习和记录

概念MLlib提供标准的机器学习算法API,能够方便的将不同的算法组合成一个独立的管道,或者叫工作流。 • DataFrame:ML API使用Sark SQL中的DataFrme作为机器学习数据集,可容纳各种类型的数据,如DataFrame可能是存储文本的不同列,特征向量,真正的标签或者预测。       • 转换器:Transformer是一种算法,可以将一个DataFrame转换成

2017-03-24 13:29:11 11891 1

转载 知识图谱研究进展

本文首先简要回顾知识图谱的历史,探讨知识图谱研究的意义。其次,介绍知识图谱构建的关键技术,包括实体关系识别技术、知识融合技术、实体链接技术和知识推理技术等。然后,给出现有开放的知识图谱数据集的介绍。最后,给出知识图谱在情报分析中的应用案例。— 漆桂林、高桓、吴天星 东南大学计算机科学与工程学院本文节选自《情报工程》2017 年第 1 期,知识图谱专题稿件。1 知识图谱构建技术本节首先给出知识图谱的

2017-03-22 13:29:06 6904

原创 Introducing the Knowledge Graph: things, not strings【阅读翻译】

ntroducing the Knowledge Graph: things, not strings【阅读翻译】

2017-03-22 10:34:10 6896

原创 网页数据构建知识图谱-数据和方法

1.网页数据解析 (1)可以参看webkit内核,构建一个网页解析工具,解析dom树/视觉树/分块树,根据需求解析目标数据; (2)构建xpath类规则,提取指定目标数据; (3)解析microdata数据,可以参考pps/babytree,里面的itemscope/itemprop系列标签2.数据来源 (1)百度百科/维基百科等知识词条类 (2)豆瓣类垂直站点 (3)其它类别的站点3.

2017-03-22 10:19:49 2315

原创 Cloudera数据科学平台Cloudera Data Science Workbench: Self-Service Data Science for the Enterprise

Cloudera Data Science Workbench: Self-Service Data Science for the Enterprise Cloudera数据科学工作台:企业自助数据科学开发环境March 14, 2017 R Python SCALA 使用

2017-03-16 10:01:19 2545 1

指代消解的语料,ontonotes数据,已经处理好

指代消解的语料,ontonotes数据,已经处理好

2024-06-13

pku98-人民日报分词语料1998年1月份

人民日报分词语料1998年1月份,包含训练和两份语料和汇总语料,可以自行训练和验证模型使用。

2020-11-09

g2pv.json测试数据源文件

g2pv.json数据可以用于展现前端词云,2.经过一番百度谷歌终于找到G2, 参照官网的例子 https://antv.alipay.com/g2/doc/tutorial/advance/draw-word-cloud.html 3.G2可以根据给定图形生成词云,所以就能够生成自己想要的词云,注意给定的模板图片一定要轮廓分明,最好是外围都是白色

2019-03-26

八爪鱼安装包

八爪鱼安装包,可定制,使用方便,门槛低。

2018-11-30

汉字编码一级字库

一级汉字库

2016-06-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除