自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (3)
  • 收藏
  • 关注

转载 CRF条件随机场

)drank(动词)coffee(名词)at(介词)Starbucks(名词)”。下面,就用条件随机场来解决这个问题。以上面的话为例,有5个单词,我们将:(名词,动词,名词,介词,名词)作为一个标注序列,称为l,可选的标注序列有很多种,比如l还可以是这样:(名词,动词,动词,介词,名词),我们要在这么多的可选标注序列中,挑选出一个最靠谱的作为我们对这句话的标注。怎么判断一个标注序列靠谱不靠谱呢?就我们上面展示的两个标注序列来说,第二个显然不如第一个靠谱,因为它把第二、第三...

2021-06-02 20:11:16 409

原创 知识图谱构建流程及算法

知识图谱知识图谱的概念知识图谱是对事实的一种结构化表示方法,由实体、关系和语义描述组成。知识图谱的数据结构以图形式存在,由实体(节点)和实体之间的关系(边)组成。本质上,它是一种表示实体间关系的语义网络,以“实体-关系-实体”的三元组来表达。知识图谱中数据语义的表达方式RDFRDF( Resource Description Framework,资源描述框架)是一种资源描述语言。大部分知识图谱使用RDF描述世界上的各种资源,并以三元组的形式保存到知识库中。RDF通过使用简单的二元关系模.

2021-03-30 10:07:08 5904

原创 tf-idf对问题的分词(去除停用词)

from operator import itemgetterfrom jieba import analyseimport jieba.posseg as psegimport pandas as pd# 引入TF-IDF关键词抽取接口tfidf = analyse.extract_tagsanalyse.set_stop_words("/Users/hechen/Desktop/Project/stop_words.txt")def inputdata(filename): .

2021-01-22 19:49:04 3925

原创 解决 “ lib64 libc so 6 version `GLIBC_2 18‘ not found (required by lib

解决 " lib64 libc so 6 version `GLIBC_2 18' not found (required by lib原文链接https://juejin.im/post/5a31f14ef265da431a433496在使用 MongDB,GLIBC_2.18 缺失,尴尬。 最简单的的方法,途中不要推出.使用本方法解决了centos 安装robo3t时无法打开并安装问题curl -O http://ftp.gnu.org/gnu/glibc/glibc-..

2020-07-23 17:46:15 1059

转载 图存储模式

图存储模式1、图存储模式的概念图存储模式来源于图论中的拓扑学。图存储模式是一种专门存储节点的边以及节点之间的连线关系的拓扑存储方法。一个图是一个数学概念,用来表示一个对象集合,包括顶点以及连接顶点的边。节点和边都存在描述参数,边是矢量,即有方向的,可能是单向或双向的。图数据库使用图作为数据模型来存储数据,完全不同于键值、列族和文档数据模型,可以高效地存储不同顶点间的关系。图数据库专门用于处理具有高度关联关系的数据,可以高效的处理实体之间的关系,比较适用于社交网络、模式识别、依赖分析、推荐系统以及

2020-07-18 17:01:12 2580

原创 文档式存储模式

文档式存储模式文档式存储模式概念文档式存储模式和键值存储模式具有一定的相似性,但其值一般为半结构化内容,需要通过某种半结构化标记语言来进行描述。例如通过JSON或XML等方式来组织其值,键值存储则一般不关心值的结构。不同的元组对应的文档结构可能完全不同。文档中还可能会嵌套文档,以及出现不定长的重复属性,因此文档式存储模式也是无法预先定义结构的。文档式存储模式优点和键值模式相比,文档式存储模式强调可以通过关键词查询文档内部的结构,而非值通过键来进行检索。此外,由于文档允许嵌套,因此可以将传统.

2020-07-15 10:19:15 779

原创 列存储模式

列存储模式列存储模式概念列存储模式也可以称为面向列的存储模式,在面向列的存储模式中,属于不同列或列族的数据存储在不同的文件中,这些文件可以分布在不同的位置上,甚至不同的节点上。相比之下,在面向行的存储模式中,数据以行的方式整合在一起,数据行中的每个字段都在一起存储。 姓名 性别 年龄 Alice 女 18 Bob 男 .

2020-07-12 09:32:19 1619

原创 键值对存储模式

键值对存储模式一、键值数据库概述键值数据库是一种非关系数据库.它使用简单的键值方法来存储数据。键值数据库将数据存储为键值对集合、其屮键作为唯一标识符。键值数据库是髙度可分区的、并且允许以其他类型的数据库无法实现的规模进行水平扩展。键值模式、列式存储模式和文档存储模式通常被称为面向聚合的数据模型。几种模式之间可能是相互配合的,没有绝对的界限。二、键值数据库的实现原理Key-Value键值对数据模型实际上是一个从键到值之间的映射.即key是査找每条数据地址的唯一关键字,value是该数.

2020-07-10 09:26:59 9544

原创 大数据存储学习笔记

大数据存储学习课程:南开大学张海威《大数据存储》资源地址:https://www.bilibili.com/video/BV1XE411x7wW1、数据库与数据仓库1.1、大数据的4大特征(4V)海量特征(Volume)多样特征(Variety):数据的来源,格式快速特征(Velocity):数据的生成,存储,分析,处理的速度远远超过计算机的处理速度价值特征(Value):价值密度的高低和数据总量的大小成反比1.2、数据库1.2.1、文件传统的数据存储方...

2020-07-09 16:45:02 620

Pr图构建源码:深度学习结束后,构建PR图并计算AUC数值

深度学习结束后,构建PR图并计算AUC数值

2022-05-26

30名学生英语成绩的平均分,最高分,最低分(数组)

直接支持运行 任何c编译软件均可 代吗已经经过调试不许任何改动 直接支持运行 任何c编译软件均可 代吗已经经过调试不许任何改动 直接支持运行 任何c编译软件均可 代吗已经经过调试不许任何改动 直接支持运行 任何c编译软件均可 代吗已经经过调试不许任何改动

2019-01-14

Eclipse教程

eclips郑如滨使用教程免费分享 有助于更快的了解软件和使用

2018-05-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除