自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (2)
  • 收藏
  • 关注

原创 Python爬虫(一)爬虫的原理

在输入网址后,你便可以在网页中看见各式各样的内容,有图片、视频及文本等。这是因为输入网址后DNS服务器寻找服务器主机,并且向它发送请求,服务器接收请求后解析并作出响应,将结果返回给浏览器,浏览器再将结果进行解析,这便是我们在网页中看到的内容。因此,爬虫的基本流程如下。 爬虫的基本流程 (1)发送请求     通过HTTP向站点发送Request请求,请求中包含header等信息。 (2)获...

2018-07-25 10:13:24 2339

Freebase-FB15k

Freebase是大型的存放结构化数据的仓库,它通过群体共建。FB15k是Freebase的子集。

2018-03-19

WN18数据集

Wordnet是一个词典。每个词语(word)可能有多个不同的语义,对应不同的sense。而每个不同的语义(sense)又可能对应多个词,如topic和subject在某些情况下是同义的,一个sense中的多个消除了多义性的词语叫做lemma。,WordNet子集WN18

2018-03-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除