- 博客(1)
- 资源 (2)
- 收藏
- 关注
原创 Python爬虫(一)爬虫的原理
在输入网址后,你便可以在网页中看见各式各样的内容,有图片、视频及文本等。这是因为输入网址后DNS服务器寻找服务器主机,并且向它发送请求,服务器接收请求后解析并作出响应,将结果返回给浏览器,浏览器再将结果进行解析,这便是我们在网页中看到的内容。因此,爬虫的基本流程如下。 爬虫的基本流程 (1)发送请求 通过HTTP向站点发送Request请求,请求中包含header等信息。 (2)获...
2018-07-25 10:13:24 2339
WN18数据集
Wordnet是一个词典。每个词语(word)可能有多个不同的语义,对应不同的sense。而每个不同的语义(sense)又可能对应多个词,如topic和subject在某些情况下是同义的,一个sense中的多个消除了多义性的词语叫做lemma。,WordNet子集WN18
2018-03-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人