(整理) 爬虫入门教程一、二、三、(第二节有待补充)
爬虫(一抓取网页的含义和URL构成)
URI(universal resource identifier):通用资源标识符。用于对web上每种可用资源定位。
URI的组成:
1.访问资源的命名机制。
2.存放资源的主机名
3.资源自身的名称,由路径表示(注意这部分通常会被处理,如显示的事html1223但却被存在路径html40路径下)
URL(Uniform Resourced Lo
转载
2013-11-20 22:07:50 ·
883 阅读 ·
0 评论