豆瓣网提供给用户的图书网站列表是如何实现的?

一、提出下面疑问前我是先这样假设的:

1、豆瓣加盟网店不会向豆瓣提供任何数据库信息,即豆瓣没有官方提供的数据库文件。

2、加盟网站没有对外开放相关API或webservice。

3、豆瓣应该没有那么傻一条一条记录人工录入。

二、疑问?

先打开这个网址:http://www.douban.com/subject/3537590/buylinks,对着看下面问题,并可亲自测试验证我的问题。

1、通过浏览多数网页分析可知豆瓣加盟的图书网店不多,为固定几个店,所以网站列表LOGO和名称豆瓣可以自己建库存储,当然因为数量不多也可以用文本文件记录,比如XML文档。

2、另外发现一个问题是,豆瓣列表里的价格(非定价)不一定与对应加盟店统一,非即时更新的webservice。还有不是每本书都有那么多网店列表的,即有些书某个加盟店没有卖,这个加盟店就不会出现在列表中。

3、链向网店的地址没有包含图书的ISBN号,豆瓣是如何准确找到两者对应关系的。打个比方说如果数据是机器抓取的,不会抓错吗?

中/英文:

 

<script type="text/javascript"> </script>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值