一、提出下面疑问前我是先这样假设的:
1、豆瓣加盟网店不会向豆瓣提供任何数据库信息,即豆瓣没有官方提供的数据库文件。
2、加盟网站没有对外开放相关API或webservice。
3、豆瓣应该没有那么傻一条一条记录人工录入。
二、疑问?
先打开这个网址:http://www.douban.com/subject/3537590/buylinks,对着看下面问题,并可亲自测试验证我的问题。
1、通过浏览多数网页分析可知豆瓣加盟的图书网店不多,为固定几个店,所以网站列表LOGO和名称豆瓣可以自己建库存储,当然因为数量不多也可以用文本文件记录,比如XML文档。
2、另外发现一个问题是,豆瓣列表里的价格(非定价)不一定与对应加盟店统一,非即时更新的webservice。还有不是每本书都有那么多网店列表的,即有些书某个加盟店没有卖,这个加盟店就不会出现在列表中。
3、链向网店的地址没有包含图书的ISBN号,豆瓣是如何准确找到两者对应关系的。打个比方说如果数据是机器抓取的,不会抓错吗?
中/英文:
<script type="text/javascript"> </script>