统一优雅的接口
闲逛发现了YQL,它是雅虎的web service,允许你使用像SQL一样请求互联网数据:
select * from table where xxx = yyy
它把互联网服务、公共数据、网页都看作一个一个的table,你可以从里面读出数据。
有些资源(服务)还可以update delete insert
YQL支持哪些table呢,进入这里 http://developer.yahoo.com/yql/console/
敲入show tables,点击【测试】,下面便会出现一堆table,
很多我目前都用不上,如果能指定返回数据的语言,就更实用了。
抓取网页数据
我们先拿html来玩玩吧,query的格式如下:
select * from html where url="www.site.com/page.html" and xpath="..."
忘了说YQL的接口地址,下面是PHP代码
$url = 'http://www.site.com';
$xpath = '//*[@id="xx"]';
$query = "select * from html where url = '{$url}' and xpat