信息采集实现原理
一个网站去采集另外一个网站的信息,可以通过如下几种方式实现:
①
file_get_contents();
②
fsockopen()
③
curl
方式
等等
(
也还有其他方式
)
采集本质原理:
php
语言可以允许跨域请求其他网站网址,并获得网址对应的源代码内容。
PHP里做一般的获取内容时,用自带的file_get_contents()函数基本就足够了。
如果是遇到需要登录的页面,
还是需要curl。
注意:要在PHP.ini中对curl的extension前面的分号去掉,
file_get_contents()
还要把openssl的扩展同样打开
5.1 file_get_contents()
file_get_contents()
函数实现的作用:
①
打开本地服务器的文件
②
可以向其他网络地址发起请求
采集的效果: