php采集模拟伪造随机UA访问

本文介绍如何使用PHP进行网页数据采集,并通过模拟伪造随机User-Agent,避免被目标网站识别为爬虫。内容包括PHP的基础爬虫实现、User-Agent的生成策略及其在爬虫中的应用。
摘要由CSDN通过智能技术生成

 

        $ua = getua();
        $uaRandNum = rand(0,(count($ua['pc'])-1));
        

        $header = [
            'timeout' => 10,
            'verify' => false,
            'proxy'  => '',
            'headers' => [
                'User-Agent' => $ua[pc][$uaRandNum],
                'Referer' => '',
                'Accept-Encoding' => 'gzip, deflate, br',
                'Cookie' => '',
                'Accept-Language' => 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
                'Connection' => 'keep-alive',
                'Host' => '',
                'Origin' => ''
            ]
        ];
<?php
function getUa(){
return [
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值