python界面都是英文吗_python为什么最近很流行?各种应用文档全是英文的吗?

eechen

2015/08/31 09:54

回复 @木兰宿莽 :

用PHP抓网页一点都不难好不,DOM操作无非就是像jQuery那样写好选择器.

比如,使用PHP DOM操作库simple_html_dom.php,快速获取PHP官网文章标题/内容/时间:

<?php

require dirname(__FILE__).'/simple_html_dom.php';

$html = file_get_html('http://php.net/');

$news = array();

foreach($html->find('article.newsentry') as $article) {

$item['time'] = trim($article->find('time', 0)->plaintext);

$item['title'] = trim($article->find('h2.newstitle', 0)->plaintext);

$item['content'] = trim($article->find('div.newscontent', 0)->plaintext);

$news[] = $item;

}

print_r($news);

又比如利用PHP pthreads多线程高效抓取:

class WebRequest extends Thread {

public $url;

public $data;

public function __construct($url){

$this->url = $url;

}

public function run() {

$response = file_get_contents($this->url);

if ($response) {

$this->data = array($response);

}

}

}

$request = new WebRequest("http://pthreads.org");

$request->start();

$request->join();

var_dump($request->data);

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值