php/awk 处理csv 使用 SplFileObject 操作文件

取第5列,去掉开头结尾的引号,匹配以http://, https://, ftp://开头的行

 

* awk

 awk -F"," 'str=gsub(/(^\"*)|(\"*$)/,"",$5) {if($5~/(^http(s)?:\/\/)|(^ftp:\/\/)/) print $5}'  \
 ../data/t_video.csv > ../data/urls.csv

  

* php

<?php
// awk -F"," 'str=gsub(/(^\"*)|(\"*$)/,"",$5) {if($5~/(^http(s)?:\/\/)|(^ftp:\/\/)/) print $5}' \
// ../data/t_video.csv > ../data/urls.csv

$in = new SplFileObject('../data/t_video.csv', 'rb');

if (!$in) {
    throw new Exception('open file for read failed!');
}

$out = new SplFileObject('../data/urls.csv', 'w');
if (!$out) {
    throw new Exception('open file for write failed!');
}

$a = []; $videoURL = '';
foreach ($in as $lineNum => $line) {
    $a = explode(',', $line);
    if (!isset($a[4])) {
        continue;
    }
    $videoURL = $a[4];
    if (7<strlen($videoURL)) {
        $videoURL = trim($videoURL, "\"");
        if (preg_match('/^[http:\/\/|ftp:\/\/|https:\/\/]/', $videoURL)) {
            $out->fwrite($videoURL.PHP_EOL);
        }
    }
}

  

input:

../data/t_video.csv

"9","其他","ULTIMATE PHOTO GUIDE",NULL,"http://118.190.209.209/media/mp4/1.mp4","http://118.190.209.209/media/png/1.png","ULTIMATE PHOTO GUIDE"
"10","其他","THE VERGE",NULL,"http://118.190.209.209/media/mp4/2.mp4","http://118.190.209.209/media/png/2.the_verge.png","THE VERGE"
"11","其他","Microsoft Power BI",NULL,"http://118.190.209.209/media/mp4/3.mp4","http://118.190.209.209/media/png/3.png","Microsoft Power BI"

  

output:

../data/url.csv

http://118.190.209.209/media/mp4/1.mp4
http://118.190.209.209/media/mp4/2.mp4
http://118.190.209.209/media/mp4/3.mp4

  

SplFileObject

http://php.net/manual/en/class.splfileobject.php

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fareast_mzh

打赏个金币

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值