数据抓取
风中自有疯中人
这个作者很懒,什么都没留下…
展开
-
正则达式抓取所需数据
preg_match_all( [\x{4e00}-\x{9fa5}]*)/u', $str, $arr); 用此语句抓取文本中的中文字符时结果为乱码, 原因是编码问题引起, 在运行前需声明编码格式, header('content-type:text/html;charset=utf-8'), 并且要加修饰符u. 这样一来似乎用 .* 也能正常得到中文字符. 注意匹配换行符 \n , ...原创 2018-08-04 11:17:21 · 228 阅读 · 0 评论 -
数据抓取要点记录
1.有些网站需要附带cookie信息才会返回数据. 2.先分析再实现.原创 2019-02-16 17:45:44 · 215 阅读 · 0 评论