mathematica抓取网页

最新推荐文章于 2020-05-09 17:38:50 发布

L_Aster

最新推荐文章于 2020-05-09 17:38:50 发布

阅读量2.1k

点赞数 2

分类专栏： Mathematica

本文链接：https://blog.csdn.net/gl486546/article/details/76855151

版权

Mathematica 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一个简易的获取网页.nb程序

list = List[];
url = "http://blog.csdn.net/gl486546/article/category/6389727/";
catchPageElem[n_] := Block[{xml, len, d, i, temp},
  xml = Import[url <> ToString[n], "XMLObject"];
  d = Cases[xml,
    XMLElement[
      "span", {"class" -> "link_title"}, {XMLElement[
        "a", {"shape" -> "rect", 
         "href" -> 
          href_}, {title_}], __}] :> {"http://blog.csdn.net" <> href, 
      StringTrim[title]}, {0, Infinity}];
  len = Length[d];
  Do[AppendTo[list, d[[i]]], {i, 1, len}]
  ]
Do[catchPageElem[i], {i, 1, 13}];
list