用Mathematica爬取我的百度经验目录

最新推荐文章于 2021-04-05 10:44:16 发布

Happy画板

最新推荐文章于 2021-04-05 10:44:16 发布

阅读量431

点赞数

分类专栏： Mathematica 文章标签： mathematica 爬虫

本文链接：https://blog.csdn.net/qq_34040902/article/details/78492606

版权

Mathematica 专栏收录该内容

34 篇文章 0 订阅

订阅专栏

这里只爬取前10页的内容：

urlss = StringJoin[
     "http://jingyan.baidu.com/user/npublic/?uid=\
d1b612bceb0dc22ba8ffe137&pn=", ToString@#] & /@ Range[0, 602, 7];
urls = Flatten[
   Table[StringCases[URLRead[urlss[[n]], "Body"], 
     "<a href=\"/article/" ~~ Shortest[x__] ~~ "\" title=" :> x], {n, 
     1, 10}]];
网址 = (StringJoin["https://jingyan.baidu.com/article/", #] & /@ 
    Drop[urls, {2, -1, 2}]);
标题 = Flatten[
   Table[StringCases[URLRead[urlss[[n]], "Body"], 
     ".html\" title=\"" ~~ Shortest[x__] ~~ "\"" :> x], {n, 1, 10}]];
Grid[Transpose[{标题, 网址}], Frame -> {All, False}, Alignment -> Right]

运行结果如下：
这里写图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Happy画板

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
用Mathematica爬取我的百度经验目录

这里只爬取前10页的内容：urlss = StringJoin[ "http://jingyan.baidu.com/user/npublic/?uid=\d1b612bceb0dc22ba8ffe137&pn=", ToString@#] & /@ Range[0, 602, 7];urls = Flatten[ Table[StringCases[URLRead[urlss[
复制链接

扫一扫