年初开始的电脑制作活动终于到了国赛环节,今年我们学校有一位同学的程序进了广东省赛,最后十分有幸止步于省赛,我个人觉得非常可惜。因为他设计的游戏真的贼好玩,于是我就特别好奇,能上国赛的作品是啥样的。抱着这样的好奇心,我打开了中国信息技术教育界的权威网站
《全国中小学电脑制作活动》官网
上面就是今年的国赛获奖作品
往年的作品现在只能看到一个标题
今年的作品公示能直接下载作品源文件
但是如果要一个一个去点击下载
就特别浪费时间
于是写了一个简单的爬虫
抓取所有作品的下载链接
再用下载器批量下载
下面是代码成长的过程
仅做记录(代码太菜)
打开编辑器就敲下了这几行代码
结果发现获取到的网页源码里
根本找不到作品名等信息
比浏览器里开发者工具看到的网页少了最重要的那部分
还是跑到浏览器里用开发者工具定位查一下
结果发现这堆东西都放在这个叫iframe的标签下面