进入这个链接将允许你选择一个学期,这样做,将显示成千上万的表。我选择了一个学期后试图使用这个网址,希望能阅读HTML,但没有这样的运气。。我仍然不知道我在看什么(比如,它是一个网页,还是ASP?什么是ASP?)。如果你跟踪视频链接,你会发现如果你选择了春季学期,复制链接,并把它放到搜索栏里,它会给出一个丑陋的错误。一些SQL错误。
所以这就是我的困境。我正试图得到这些数据。。。所有这些桌子。上一篇文章,我做了一个蛮力的尝试,只需点击并拖动10分钟以上,然后粘贴到excel中。这是一种糟糕的方法,当我将excel表导入python时,它甚至没有特别有用,因为数据很难处理。非常没有条理。所以我想,嘿,为什么不用bs4刮擦呢?看起来也不那么容易,因为网址不起作用。在过滤到春季学期之后,这个URL就不起作用了,不适合你,如果你把它粘贴到python中供bs4使用。。。
所以我有点不知所措,不知道如何合理地处理这些数据。我想用bs4来刮取它,然后把它放到数据帧中以便以后操作。但是,由于它是ASP或其他任何东西,我还无法找到方法来执行此操作:\