Python抓取分享页面的源代码示例

最新推荐文章于 2024-11-02 16:28:26 发布

lmr廖

最新推荐文章于 2024-11-02 16:28:26 发布

阅读量92

点赞数

文章标签： python safari 开发语言

本文链接：https://blog.csdn.net/lmrylll/article/details/131961852

版权

本文章是关于利用Python方法来抓取某网站分享页面中的源码方法示例。需要大家注意的是Python抓取分享页面的源代码示例，是要在运行时导入BeautifulSoup.py文件后才可以使用。

Python抓取分享页面的源代码示例，需要用到python urllib2模块方法，及BeautifulSoup模块。

源码如下：


#coding:utf-8
import urllib2
from BeautifulSoup import BeautifulSoup
 
'''
www.iplaypy.com
'''
#define
def readPage(Url):
    page = urllib2.urlopen(Url).read()
    pageContent = BeautifulSoup(page)
    OSC_Content = pageContent.find("div",{'id':'OSC_Content'})
    preHandleCode = OSC_Content.find('pre').next
    print preHandleCode
     
 
'''
页面的url需指定
''' 
#call  
readPage('http://www.xxxxxx.net/code/snippet_580365_11857')

这里的目标网站已经隐藏，大家可针对自己要抓取的目标站，参考本python源码适当修改。