python源码提取_【Python】Python抓取分享页面的源代码示例

本文章是关于利用Python方法来抓取某网站分享页面中的源码方法示例。需要大家注意的是Python抓取分享页面的源代码示例,是要在运行时导入BeautifulSoup.py文件后才可以使用。

Python抓取分享页面的源代码示例,需要用到python urllib2模块方法,及BeautifulSoup模块。

源码如下:

#coding:utf-8

import urllib2

from BeautifulSoup import BeautifulSoup

'''

www.iplaypy.com

'''

#define

def readPage(Url):

page = urllib2.urlopen(Url).read()

pageContent = BeautifulSoup(page)

OSC_Content = pageContent.find("div",{'id':'OSC_Content'})

preHandleCode = OSC_Content.find('pre').next

print preHandleCode

'''

页面的url需指定

'''

#call

readPage('http://www.xxxxxx.net/code/snippet_580365_11857')

这里的目标网站已经隐藏,大家可针对自己要抓取的目标站,参考本python源码适当修改。

大家在学python的时候肯定会遇到很多难题,以及对于新技术的追求,这里推荐一下我们的Python学习扣qun:784758214,这里是python学习者聚集地!!同时,自己是一名高级python开发工程师,从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!每日分享一些学习的方法和需要注意的小细节

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值