博客园首页登陆,获取HTML文档

import re
import cookielib
import urllib
import urllib2

def printDelimiter():  #打印分割线
    print '-'*80

printDelimiter()
print '[preparation] using cookiejar & HTTPCookieProcessor to antomatically handle cookies'
cj=cookielib.CookieJar()   #新建CookieJar
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))   #新建opener,HTTPCookieProcessor操作CookieJar
urllib2.install_opener(opener)   #安装opener

printDelimiter()
print '[step1] to get cookie'
mainUrl='http://www.cnblogs.com/'   #博客园主页URL
resp=urllib2.urlopen(mainUrl)     #打开URL
for index,cookie in enumerate(cj):      #枚举方式返回cookie的值
    print '[',index,']',cookie

printDelimiter()
print '[setp2] emulate login Cnblogs'
loginUrl='http://passport.cnblogs.com/login.aspx?ReturnUrl=http%3a%2f%2fwww.cnblogs.com%2f'  #接收用户名密码的URL
postDict={                #封装Post请求的包体数据
    '__EVENTTARGET=':'',
    '__EVENTARGUMENT':'',
    '__VIEWSTATE':'%2FwEPDwULLTE1MzYzODg2NzZkGAEFHl9fQ29udHJvbHNSZXF1aXJlUG9zdEJhY2tLZXlfXxYBBQtjaGtSZW1lbWJlcm1QYDyKKI9af4b67Mzq2xFaL9Bt',
    'tbUserName':'XXXXXXXXXX',
    'tbPassword':'XXXXXXXXXX',
    'btnLogin':'%E7%99%BB++%E5%BD%95&txtReturnUrl=http%3A%2F%2Fwww.cnblogs.com%2F',
    }
postData=urllib.urlencode(postDict)        #对Post请求的包体进行编码
req=urllib2.Request(loginUrl,postData)       #向URL发送Post请求包体
req.add_header('Content-Type','application/x-www-form-urlencoded')        #添加头部信息
resq=urllib2.urlopen(req)      #打开URL
resqHtml=resq.read()        #HTML格式打开返回信息
print resqHtml      #打印HTML内容

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html xmlns="http://www.w3.org/1999/xhtml">

<head><meta http-equiv="Content-Type" content="text/html; charset=utf-8" /><title>

 错误提示 - 博客园用户中心

</title><link href="http://common.cnblogs.com/css/reset.css" type="text/css" rel="Stylesheet" /><link rel="stylesheet" type="text/css" href="/css/screen_base.css?id=20140305" />

<link rel="stylesheet" type="text/css" href="/css/passport.css" />

</head>

<body>

    <form name="aspnetForm" method="post" action="error.aspx?aspxerrorpath=%2flogin.aspx" id="aspnetForm">

<input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value="/wEPDwUJNDMyNDU0NjAzD2QWAmYPZBYCAgMPZBYCZg9kFgICAQ8WAh4EVGV4dAUM55So5oi35Lit5b+DZGTySzz2XfoMc0P93mYlvEKj6lgIDg==" />

 

    <div id="hd">

        <div id="hd_nav">&laquo;<a class="gray" href="http://www.cnblogs.com" title="程序员的网上家园">博客园</a>          

        </div>

        <div id="login_area"> 

        <script type="text/javascript" src="/scriptCurrentUserInfo.aspx"></script>     

        </div>              

    </div>

    <div id="wrap">

      <div id="header">

         

 

<div class="header_div">

 <div class="logo">

  <a href="http://www.cnblogs.com"><img src="http://static.cnblogs.com/images/logo.gif" alt="logo" width="180" height="68"/></a>

     </div>

 <div class="banner">

 </div>

</div>

<div class="mainmenu">

 <ul id="navlist_main">

  <li>&nbsp;&nbsp;&nbsp;&nbsp;</li> 

  <li><a href="/login.aspx">登 录</a></li> 

  <li><a href="/register.aspx" class="current">用户中心</a></li>       

  <li><a href="/BlogApply.aspx">申请博客</a></li> 

  <li><a href="/GetUsername.aspx">找回用户名</a></li>

  <li><a href="/GetMyPassword.aspx">重置密码</a></li>

 </ul>

</div>

 

 

 

        </div>

       <div id="sideleft">

       

<h3 class="topic_title">错误提示</h3>

<div class="main">

抱歉!发生了错误!请与管理员<a href="http://www.cnblogs.com/ContactUs.aspx">联系</a>。

</div>

<div class="return_block">

<a href="http://www.cnblogs.com" class="lnk_btn">返回网站首页</a>

</div>

 

        </div>

        <div id="sideright">

      

 

        </div>

        <div class="clear"></div>

        <div id="footer">

        <a href="http://www.cnblogs.com/AboutUS.aspx">关于博客园</a><a href="http://www.cnblogs.com/ContactUs.aspx">联系我们</a><a href="http://www.cnblogs.com/ad.aspx">广告服务</a><span>2004-2014</span><a href="http://www.cnblogs.com">博客园</a>版权所有 保留所有权利

        </div>

    </div>

    </form>

</body>

</html>



    

转载于:https://www.cnblogs.com/june2014/p/3623468.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
web前端开发文档规范是指为了促进团队的工作效率和开发质量,以及方便后续维护和协作的需求,制定的一套文档编写与管理规范。以下是可以下载web前端开发文档规范的步骤和方法。 首先,可以通过互联网搜索相关的文档规范模板,如HTML、CSS、JavaScript等各种规范文档模板。可以在一些知名社区或技术论坛上找到一些优秀的前端开发文档规范模板,例如GitHub、博客园、掘金等。可以通过搜索引擎输入关键词,如“前端开发文档规范模板”来获取相关资源下载。 其次,一些知名的前端开发社区和网站也会提供完整的前端开发文档规范,并提供下载链接。例如MDN(Mozilla Developer Network)等网站提供了详细的HTML、CSS和JavaScript等的文档规范。这些规范是由专业的前端开发者和权威机构制定的,可以作为参考下载和学习。 另外,还可以通过加入一些前端开发相关的社群、群组和论坛,与其他前端开发者进行交流和分享。在这些社群中,一些经验丰富的前端开发者可能会分享他们自己制定的规范文档,这些文档更加贴近实际工作,具有很高的参考价值。可以与他们取得联系,互相交流和学习。 需要强调的是,无论下载哪种类型的前端开发文档规范,都要根据实际项目需求进行适当的调整和修改。每个项目都有自己的特点和需求,所以需要将规范文档与实际项目需求相结合,制定出符合实际情况的文档规范。通过下载和使用规范文档,能够提高前端开发的效率和质量,同时也方便日后的维护和协作工作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值