python爬取诗词名句网-三国演义,涉及知识点:xpath,requests,自动识别编码,range

页面源代码:


<!DOCTYPE html>
<html lang="zh">
<head>
    <script src="https://img.shicimingju.com/newpage/js/all.js"></script>
    <meta charset="UTF-8">
    <title>《三国演义》全集在线阅读_史书典籍_诗词名句网</title>
    <meta name="viewport" content="width=device-width,user-scalable=no" />
    <meta name="description" content="" />
    <link rel="stylesheet" href="https://img.shicimingju.com/public/css/www_v3.css">
    <link rel="stylesheet" href="https://img.shicimingju.com/public/css/font_576092_m2icqcebp7evzpvi.css">
    <script src="https://img.shicimingju.com/public/js/device.js"></script>
    <script src="https://img.shicimingju.com/public/js/jq.js"></script>
    <script src="https://img.shicimingju.com/public/js/www_v3.js"></script>
</head>
<body>
<div id="top_bar">
    <div id="top_bar_main">
        <div id="top_left">
            <a href="/"><img src="https://img.shicimingju.com/public/image/logo.png" id="logo"/></a>
            <div id="top_left_menu">
                <ul>
                    <li><a href="/">首页</a></li>
                    <li><a href="/shicimark">分类</a></li>
                    <li><a href="/category/all">作者</a></li>
                    <li><a href="/paiming">排行榜</a></li>
                    <li><a href="/cate?cate_id=4">课本古诗</a></li>
                    <li><a href="/cipai/index.html">词牌名</a></li>
                    <li><a href="/hecheng/index.html">合称</a></li>
                    <li><a href="/book/">古籍</a></li>
                </ul>
            </div>
            <div style="clear: both"></div>
        </div>
        <div id="top_right">
            <div id="input_div" style="margin-top: 20px;">
                <input type="text" name="kw" id="search_input" placeholder="" autocomplete="off" value="">
                <a href="javascript:doSearch();"><img src="https://img.shicimingju.com/public/image/web_search.png" class="www-icon"></a>
                <div style="clear: both"></div>
            </div>
            <div id="tip_result" class="card">
                <ul>
                </ul>
                <div id="tip_content">
                </div>
            </div>
        </div>
        <div style="clear: both;"></div>
    </div>
</div>

<div id="nav-top"><a href="/">主页</a><span class="nav-arrow"></span><a href="/book/index.html">史书典籍</a><span class="nav-arrow"></span><a href="/book/sidamingzhu.html">四大名著</a></div>

<div id="main">
    <div id="main_left">
        <div class="card bookmark-list">
            <h1>《三国演义》</h1>
            <div>
                                <img src="https://img.shicimingju.com/public/image/book/sanguoyanyi.jpg" class="book-img">
                                                <p>年代:元末明初</p>
                                <p>作者:罗贯中</p>
                <p class="des"> 《三国演义》中国古典四大名著之一。元末明初小说家罗贯中所著,是中国第一部长篇章回体历史演义的小说。描写了从东汉末年到西晋初年之间近100年的历史风云。全书反映了三国时代的政治军事斗争,反映了三国时代各类社会矛盾的渗透与转化,概括了这一时代的历史巨变,塑造了一批叱咤风云的英雄人物。</p>
                <div style="clear: both"></div>
            </div>
            <div>
                <form method="get" action="/book/chaxun/" style="float: right;">
                    <input type="hidden" name="book_id" value="1">
                    <input type="text" name="kw" placeholder="全文检索" autocomplete="off">
                </form>
                <div style="clear: both"></div>
            </div>
            <div class="line"></div>
            <div class="book-mulu">
                <ul>
                    <li><a href="/book/sanguoyanyi/1.html">第一回·宴桃园豪杰三结义  斩黄巾英雄首立功</a></li><li><a href="/book/sanguoyanyi/2.html">第二回·张翼德怒鞭督邮    何国舅谋诛宦竖</a></li><li><a href="/book/sanguoyanyi/3.html">第三回·议温明董卓叱丁原  馈金珠李肃说吕布</a></li><li><a href="/book/sanguoyanyi/4.html">第四回·废汉帝陈留践位    谋董贼孟德献刀</a></li><li><a href="/book/sanguoyanyi/5.html">第五回·发矫诏诸镇应曹公  破关兵三英战吕布</a></li><li><a href="/book/sanguoyanyi/6.html">第六回·焚金阙董卓行凶    匿玉玺孙坚背约</a></li><li><a href="/book/sanguoyanyi/7.html">第七回·袁绍磐河战公孙    孙坚跨江击刘表</a></li><li><a href="/book/sanguoyanyi/8.html">第八回·王司徒巧使连环计  董太师大闹凤仪亭</a></li><li><a href="/book/sanguoyanyi/9.html">第九回·除暴凶吕布助司徒  犯长安李傕听贾诩</a></li><li><a href="/book/sanguoyanyi/10.html">第一十回·勤王室马腾举义    报父仇曹操兴师</a></li><li><a href="/book/sanguoyanyi/11.html">第十一回·刘皇叔北海救孔融  吕温侯濮阳破曹操</a></li><li><a href="/book/sanguoyanyi/12.html">第十二回·陶恭祖三让徐州    曹孟德大战吕布</a></li><li><a href="/book/sanguoyanyi/13.html">第十三回·李傕郭汜大交兵  杨奉董承双救驾</a></li><li><a href="/book/sanguoyanyi/14.html">第十四回·曹孟德移驾幸许都  吕奉先乘夜袭徐郡</a></li><li><a href="/book/sanguoyanyi/15.html">第十五回·太史慈酣斗小霸王  孙伯符大战严白虎</a></li><li><a href="/book/sanguoyanyi/16.html">第十六回·吕奉先射戟辕门    曹孟德败师淯水</a></li><li><a href="/book/sanguoyanyi/17.html">第十七回·袁公路大起七军    曹孟德会合三将</a></li><li><a href="/book/sanguoyanyi/18.html">第十八回·贾文和料敌决胜    夏侯惇拔矢啖睛</a></li><li><a href="/book/sanguoyanyi/19.html">第十九回·下邳城曹操鏖兵    白门楼吕布殒命</a></li><li><a href="/book/sanguoyanyi/20.html">第二十回·曹阿瞒许田打围    董国舅内阁受诏</a></li><li><a href="/book/sanguoyanyi/21.html">第二十一回·曹操煮酒论英雄  关公赚城斩车胄</a></li><li><a href="/book/sanguoyanyi/22.html">第二十二回·袁曹各起马步三军  关张共擒王刘二将</a></li><li><a href="/book/sanguoyanyi/23.html">第二十三回·祢正平裸衣骂贼    吉太医下毒遭刑</a></li><li><a href="/book/sanguoyanyi/24.html">第二十四回·国贼行凶杀贵妃    皇叔败走投袁绍</a></li><li><a href="/book/sanguoyanyi/25.html">第二十五回·屯土山关公约三事  救白马曹操解重围</a></li><li><a href="/book/sanguoyanyi/26.html">第二十六回·袁本初败兵折将    关云长挂印封金</a></li><li><a href="/book/sanguoyanyi/27.html">第二十七回·美髯公千里走单骑  汉寿侯五关斩六将</a></li><li><a href="/book/sanguoyanyi/28.html">第二十八回·斩蔡阳兄弟释疑    会古城主臣聚义</a></li><li><a href="/book/sanguoyanyi/29.html">第二十九回·小霸王怒斩于吉    碧眼儿坐领江东</a></li><li><a href="/book/sanguoyanyi/30.html">第三十回·战官渡本初败绩  劫乌巢孟德烧粮</a></li><li><a href="/book/sanguoyanyi/31.html">第三十一回·曹操仓亭破本初    玄德荆州依刘表</a></li><li><a href="/book/sanguoyanyi/32.html">第三十二回·夺冀州袁尚争锋    决漳河许攸献计</a></li><li><a href="/book/sanguoyanyi/33.html">第三十三回·曹丕乘乱纳甄氏    郭嘉遗计定辽东</a></li><li><a href="/book/sanguoyanyi/34.html">第三十四回·蔡夫人隔屏听密语  刘皇叔跃马过檀溪</a></li><li><a href="/book/sanguoyanyi/35.html">第三十五回·玄德南漳逢隐沧    单福新野遇英主</a></li><li><a href="/book/sanguoyanyi/36.html">第三十六回·玄德用计袭樊城    元直走马荐诸葛</a></li><li><a href="/book/sanguoyanyi/37.html">第三十七回·司马徽再荐名士    刘玄德三顾草庐</a></li><li><a href="/book/sanguoyanyi/38.html">第三十八回·定三分隆中决策    战长江孙氏报仇</a></li><li><a href="/book/sanguoyanyi/39.html">第三十九回·荆州城公子三求计  博望坡军师初用兵</a></li><li><a href="/book/sanguoyanyi/40.html">第四十回·蔡夫人议献荆州    诸葛亮火烧新野</a></li><li><a href="/book/sanguoyanyi/41.html">第四十一回·刘玄德携民渡江    赵子龙单骑救主</a></li><li><a href="/book/sanguoyanyi/42.html">第四十二回·张翼德大闹长坂桥  刘豫州败走汉津口</a></li><li><a href="/book/sanguoyanyi/43.html">第四十三回·诸葛亮舌战群儒    鲁子敬力排众议</a></li><li><a href="/book/sanguoyanyi/44.html">第四十四回·孔明用智激周瑜    孙权决计破曹操</a></li><li><a href="/book/sanguoyanyi/45.html">第四十五回·三江口曹操折兵    群英会蒋干中计</a></li><li><a href="/book/sanguoyanyi/46.html">第四十六回·用奇谋孔明借箭    献密计黄盖受刑</a></li><li><a href="/book/sanguoyanyi/47.html">第四十七回·阚泽密献诈降书    庞统巧授连环计</a></li><li><a href="/book/sanguoyanyi/48.html">第四十八回·宴长江曹操赋诗    锁战船北军用武</a></li><li><a href="/book/sanguoyanyi/49.html">第四十九回·七星坛诸葛祭风    三江口周瑜纵火</a></li><li><a href="/book/sanguoyanyi/50.html">第五十回·诸葛亮智算华容    关云长义释曹操</a></li><li><a href="/book/sanguoyanyi/51.html">第五十一回·曹仁大战东吴兵    孔明一气周公瑾</a></li><li><a href="/book/sanguoyanyi/52.html">第五十二回·诸葛亮智辞鲁肃    赵子龙计取桂阳</a></li><li><a href="/book/sanguoyanyi/53.html">第五十三回·关云长义释黄汉升  孙仲谋大战张文远</a></li><li><a href="/book/sanguoyanyi/54.html">第五十四回·吴国太佛寺看新郎  刘皇叔洞房续佳偶</a></li><li><a href="/book/sanguoyanyi/55.html">第五十五回·玄德智激孙夫人    孔明二气周公瑾</a></li><li><a href="/book/sanguoyanyi/56.html">第五十六回·曹操大宴铜雀台    孔明三气周公瑾</a></li><li><a href="/book/sanguoy
  • 20
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以给你讲解一下如何使用 Python 爬取豆瓣音乐信息。 首先需要安装相关的库,比如 requests、lxml 和 xpath。可以通过 pip install requests lxml 命令来安装。 接下来,通过 requests 库向豆瓣音乐的页发送请求,并使用 lxml 库来解析页内容。代码如下: ```python import requests from lxml import etree url = 'https://music.douban.com/top250' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) html = response.text ``` 接下来,我们可以使用 lxml 库中的 etree 对象来解析 HTML 内容。这里我们使用 xpath 来获取我们需要的信息,比如歌曲名、演唱者和评分等。代码如下: ```python tree = etree.HTML(html) songs = tree.xpath('//tr[@class="item"]/td[2]/div/a/text()') # 歌曲名 singers = tree.xpath('//tr[@class="item"]/td[2]/div[@class="pl"]/text()') # 演唱者 ratings = tree.xpath('//tr[@class="item"]/td[2]/div[@class="star clearfix"]/span[@class="rating_num"]/text()') # 评分 ``` 最后,我们可以将获取到的信息输出或保存到文件中。完整代码如下: ```python import requests from lxml import etree url = 'https://music.douban.com/top250' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) html = response.text tree = etree.HTML(html) songs = tree.xpath('//tr[@class="item"]/td[2]/div/a/text()') # 歌曲名 singers = tree.xpath('//tr[@class="item"]/td[2]/div[@class="pl"]/text()') # 演唱者 ratings = tree.xpath('//tr[@class="item"]/td[2]/div[@class="star clearfix"]/span[@class="rating_num"]/text()') # 评分 for i in range(len(songs)): print(f'{i+1}. {songs[i]} - {singers[i].strip()} - {ratings[i]}') ``` 这样就可以在控制台输出豆瓣音乐 top250 的信息了。如果想要将信息保存到文件中,可以使用 Python 的文件操作来实现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值