Python3 使用beautifulsoup解析微信文章

1.微信文章内容结构分析

注:只能采集图文文章,视频、语音无法采集

1)分享相关

<meta property="og:title" content="微信分享标题" />
<meta property="og:url" content="分享链接" />
<meta property="og:image" content="分享图片url" />
<meta property="og:description" content="分享描述" />

2)文章结构

<body id="activity-detail" class="zh_CN wx_wap_page appmsg_desktop_fontsize_2  mm_appmsg discuss_tab  appmsg_skin_default appmsg_style_default "> 
<!--body的id为activity-detail-->
        <div id="js_article" class="rich_media"> 
        <!--js_article用来存储文章信息-->
            <div id="js_top_ad_area" class="top_banner"></div>
            <div class="rich_media_inner">
                <div id="page-content" class="rich_media_area_primary">
                    <div id="img-content" class="rich_media_wrp">
                        <h2 class="rich_media_title" id="activity-name"></h2>
                          <!--文章标题,id="activity-name"-->
                        <div id="meta_content" class="rich_media_meta_list">
                        <div id="js_tags" class="article-tag__list" style="display: none;" data-len="0">
                        <div class="rich_media_content " id="js_content" style="visibility: visible;">
                        <!--正文内容,id="js-content"-->
                        <div id="js_sponsor_ad_area" style="display: none;"></div>
                        <div class="read-more__area" id="js_more_read_area" style="display:none;">
                    <div id="js_tags_preview_toast" class="article-tag__error-tips" style="display: none;">预览时标签不可点</div>
    
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值