Python爬取百度贴吧标题

# -*- coding: utf-8 -*-
"""
Created on Sun Nov  4 10:22:07 2018

@author: wangf
"""

from urllib.request import urlopen
import codecs
from bs4 import BeautifulSoup
i = 0
f = codecs.open("douban.txt", "w","utf-8")
while i< 50:
    a = "http://tieba.baidu.com/f?ie=utf-8&kw=%E4%B8%AD%E5%8C%97%E5%A4%A7%E5%AD%A6%E5%90%A7&fr=search"
    i+=50
    z = (i/50)
    print("第"+ str(z) + "页")
    html = urlopen(a)
    bsObj = BeautifulSoup(html, "html.parser")
    for links in bsObj.findAll("a", {"class": "j_th_tit"}):
        print(links.attrs["href"] + "  " + links.text)
        f.write(links.text+"+++"+"\n")
f.close()

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值