python 将百度搜索风云榜的关键内容提取并写入txt文件和读取验证

 

# -*- coding:UTF-8 -*-
from bs4 import BeautifulSoup
import requests,sys
import codecs

##今日娱乐名人排行榜--百度搜索风云榜  http://top.baidu.com/buzz?b=618&fr=topindex
target='http://top.baidu.com/buzz?b=618&fr=topindex'

req=requests.get(url=target)
##很重要,视你得到的网页编码
req.encoding='gb2312'

##审查元素后找到人名所在的div
html=req.text
bf=BeautifulSoup(html)
texts=bf.find_all('a',class_='list-title')

##创建或打开要写入的文件
f = codecs.open("name.txt",'w','utf-8') 

##将娱乐名人排行榜的内容存入文件
for text in texts:
##    print(text.string)
    f.write(str(text.string+'\r\n')) 
f.close()


##读取文件验证写入的内容
file =  codecs.open('name.txt','r','utf-8')
lines = file.readlines()
names=[]
for line in lines:
    names.append(line.strip('\r\n'))

print(names) #2.x请将此行改为 print names

 

 

 

结果

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值