python常见问题1

最新推荐文章于 2024-06-15 06:34:43 发布

有憨憨的皮皮

最新推荐文章于 2024-06-15 06:34:43 发布

阅读量75

点赞数

文章标签：大数据

本文链接：https://blog.csdn.net/qq_51474032/article/details/111460907

版权

import BookItem
def parse(self, response, **kwargs):
tables=response.xpath(’//table’)
for t in tables:
tit=t.css(‘div.pl2 a::attr(title)’).extract()[0]
pu=t.css(‘p.pl::text’).extract()[0]
pu=pu.split(’/’)[-3].strip()

items

class BookItem(scrapy.Item):
file=open(‘result.txt’,‘a+’,encoding=‘utf-8’)
file.write(item[‘title’]+’,’+item[‘pub’]+’\n’) return item

读取文件

df=pd.read_csv(‘result.txt’,names=[‘title’,‘pub’])
result=df[‘pub’].value_counts().head()
print(result)
plt.pie(result,labels=result.index,autopct=’%3.1f%%’)
plt.show()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

有憨憨的皮皮

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python常见问题1

实训考题：根据豆瓣读书top250,根据出版社对书籍数量分类，绘制饼图一、爬虫–scrapy1.搭建环境2.加载scrapy框架3. setting配置4.spider编写测试5. 获取数据（书名+出版社)import scrapyimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltterminal 终端实现cd … # 跳转到上一层目录scrapy startproject booktop #
复制链接

扫一扫