scrapy爬虫框架 (4. item的介绍和使用）

最新推荐文章于 2021-06-22 14:57:02 发布

遨游的菜鸡

最新推荐文章于 2021-06-22 14:57:02 发布

阅读量349

点赞数

分类专栏： scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34405401/article/details/104101226

版权

scrapy 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.item介绍

在items.py的函数里定义好我们预先需要的字段，并且引用此py文件的函数后，只能使用定义好的字段

2.item使用

2.1在items.py文件里定义预先使用的字段

items.py可以有多个函数，每个函数定义不同爬虫的预先使用字段，而在pipelines处理数据时得判断是哪个函数下的字段
. 在这里插入图片描述

2.2在爬虫文件里引用该类，注意爬虫文件里出现的字段只能是该类定义过的

先爬取传智播客的教师数据
在这里插入图片描述
在爬取腾讯课堂的数据

2.3在pipelines里处理数据并显示

在这里插入图片描述
if isinstance（数据，数据类）：这个语句的作用是对不同爬虫爬取的信息进行处理

2.4结果显示

运行爬取教师信息爬虫，结果为
在这里插入图片描述
运行爬取腾讯课堂爬虫，结果：

遨游的菜鸡

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

遨游的菜鸡 CSDN认证博客专家 CSDN认证企业博客

码龄9年

154: 原创

23万+: 周排名

89万+: 总排名

25万+: 访问

: 等级

2680: 积分

81: 粉丝

158: 获赞

37: 评论

761: 收藏

私信

关注

热门文章

分类专栏

python 26篇
深度学习 7篇
MySQL 4篇
paper 6篇
主动学习 4篇
pytorch 14篇
杂记 16篇
机器学习 7篇
算法与数据结构 9篇
项目实训 9篇
c++ 9篇
机器学习周志华(西瓜书) 11篇
前端 4篇
requests 5篇
scrapy 5篇
CS224N NLP 5篇
统计学习方法 11篇
tensorflow 12篇
kaggle 2篇

最新评论

解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 我们两个的GPU加速明显能对比出差距，我的慢很多
解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 而且我们的深度学习环境也都是一样的，cuda、cudnn、torch等环境都完全一样，为什么会出现了利用率一个为0一个为100%的两种情况呢？
解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 同样的模型，同样的电脑配置，同样的显卡驱动，为什么我的显卡利用率一直是0，显存能吃满，而别人的利用率一直是100%？
主动学习框架
境界面上的双曲线: 博主，我想请问一下，如果我们自己建立一个深度学习模型与主动学习器结合，在不断往训练集里面加新的数据的过程中，我们如何才能知道自己的深度学习模型里的参数才是最优的呢？因为单独使用深度学习的时候，我们会多次训练调参以尽量达到最优参数，但是与主动学习结合加新数据的过程中，我们并不知道自己的模型参数是不是最优的，如果在不断加新数据的过程中调参数的话，感觉前后查询数据的模型就变了（相同模型不同参数）
主动学习框架
境界面上的双曲线: 请问一下你知道结果了吗？回归模型是不是这些查询策略都不适用啊？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。