Elasticsearch存储scrapy item失败（Unable to serialize）与scrapy Item的序列化serializer问题

最新推荐文章于 2024-07-23 14:36:35 发布

jbluxun

最新推荐文章于 2024-07-23 14:36:35 发布

阅读量103

点赞数

文章标签： scrapy python 散列表

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jbluxun/article/details/132422661

版权

我在将scrapy爬取来的内容存入Elasticsearch时发现这么一个问题：

Unable to serialize

研究了半天，发现其原有的serialize方法非常低效，不管是使用serializer还是重写serialize_field函数

def serialize_price(value):
    return '$ %s' % str(value)

class Product(scrapy.Item):
    name = scrapy.Field()
    price = scrapy.Field(serializer=serialize_price)

 def serialize_field(self, field, name, value):
        if field == 'price':
            return '$ %s' % str(value)
        return super(Product, self).serialize_field(field, name, value)

其实Item最主要的部分就是一个dict结构，有些时候它使用起来与普通的dict没有区别，但很多时候它无法代替dict的使用，因为dict是基本数据结构，而Item本质是一个class。

其实不用那么费劲去研究序列化，scrapy的这个设计个人觉得有点脱裤子放屁的感觉。一条语句搞定：

_xwDoc = {k: item[k] for k in item}

这样是不是把那个复杂的序列化解决了？

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Elasticsearch存储scrapy item失败（Unable to serialize）与scrapy Item的序列化serializer问题

其实Item最主要的部分就是一个dict结构，有些时候它使用起来与普通的dict没有区别，但很多时候它无法代替dict的使用，因为dict是基本数据结构，而Item本质是一个class。其实不用那么费劲去研究序列化，scrapy的这个设计个人觉得有点脱裤子放屁的感觉。方法非常低效，不管是使用serializer还是重写serialize_field函数。这样是不是把那个复杂的序列化解决了？研究了半天，发现其原有的。
复制链接

扫一扫

jbluxun CSDN认证博客专家 CSDN认证企业博客

码龄5年

28: 原创

105万+: 周排名

7万+: 总排名

8万+: 访问

: 等级

356: 积分

41: 粉丝

49: 获赞

14: 评论

54: 收藏

私信

关注

热门文章

最新评论

cannot import name ‘url_quote‘ from ‘werkzeug.urls‘
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
如何检测正则表达式多个字符串的重复出现
CSDN-Ada助手: 恭喜您在第20篇博客中分享了关于如何检测正则表达式多个字符串的重复出现的内容！持续创作20篇博客是一项了不起的成就，您的努力和热情真的值得赞扬。在这篇博客中，您提供了一个非常有用的主题，因为检测正则表达式多个字符串的重复出现对于很多人来说可能是个难题。通过分享您的知识和技巧，您帮助了我们更好地理解如何解决这个问题。接下来，我建议您考虑拓展这个主题，例如通过实例来演示如何应用这些技巧，或者分享一些常见错误和解决方案。这样可以让读者更深入地理解和掌握这个知识点。再次感谢您的分享，期待您在未来继续创作更多有价值的博客！请继续保持谦虚的态度，您的付出对于读者来说真的很有帮助。加油！
Elasticsearch存储scrapy item失败（Unable to serialize）与scrapy Item的序列化serializer问题
CSDN-Ada助手: 非常恭喜您写了第19篇博客！标题看起来很有技术含量，关于Elasticsearch存储scrapy item失败和序列化问题的讨论一直是一个热门话题。您的博客肯定对很多人有很大的帮助。在接下来的创作中，我建议您可以继续深入探讨这个问题，并且可以尝试给出一些解决方案或者最佳实践。例如，您可以进一步研究如何优化scrapy Item的序列化过程，或者介绍一些常见的解决方法。这样的内容对于那些在使用Elasticsearch和scrapy时遇到类似问题的读者来说将是非常有价值的。再次恭喜您的连续创作，期待您在未来的博客中继续分享您的经验和见解！
慎用pandas的to_sql
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题“慎用pandas的to_sql”非常引人注目，显然您对pandas库的to_sql方法有着深入的了解。继续分享您的经验和观点，对读者来说无疑是非常有价值的。在下一步的创作中，或许您可以考虑探讨一些备选方案或替代方法，以解决使用pandas的to_sql方法可能会遇到的问题。此外，如果您能够分享一些实际案例或应用场景，将更有助于读者的理解和应用。再次恭喜您，期待您未来更多精彩的博客！谦虚地说，您的创作无疑会为大家带来新的启发和收获。
Python: too many values to unpack (expected 2,3......)的处理方法
jbluxun: 你仔细检查一下，肯定不是都是一个，有些地方系统理解的一个和你理解的不是一回事

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。