问题描述:
图片url能打开,下载后图片格式错误,无法打开
前置条件:
start_urls=['http://e.dangdang.com/list-ZTXYTL-dd_sale-0-1.html']
定位分析:
查看json数据:
{ 'src': 'http://img60.ddimg.cn/digital/product/92/60/1901109260_ii_cover.jpg?version=ee5ae64e-c62d-4791-8776-d9084666e787', 'title': '东野圭吾:悲剧人偶'}
{
'src': 'http://img62.ddimg.cn/digital/product/96/64/1901319664_ii_cover.jpg?version=fc5af22c-73db-43ca-9a9c-d43eab9c1d97', 'title': '500个目击者:绝对不在场证明2(短篇推理之神大山诚一郎全新作品!用500句真话,编出一句天衣无缝的谎言!)(读客悬疑文库)' }
对比src都能打开,title含特殊字符,英文冒号需转换为中文冒号
解决办法:
name = item.get('title').replace(':',':')