爬虫过程中遇到的坑

1.当你爬取url中含有中文字符时会出现编码错误问题。

# -*- encoding= "utf-8" -*-
import urllib.request
import re
# import sys
# import codecs
# sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())
# fh=open("E:/pycharmprojects/111.txt",'w')
#page=(num-1)*20
for i in range(1,11):
    url="https://book.douban.com/tag/成长?start="+str((i-1)*20)
    data=urllib.request.urlopen(url).read().decode("utf-8")
    pat='title="(.*?)"'
    rst=re.compile(pat).findall(data)
    for j in range(0,len(rst)):
        print(rst[j])

显示错误:

UnicodeEncodeError: 'ascii' codec can't encode characters in position 9-10: ordinal not in range(128)

解决方法:
url中含有中文的需要进行转码,

keywd="成长"
keywd=urllib.request.quote(keywd)
for i in range(1,11):
url="https://book.douban.com/tag/"+str(keywd)+"?start="+str((i-1)*20)
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
第1章用Director制作影片 Macromedia Director 7是一个制作多媒体的完整的环境。我们可以把它想象成画家的画布, 或者按D i r e c t o r的比喻法,把它想象成一个舞台。 我们可以用自己作品去填充这个舞台。作品的任何元素都可被称为演员(cast member或 m e m b e r)。计算机屏幕上用来演出的窗口即是舞台(s t a g e)。 D i r e c t o r的其余元素也都遵从戏剧/电影的比喻,其有些元素的名称的确非常恰当。 1.1 Director简介 先假设我们想把一幅在其他应用程序制作的图像放到D i r e c t o r。 当这幅图像被输入D i r e c t o r后,它就变成了一个演员(cast member)。演员表窗口(c a s t window)显示着一个清单,其包含所有演员。这个清单被称为演员表库( cast library),或简 称为演员表(c a s t)。演员的类型各不相同,有位图图像、文本、声音、图形等等。在本例, 我们有一幅位图图像,通常把它称作位图(b i t m a p)。 可以把这个位图放到舞台上(我将在后面详细地讲解如何操作这一步)。它将同时出现在舞 台上和剪辑室内。剪辑室(s c o r e)是一个图表,它显示着哪一个演员在何时出现在舞台上。一 瞬间称为一帧(f r a m e)。剪辑室显示着哪一个演员出现在哪一帧画面里。从舞台可以看出, 在特定的一帧画面里,每个演员在舞台上的位置。 当影片完成后,我们将只能看到舞台。演员表窗口和剪辑室窗口都只是你—D i r e c t o r影 片的制作者—所使用的工具。 s p r i t e 第一部分Director基础篇

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值