python爬虫大众点评店铺信息(字体加密)

本文介绍了如何使用Python爬虫处理大众点评店铺信息时遇到的字体加密问题。通过观察网站请求,下载字体文件并解析,对应网页中加密字符的Unicode编码,最终实现加密字符的替换,从而成功获取所需数据。提供的完整代码虽然简单,但展示了处理此类问题的基本思路。
摘要由CSDN通过智能技术生成

python爬虫大众点评店铺信息(字体加密)

在这里插入图片描述

1.观察网站
在这里插入图片描述
发现部分字体加密

2.查看请求的字体文件
在这里插入图片描述
发现请求到了两个字体文件,把他下载打开

3.在这里插入图片描述
在这里插入图片描述
这就是对应该网页每个字体的unicode,发现两个字体文件同一个字符对应的编码不一样,所以都要用上

4.观察网页源代码
在这里插入图片描述
有很多不认识的字符,但通过比较这些字符的后四位,发现刚好和字体文件对得上,接下来就可以开干了

5.(1)将字体文件里的字符搞成列表在这里插入图片描述

character = list(
        '1234567890店中美家馆小车大市公酒行国品发电金心业商司超生装园场食有新限天面工'
        '服海华水房饰城乐汽香部利子老艺花专东肉菜学福饭人百餐茶务通味所山区门药银农龙停尚安'
        '广鑫一容动南具源兴鲜记时机烤文康信果阳理锅宝达地儿衣特产西批坊州牛佳化五米修爱北养'
        '卖建材三会鸡室红站德王光名丽油院堂烧江社合星货型村自科快便日民营和活童明器烟育宾精'
        '屋经居庄石顺林尔县手厅销用好客火雅盛体旅之鞋辣作粉包楼校鱼平彩上吧保永万物教吃设医'
        '正造丰健点汤网庆技斯洗料配汇木缘加麻联卫川泰色世方寓风幼羊烫来高厂兰阿贝皮全女拉成'
        '云维贸道术运都口博河瑞宏京际路祥青镇厨培力惠连马鸿钢训影甲助窗布富牌头四多妆吉苑沙'
        '恒隆春干饼氏里二管诚制售嘉长轩杂副清计黄讯太鸭号街交与叉附近层旁对巷栋环省桥湖段乡'
        '厦府铺内侧元购前幢滨处向座下県凤港开关景泉塘放昌线湾政步宁解白田町溪十八古双胜本'
        '单同九迎第台玉锦底后七斜期武岭松角纪朝峰六振珠局岗洲横边济井办汉代临弄团外塔杨铁浦'
        '字年岛陵原梅进荣友虹央桂沿事津凯莲丁秀柳集紫旗张谷的是不了很还个也这我就在以可到错'
        '没去过感次要比觉看得说常真们但最喜哈么别位能较境非为欢然他挺着价那意种想出员两推做'
        '排实分间甜度起满给热完格荐喝等其再几只现朋候样直而买于般豆量选奶打每评少算又因情找'
        '些份置适什蛋师气你姐棒试总定啊足级整带虾如态且尝主话强当更板知己无酸让入啦式笑赞'
        '片酱差像提队走嫩才刚午接重串回晚微周值费性桌拍跟块调糕'
    )

(2)调用TTFont读取字体文件

data1 = {
   }
font1 = TTFont("tf1.woff")
keys1 = font1.getGlyphOrder()[2:]
for index, value in enumerate(keys1
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值