python练习--360搜索关键字采集

这篇博客介绍了使用Python进行360搜索关键词采集的过程,强调了阅读Python官方文档的重要性,特别是面对中文编码问题时,如何将ASCII编码转换为UTF-8以适应360搜索的需要。
摘要由CSDN通过智能技术生成

这个不算网络爬虫,只是简单的抓取360搜索的联想词汇,熟悉python的基本语法使用。

有一点体会很深刻,还是得多看python文档,虽然是全英文的,不可否认,那里有太多的BIF可以直接利用,方便~

由于python默认输入的中文编码是ascii的,没办法转换到utf-8,而我们在360上抓取的时候可接受的格式为utf-8,于是不得不想办法将输入的中文keywords转换成utf-8编码,才能被搜索引擎所识别。

一开始我使用

raw_input("输入搜索的关键字:").decode("ascii").encode("utf-8")

这样解释器就报错了
UnicodeDecodeError: 'ascii' codec can't decode byte 0xbf in position 0: ordinal not in range(128)
后来看到有人这样,将ascii换成gbk

raw_input("输入搜索的关键字:").decode("gbk").encode("utf-8")

这样就在正常了,当然输出结果时候我们还是得用utf-8来解码的~

# -*- coding: utf-8 -*-
#Name:getInfo.py
#Function:360搜索关键字采集
#@20
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值