Python3 编码问题: 怎么将Unicode转中文,以及GBK乱码ÖйúÉÙÊýÃñ×åÌØÉ«´åÕ¯

原理:
如果***type(text) is bytes***,
那么text.decode('unicode_escape')

*decode对应bytes*
如果type(text) is str
那么text.encode(‘latin1’).decode(‘unicode_escape’)
*encode对应str*

1. 案例:

*

#coding=utf-8
import requests,re,json,traceback
from  bs4 import  BeautifulSoup

def qiushibaike():
    content = requests.get('http://baike.baidu.com/city/api/citylemmalist?type=0&cityId=360&offset=1&limit=60').content

    soup = BeautifulSoup(content, 'html.parser')
    print(soup.prettify())  #.decode("unicode_escape")
    #目前soup.prettify()为str
    new=soup.prettify().encode('latin-1').decode('unicode_escape')
    #.dencode('latin-1').encode('latin-1').decode('unicode_escape')

    print(new)


if __name__=='__main__':
    qiushibaike()
2. 结果对比:

这里写图片描述

案例2,\xe5\x8f\xa4\xe8\xbf\xb9编码

\xe5\x8f\xa4\xe8\xbf\xb9编码处理

userInputTag=["\xe5\x8f\xa4\xe8\xbf\xb9","\xe5\xbb\xba\xe7\xad\x91"]
print(userInputTag[0].encode('latin-1').decode('utf-8'))

结果:

古迹

完成转化

出现GBK无法编译

另外爬取时,网站代码出现GBK无法编译python3,如出现如下:

<h1>ÖйúÉÙÊýÃñ×åÌØÉ«´åÕ¯[6]</h1>

示例:

#coding=utf-8
import requests
#共有6页,首页为空不为6
for i in range(6):
    if i==0:
        url='http://www.tcmap.com.cn/list/zhongguoshaoshuminzutesecunzhai.html'

    else:
        url='http://www.tcmap.com.cn/list/zhongguoshaoshuminzutesecunzhai'+str(i)+'.html'
    response=requests.get(url)
    print(type(response))
   #如需成功编译,在.TEXT下面增加#号部分 
    html=response.text   #.encode('latin-1').decode('GBK')
    print(html)

这里写图片描述

文件读写操作codecs.open

python 文件读写时用open还是codecs.open
案例:当我们需要写入到TXT中的过程中
代替这繁琐的操作就是codecs.open,例如

import codecs
fw = codecs.open(‘test1.txt’,’a’,’utf-8’)
fw.write(line2)

不会报错,说明写入成功。这种方法可以指定一个编码打开文件,使用这个方法打开的文件读取返回的将是unicode。写入时,如果参数 是unicode,则使用open()时指定的编码进行编码后写入;如果是str,则先根据源代码文件声明的字符编码,解码成unicode后再进行前述 操作。相对内置的open()来说,这个方法比较不容易在编码上出现问题。

void PWM_Int(u16 arr,u16 psc) { GPIO_InitTypeDef GPIO_InitStructure; //¶¨Òå½á¹¹ÌåGPIO_InitStructure TIM_TimeBaseInitTypeDef TIM_TimeBaseStructure; //¶¨Òå½á¹¹ÌåTIM_TimeBaseStructure TIM_OCInitTypeDef TIM_OCInitStructure; //¶¨Òå½á¹¹ÌåTIM_OCInitStructure RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOB,ENABLE);//ʹÄÜPB¶Ë¿ÚʱÖÓ RCC_APB1PeriphClockCmd(RCC_APB1Periph_TIM3,ENABLE);//ʹÄܶ¨Ê±Æ÷3 GPIO_InitStructure.GPIO_Mode = GPIO_Mode_AF_PP; //¸´ÓÃģʽÊä³ö GPIO_InitStructure.GPIO_Pin = GPIO_Pin_0|GPIO_Pin_1; //PB0 ¡¢PB1 GPIO_InitStructure.GPIO_Speed= GPIO_Speed_50MHz; //IO¿ÚËÙ¶È GPIO_Init(GPIOB,&GPIO_InitStructure); //GPIO³õʼ»¯ TIM_TimeBaseStructure.TIM_Period = arr; //ÉèÖÃÏÂÒ»¸ö¸üлµÄ×Ô¶¯ÖØ×°ÔؼĴæÆ÷µÄÖµ TIM_TimeBaseStructure.TIM_Prescaler = psc; //Ô¤·ÖÅäÖµ TIM_TimeBaseStructure.TIM_ClockDivision = 0; //ʱÖÓ·Ö¸î TIM_TimeBaseStructure.TIM_CounterMode = TIM_CounterMode_Up; //ÏòÉϼÆÊý TIM_TimeBaseInit(TIM3,&TIM_TimeBaseStructure); TIM_OCInitStructure.TIM_OCMode= TIM_OCMode_PWM1; //PWMÂö³å¿í¶Èµ÷ÖÆ1 TIM_OCInitStructure.TIM_Pulse = 0; //ÉèÖôý×°È벶»ñ±È½Ï¼Ä´æÆ÷µÄÂö³åÖµ TIM_OCInitStructure.TIM_OCPolarity = TIM_OCPolarity_High; //ÉèÖÃTIMÊä³ö¼«ÐÔΪ¸ß TIM_OCInitStructure.TIM_OutputState = TIM_OutputState_Enable;//±È½ÏÊä³öʹÄÜ TIM_OC3Init(TIM3,&TIM_OCInitStructure); TIM_OC4Init(TIM3,&TIM_OCInitStructure); TIM_CtrlPWMOutputs(TIM3,ENABLE);//Ö÷Êä³öʹÄÜ TIM_OC3PreloadConfig(TIM3,TIM_OCPreload_Enable); TIM_OC4PreloadConfig(TIM3,TIM_OCPreload_Enable);//ʹÄÜԤװÔؼĴæÆ÷ TIM_ARRPreloadConfig(TIM3,ENABLE); //ʹÄÜ×Ô¶¯×°ÔØÔÊÐíλ TIM_Cmd(TIM3,ENABLE);//Æô¶¯¶¨Ê±Æ÷3 } void Set_PWMA(int PWM) { TIM_SetCompare3(TIM3,PWM);//ÉèÖÃTIM3ͨµÀ3µÄÕ¼¿Õ±È 3000/7200 } void Set_PWMB(int PWM) { TIM_SetCompare4(TIM3,PWM); 这段代码是一个pwm驱动还是两个pwm驱动欸
07-10
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT界的小小小学生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值