pycharm爬虫运行后console中文出现xe4\xb8\乱码的解决方法

最新推荐文章于 2024-08-08 17:59:21 发布

autotest00

最新推荐文章于 2024-08-08 17:59:21 发布

阅读量2.5k

点赞数 1

分类专栏： python

python 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

对于Python3爬虫抓取网页中文出现输出乱码

import urllib.request

response = urllib.request.urlopen('http://www.12306.cn/mormhweb/')

html = response.read()
print(html)

上面的代码正常但是运行的时候结果遇到中文会以\xe7\x99\xbe\xe5\xba\xa6\xe4\xb8\x80代替，这是一种byte字节。

python 3输出位串，而不是可读的字符串，需要对其进行转换

使用str(string[, encoding])对数组进行转换

str(response.read(),'utf-8')

import urllib.request
response = urllib.request.urlopen('http://www.12306.cn/mormhweb/')

html =str(response.read(),'utf-8')
print(html)

这样就解决了中文不能输出问题，效果如下

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

autotest00

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python入门：input获取\xe4\xb8\xad字符正确解码

foryouslgme的博客

02-09

1万+

解决此问题需要理解几个点： python3中默认使用unicode编码，也就是说对中文的支持会更好，输入中文，直接显示中文。但是当在py文件中直接给变量赋值“\xe4\xb8\xad”时，python3就会直接在unicode中找对应的字符了，然后显示ä¸ 2. 当使用input获取到“\xe4\xb8\xad”，其实质在内存中是“\\xe4\\xb8\\xad”，所以展示给我们的才是“

python系列：PyCharm Python Console中文输出乱码问题及解决

weixin_54626591的博客

07-17

896

PyCharm Python Console中文输出乱码问题及解决

参与评论您还未登录，请先登录后发表或查看评论

python中文编码

weixin_30458043的博客

10-19

278

前面章节中我们已经学会了如何用 Python 输出 "Hello, World!"，英文没有问题，但是如果你输出中文字符"你好，世界"就有可能会碰到中文编码问题。Python 文件中如果未指定编码，在执行过程会出现报错：#!/usr/bin/pythonprint "你好，世界";以上程序执行输出结果为： File "test.py", line 2SyntaxError: Non-ASCII ...

3种Python爬虫中文乱码的处理方法

热门推荐

新旧问题集

09-28

5万+

为什么Python使用过程中会出现各式各样的乱码问题，明明是中文字符却显示成“\xe4\xb8\xad\xe6\x96\x87”的形式？为什么会报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)”？本文就来研究一下这个问题。字符串

Python字符串乱码：\xe4\xb8\xad或者ordinal not in range(128)

u011412768的博客

09-07

8624

用Python极其不熟练的小白，近两个月被Python中的乱码问题虐得体无完肤，看了一些编码相关的文章，但是还是似懂非懂的，毕竟放到Python的编程环境中，跟纯理论还是不一样的，今天看到一篇比较好的文章，看完终于觉得能解决一些实际编码中遇到的问题了，保存下来以作总结学习。原文地址：https://blog.csdn.net/u013430189/article/details/4878661...

PyCharm运行时跳多个Python Console窗口的解决方法

12-22

最开始安装PyCharm并用于运行程序的时候，发现总是在点击run运行一次程序的时候打开一个新的窗口，如下图显示。同一段程序每运行一次就出现一个新的Python Console窗口，看着很不舒服。二、解决方法：要想在...

解决在pycharm运行代码,调用CMD窗口的命令运行显示乱码问题

09-18

在Python开发过程中，PyCharm 是一款非常流行的集成开发环境（IDE）。然而，有时在使用 PyCharm 运行...通过调整PyCharm的设置，我们可以有效地解决在CMD窗口中运行代码时出现的乱码问题，确保代码的可读性和正确性。

pycharm运行程序时在Python console窗口中运行的方法

12-25

以上这篇pycharm运行程序时在Python console窗口中运行的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持软件开发网。您可能感兴趣的文章:解决pycharm的Python console不能调试...

Empty test suite.(PyCharm程序运行错误的解决方法)

12-25

运行程序test4_4.py时报错，Empty test suite. 查找资料发现原因：默认情况下，PyCharm将检查以test开头的文件，它们是unittest.TestCase的子类，但是你可以控制模式和子类选项。根据您的测试文件名更改模式，它...

python2.7 解决写入.txt时中文显示问题，如 \xe4\xb8\xad\xe6\x96\x87

u010481688的博客

12-10

1746

说明：当读取到一个字符串时，内容包含了中文，如果想要把这个字符串写入window环境内创建的.txt文件内，会出现\xe4\xb8\xad\xe6\x96\x87情况，以下方法可以解决代码： file=open(str(f)+'.txt','w') attributesD = str(attributes[s]) aa=attributesD.decode("string_escape"...

汉字十六进制编码转换\xe4\xb8\xad\xe5\x9b\xbd

ITjianghuxiaoxiong的专栏

08-25

2万+

最近用wireshark抓包分析接口是遇到

解决pycharm中中文列表输出'\xe5\xa4\xa7\xe8\x92\x9c'之类的字符串

wqy94103的博客

08-09

2万+

#coding=utf-8 member=["贝贝","晶晶","欢欢"] print(member) print("北京欢迎您！") 如上代码块，结果输出为： [‘\xe8\xb4\x9d\xe8\xb4\x9d’, ‘\xe6\x99\xb6\xe6\x99\xb6’, ‘\xe6\xac\xa2\xe6\xac\xa2’] 北京欢迎您！该怎么解决以上pycharm中的中文列表输出的编码问题

python urlopen 乱码_Python 2.7.3 urllib2.urlopen 获取网页出现乱码解决方案

weixin_39646831的博客

12-16

585

出现乱码的原因是，网页服务端有bug，它硬性使用使用某种特定的编码方案，而并没有按照客户端的请求头的编码要求来发送编码。解决方案：使用chardet来猜测网页编码。1.去chardet官网下载chardet的py源码包。2.把chardet目录从源码包里解压到项目文件夹内。3.通过 import chardet 来引用它，然后：response = None#尝试下载网页try:response ...

输入中文错误：\xE4\xBB\x8E\xE5\x85\xA5...‘ for column ‘detail‘ at row 1

weixin_39371691的博客

11-03

491

编辑数据库，字符集改成utf-8在重新新建表就可以了。

SyntaxError: Non-UTF-8 code starting with ‘\xb8‘ in file

qq_44417051的博客

09-18

4688

1、python--遇到SyntaxError: Non-UTF-8 code starting with '\xb8' in file 在运行python中因为添加了中文注释，遇到SyntaxError: Non-UTF-8 code starting with '\xb8' in file 经过百度，说是Python的默认编码格式是UTF-8，若指定编码格式则需在开头添加如下代码：...

pycharm运行报错：SyntaxError: Non-ASCII character '\xe7' in file

Smile

04-13

501

方法一：在Python源文件的最开始的第一行添加： **#coding=UTF-8 或 #coding：UTF-8 或 #-- coding:UTF-8 – 方**法二：pycharm默认添加编码格式： # -- coding: utf-8 -

Pycharm遇到的编码报错之解决办法

最爱吃糖小狂魔的博客

05-12

4589

在使用Pycharm中，编码设置都如下这样了,竟然还报了错：代码如下： print "程" 报错如下： SyntaxError: Non-ASCII character ‘\xe7’ in file D:/Pycharm/hello.py on line 解决办法如下： # -*- coding: UTF-8 -*- #指定文件编码格式 print "程" 就是要指定文件的编...

pycharm flask debug console中文乱码

10-07

在PyCharm的Flask Debug Console中出现中文乱码的问题通常是由于控制台字符集的设置不正确导致的。你可以尝试以下几种方法来解决这个问题： 1. 检查控制台字符集设置：在PyCharm中，点击菜单栏的"File" -> "Settings"，然后在弹出的对话框中选择"Editor" -> "File Encodings"。在右侧的"IDE Encoding"、"Project Encoding"和"Default encoding for properties files"中选择UTF-8作为字符集。 2. 检查Python解释器设置：在PyCharm中，点击菜单栏的"File" -> "Settings"，然后在弹出的对话框中选择"Project Interpreter"。在右侧的解释器列表中，选中当前项目使用的Python解释器，然后点击下方的"Show paths for the selected interpreter"链接。确保"LANG"环境变量被正确设置为UTF-8。 3. 修改控制台字符集设置：在Flask Debug Console中，点击右上角的设置按钮，然后选择"Edit Configurations"。在弹出的对话框中，选择"Flask Server"选项卡，然后在"Environment variables"字段中添加一行"PYTHONIOENCODING=utf-8"。点击"OK"保存设置并重新运行项目，看看是否能够正常显示中文字符。如果以上方法都无法解决中文乱码的问题，你可以考虑在代码中进行编码转换，例如使用"str.encode('utf-8')"将字符串转换为UTF-8编码，或者使用"str.decode('utf-8')"将UTF-8编码的字符串解码为Unicode。