Python2与Python3的区别
1) 核心类差异
Python3 对 Unicode 字符的原生支持。
Python2 中使用 ASCII 码作为默认编码方式导致 string 有两种类型 str 和 unicode,Python3 只
支持 unicode 的 string。Python2 和 Python3 字节和字符对应关系为:
python2
python3
表现
转换
作用
str
bytes
字节
encode
存储
unicode
str
字符
decode
显示
Python3 采用的是绝对路径的方式进行 import
Python2中存在老式类和新式类的区别,Python3统一采用新式类。新式类声明要求继承object,
必须用新式类应用多重继承
Python3 使用更加严格的缩进。Python2 的缩进机制中,1 个 tab 和 8 个 space 是等价的,所
以在缩进中可以同时允许 tab 和 space 在代码中共存。这种等价机制会导致部分 IDE 使用存在问题。
Python3 中 1 个 tab 只能找另外一个 tab 替代,因此 tab 和 space 共存会导致报错:TabError:
inconsistent use of tabs and spaces in indentation.
2) 废弃类差异
print 语句被 Python3 废弃,统一使用 print 函数
exec 语句被 python3 废弃,统一使用 exec 函数
execfile 语句被 Python3 废弃,推荐使用 exec(open("./filename").read())
不相等操作符"<>"被 Python3 废弃,统一使用"!="
long 整数类型被 Python3 废弃,统一使用 int
xrange 函数被 Python3 废弃,统一使用 range,Python3 中 range 的机制也进行修改并提高了大数据集生成效率
Python3 中这些方法再不再返回 list 对象:dictionary 关联的 keys()、values()、items(),zip(),map(),filter(),但是可以通过 list 强行转换:
mydict = dict()
mydict = {"a": 1, "b": 2, "c": 3}
mydict.keys() #
list(mydict.keys()) # ['a', 'c', 'b']
迭代器 iterator 的 next()函数被 Python3 废弃,统一使用 next(iterator)
raw_input 函数被 Python3 废弃,统一使用 input 函数
字典变量的 has_key 函数被 Python 废弃,统一使用 in 关键词
file 函数被 Python3 废弃,统一使用 open 来处理文件,可以通过 io.IOBase 检查文件类型
apply 函数被 Python3 废弃
异常 StandardError 被 Python3 废弃,统一使用 Exception
3)修改类差异
浮点数除法操作符"/”和"//”的区别
" / ”:
Python2:若为两个整形数进行运算,结果为整形,但若两个数中有一个为浮点数,则结果为
浮点数;
Python3:为真除法,运算结果不再根据参加运算的数的类型。
"//”:
Python2:返回小于除法运算结果的最大整数;从类型上讲,与"/"运算符返回类型逻辑一致。
Python3:和 Python2 运算结果一样。
异常抛出和捕捉机制区别
python2
raise IOError, "file error" # 抛出异常
except NameError, err: # 捕捉异常
python3
raise IOError("file error") #抛出异常
except NameError as err: #捕捉异常
for 循环中变量值区别
Python2,for 循环会修改外部相同名称变量的值
i = 1
print('comprehension: ', [i for i in range(5)])
print('after:i = ', i) # i = 4
Python3,for 循环不会修改外部相同名称变量的值
i = 1
print("comprehension: ", [i for i in range(5)])
print('after: i = ', i) # i = 1
round 函数返回值区别
Python2,round 函数返回 float 类型值
isinstance(round(15.5),int) #True
Python3,round 函数返回 int 类型值
isinstance(round(15.5),float) #True
比较操作符区别
Python2 中任意两个对象都可以比较
11 < 'test' # True
Python3 中只有同一数据类型的对象可以比较
11 < 'test' # TypeError: unorderable types: int() < str()
4)第三方工具包差异
我们在pip官方下载源pypi搜索Python2.7和Python3.5的第三方工具包数可以发现,Python2.7
版本对应的第三方工具类目数量是 28523,Python3.5 版本的数量是 12457,这两个版本在第三方工具
包支持数量差距相当大。
我们从数据分析的应用角度列举了常见实用的第三方工具包(如下表),并分析这些工具包在
Python2.7 和 Python3.5 的支持情况:
分类
工具名
用途
数据收集
scrapy
网页采集,爬虫
数据收集
scrapy-redis
分布式爬虫
数据收集
selenium
web 测试,仿真浏览器
数据处理
beautifulsoup
网页解释库,提供 lxml 的支持
数据处理
lxml
xml 解释库
数据处理
xlrd
excel 文件读取
数据处理
xlwt
excel 文件写入
数据处理
xlutils
excel 文件简单格式修改
数据处理
pywin32
excel 文件的读取写入及复杂格式定制
数据处理
Python-docx
Word 文件的读取写入
数据分析
numpy
基于矩阵的数学计算库
数据分析
pandas
基于表格的统计分析库
数据分析
scipy
科学计算库,支持高阶抽象和复杂模型
数据分析
statsmodels
统计建模和计量经济学工具包
数据分析
scikit-learn
机器学习工具库
数据分析
gensim
自然语言处理工具库
数据分析
jieba
中文分词工具库
数据存储
MySQL-python
mysql 的读写接口库
数据存储
mysqlclient
mysql 的读写接口库
数据存储
SQLAlchemy
数据库的 ORM 封装
数据存储
pymsql
sql server 读写接口库
数据存储
redis
redis 的读写接口
数据存储
PyMongo
mongodb 的读写接口
数据呈现
matplotlib
流行的数据可视化库
数据呈现
seaborn
美观的数据可是湖库,基于 matplotlib
工具辅助
chardet
字符检查工具
工具辅助
ConfigParser
配置文件读写支持
工具辅助
requests
HTTP 库,用于网络访问
5)工具安装问题
windows 环境
Python2 无法安装 mysqlclient。Python3 无法安装 MySQL-python、 flup、functools32、Gooey、Pywin32 、webencodings。
matplotlib 在 python3 环境中安装报错:The following required packages can not be built:freetype, png。需要手动下载安装源码包安装解决。
scipy 在 Python3 环境中安装报错,numpy.distutils.system_info.NotFoundError,需要自己手工下载对应的安装包,依赖 numpy,pandas 必须严格根据 python 版本、操作系统、64 位与否。运行matplotlib 后发现基础包 numpy+mkl 安装失败,需要自己下载,国内暂无下载源
centos 环境下
Python2 无法安装mysql-python和 mysqlclient包,报错:EnvironmentError: mysql_config not found,解决方案是安装 mysql-devel 包解决。使用 matplotlib 报错:no module named _tkinter,安装 Tkinter、tk-devel、tc-devel 解决。
pywin32 也无法在 centos 环境下安装