利用python进行数据分析 麦金尼 代码实测常见问题汇总
第6章 数据加载、存储与文件格式
逐块读取文本文件
调用Series的order属性出错
tot = tot.order(ascending=False)
具体报错:
"Series" object has no attribute "order"
错误原因:python3以后Series的order属性改为sort_values(),将原始代码修改为:
tot = tot.sort_values(ascending=False)
手工处理分隔符格式
自定义csv.dialect出错
class my_dialect(csv.Dialect):
lineterminator = " "
delimiter = ";"
quotechar = """
具体报错:
"quoting" must be an integer
错误原因:
quoting引用约定不能省略,可以改为:
class my_dialect(csv.Dialect):
lineterminator = " "
delimiter = ";"
quotechar = """
quoting = csv.QUOTE_MINIMAL
给quoting添加默认值。
XML和HTML:Web信息收集
导入urllib2出错
错误代码: