Python读取Excel文本报错:‘float‘ object has no attribute ‘decode‘

本文讲述了在使用Python读取csv或Excel文件时遇到的编码问题,通过将数据类型转换为str解决了'float'对象无decode属性的错误。重点在于astype(str)的作用和Unicode编码在处理文本文件中的应用。
摘要由CSDN通过智能技术生成

 python3默认是unicode编码。

最近读取存储为.csv 或者Excel 格式的文件,报属性错误,参考jieba分词时出现AttributeError: 'float' object has no attribute 'decode'的做法,

在read_csv后面加上.astype(str) ,不再报错。

 
  1. import pandas as pd

  2. import numpy as np

  3. import os

  4. import jieba.posseg as psg

  5. #读取文件 #encoding='utf-8' # header=0,表示文件第0行为列索引

  6. data = pd.read_csv('IPO因果事件抽取_去除重复行.csv',engine='python').astype(str) # 加上.astype(str) ,不再报错

  7. print(data.head())

  8. cause = data['cause'].tolist()

  9. effect = data['effect'].tolist()

  10. tag = data['tag'].tolist()

  11. from normalization import normalize_corpus

  12. # normalize corpus

  13. # norm_cause = normalize_corpus(cause)

  14. norm_effect = normalize_corpus(effect)

encode和decode分别指编码和解码。在python中,Unicode类型是作为编码的基础类型

 
  1. decode encode

  2. str ---------> str(Unicode) ---------> str

准确来说,Unicode不是编码格式,而是字符集。这个字符集包含了世界上目前所有的符号。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值