![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大创项目
文章平均质量分 67
凯撒袁六兽
9102年初入林大大一计算机系
展开
-
Pandas导入导出csv时编码格式错误的解决方法
需要知道的知识Excel中打开的编码是ANSI型的,而你需要处理的数据是UTF-8类型的,如果将编码ANSI的Excel导入Pandas则必然会出现问题,同样以UTF-8导出的csv在Excel中打开同样是乱码报错信息:编码问题:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb3 in position解决方法1.用记事本打开csv文件并在记事本的另存为中以UFT-8的编码格式保存,再重新导入2.使用代码:content = pd.r原创 2021-10-31 21:45:21 · 1563 阅读 · 1 评论 -
数据预处理(一)
数据处理数据处理维度消费时间消费周期近6个月消费次数近6个月消费金额最小消费金额累计消费金额最大消费金额累计消费次数数据处理步骤导入数据table=pd.read_excel(r"C:\Users\Kaiser\Desktop\DataDocument\storedata.xls")数据的导入需要保证路径里的文件名全部为英文将某一字符型的列按分类换成数字data["消费类型"]=data["类型"]=="餐费支出"删除类型与支付方式的列data.drop(colum原创 2021-07-27 20:48:46 · 104 阅读 · 0 评论 -
数据清洗-Pandas和DateFrame
数据清洗PandasPandas是一个强大的分析结构化数据的工具集,使用基础是Numpy,用于数据挖掘和数据分析数据结构:Series是一种类似于一维数组的对象,是由一组数据以及一组与之相关的数据标签组成,仅由一组数据也可产生简单的Series.创建Series导入Pandas包import numpy as npimport pandas as pd通过数组创建一个SeriesSeries([data, index, dtype, name, copy, …])如果没原创 2021-07-23 17:51:41 · 586 阅读 · 2 评论 -
数据清洗-Numpy基础
文章目录数据清洗NumpyNdarrayNdarray属性创建Ndarray对象Numpy数组的向量化Ndarray的各种变换操作维度变换元素类型变换数组转变为列表Numpy的广播功能访问Ndarray中的元素--索引和切片基本索引和切片索引:直接通过 [ ]进行存取切片:取某几个间隔相同的元素的集合整数数组索引和切片高维数组的索引和切片bool索引Numpy运算算术运算取整函数与统计函数取整函数统计函数排序和索引归一化集合逻辑数据清洗介绍:进行数据清洗所使用的是python第三方库中的Numpy库N原创 2021-07-21 21:31:09 · 691 阅读 · 4 评论