数据分析
我是小明呀
这个作者很懒,什么都没留下…
展开
-
利用列表创建DataFrame数据类型
利用列表创建DataFrame数据类型方法1 列表生成器a =[x for x in range(1,10)], [y for y in range(1,10)], [z for z in range(1,10)]data_Frame = DataFrame(a)方法2 嵌套列表'''生成DataFrame数据'''# 导入库import numpy as npimport pandas as pdfrom pandas.core.frame import DataFrame.原创 2020-06-02 22:02:38 · 1937 阅读 · 0 评论 -
python数据处理之异常值删除(3的塔准则)
python数据处理之异常值删除(3的塔准则)# 导入库import numpy as npimport pandas as pdfrom matplotlib import pyplotfrom pandas.core.frame import DataFrameimport osfrom pandas.plotting import scatter_matriximport randomfrom pylab import *mpl.rcParams['font.sans-s...原创 2020-06-02 19:48:05 · 6225 阅读 · 1 评论 -
excel文档合并python实现
# -*- coding: utf-8 -*-import sysimport pandas as pdimport osimport globimport numpy as npimport matplotlib.pyplot as pltfileNum = 0myrow=0root = r"G:\Users\Administrator\PycharmProjects"# 合并指定文件夹下的所有Excel表filearray = []filelocation = glo...原创 2020-06-02 19:19:12 · 216 阅读 · 1 评论 -
自抽样算法原理及python实现
自抽样算法原理及python实现1. 算法原理介绍后续补充2. 例子'''采用自抽样方式对数据进行选择'''# coding=utf-8# 引入数据库包import pymysql# 引入操作excel包import xlrdimport pandas as pdimport matplotlib.pyplot as pltimport matplotlibimport seaborn as snsfrom matplotlib import rcParamsimp.原创 2020-06-02 19:13:28 · 476 阅读 · 0 评论 -
第2节 python实现文件读取
第2节 文件读取方式1.CSV文件读取使用read_csv方法读取,结果为DataFrame格式;在读取csv文件时,文件名称尽量是英文;参数较多,可以自行控制,但多数时候使用默认参数;读取csv时,注意编码,常用的编码为utf-8、gbk、gbk2312和gb18030等。使用to_csv快速保存。'''读取csv文件'''import numpy as npimport pa...原创 2020-05-07 19:00:02 · 264 阅读 · 0 评论 -
第1节 数据清洗之常用基本语法
第1节 数据清洗之常用基本语法1. 常见数据问题(1)数据缺失;(2)数据噪声;(3)数据不一致;(4)数据冗余;(5)离散点/异常值;(6)数据重复。数据清洗是唯一可以提高数据质量的方法,使得数据分析结果更加可靠。2. 常用工具)numpy、pandas;3. 创建numpy常用数据结构(1)使用array函数(列表或元组);(2)其它函数,如arange、linspa...原创 2020-05-07 18:47:56 · 229 阅读 · 0 评论