博客专栏  >  云计算/大数据   >  利用python进行数据分析

利用python进行数据分析

从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。

关注
7 已关注
27篇博文
  • 数据分析之乳腺癌预测

    零、定义问题1.1 数据介绍http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breas...

    昨天 15:33
    24
  • 数据分析之预测模型项目模板

    机器学习是一项经验技能,经验越多越擅长。不能只通过阅读就能掌握机器学习的技能,需要大量的练习才能掌握。在这里将介绍一个通用的引入机器学习的六个步骤。通过本篇文章将学到:        1.端到端的预...

    2018-01-27 10:39
    71
  • 数据分析之优化算法与模型持久化

    一、机器学习算法的参数     1.影响准确度 ------优化     2.防止过拟合 ------优化     3.其他参数二、网格搜索优化参数(参数少,3个以内)     1.原理       ...

    2018-02-10 13:14
    61
  • 数据分析之通过集成提高算法

    一、算法集成方法¶      1.装袋(Bagging):通过给定组合投票的方式,获得最优解。比如你生病了,去n个医院看了n个医生,每个医生给你开了药方,最后的结...

    2018-01-28 11:49
    71
  • 数据分析之审查回归算法

    一、线性算法 1.线性回归     1.1 原理 :y = ax +b的升级版。   ...

    2018-01-27 09:23
    79
  • 数据分析之审查分类算法

    一、算法审查 对于当前数据集,寻找最优算法 没有最好的分类器,只有最合适的分类器。 随机森林平均来说最强,但也只在9....

    2018-01-21 19:03
    85
  • 数据分析之算法评估矩阵

    一、算法评估矩阵 目的:合理有效的评估算法,寻找最适合的算法和参数 二、分类算法矩阵 ...

    2018-01-20 11:38
    63
  • 数据分析之评估算法

    一、分离训练数据集和评估数据集 In [9]: # 通过卡方检验选定数据特征 import pandas from pandas import read_csv...

    2018-01-14 12:17
    147
  • 数据分析之特征选择

    一、数据驱动 1.相关性:皮尔逊系数 In [1]: from numpy.random import randn imp...

    2018-01-14 10:44
    80
  • 数据分析之数据清洗

    一、数据导入 In [144]: #读取数据 import matplotlib.pyplot as plt %matplotlib notebook impo...

    2018-01-07 14:07
    173
  • 数据分析之seaborn画图

    一、数据导入 In [2]: import pandas from pandas import set_option #括号里面直接指定了数据的来源,当然你也可...

    2018-01-04 22:16
    387
  • 数据分析之理解数据

    一、数据导入 In [8]: import pandas from pandas import set_option #括号里面直接指定了数据的来源,当然你也可...

    2018-01-01 17:56
    595
  • Scikit-Learn各算法详细参数速查手册(中文)

    Scikit-Learn各算法详细参数速查手册(中文)martinScikit-Learn各算法详细参数速查手册中文 线性模型 1 线性回归 2 线性回归的正则化 21 Lasso回归L1正则 22 ...

    2017-07-21 18:35
    1845
  • 常见开放数据集

    一、科研数据        1.UCI                 http://archive.ics.uci.edu/ml/datasets.html                UCI数据...

    2017-12-09 10:51
    374
  • 利用python进入数据分析之数据聚合与数据分组运算

    from __future__ import division from numpy.random import randn import numpy as np import os import m...

    2017-11-25 19:19
    364
  • 利用python进入数据分析之数据规整化:清理、转换、合并、重塑(二)

    数据转换 移除重复数据 In [106]: data = DataFrame({'k1': ['one'] * 3 + [...

    2017-10-22 18:58
    646
  • 利用python进入数据分析之数据规整化:清理、转换、合并、重塑(一)

    导入相关包 In [2]: from __future__ import division from numpy.random import randn import numpy a...

    2017-10-22 18:56
    509
  • Matplotlib 入门(三):多图合并

    一、多合一显示    1、subplot方法:设置行、列和起始点 plt.subplot(2,1,1)      # 分成两行一列,起始点为1    2、代码 # -*- codin...

    2017-09-24 16:06
    922
  • Matplotlib 入门(二):画图

    一、散点图    1、画几个散点一点都不难 将x,y放入plt.scatter()中就好了。 plt.scatter(np.arange(5),np.arange(5))  #绘制散点图 ...

    2017-09-24 12:26
    114
  • Matplotlib 入门(一):基础操作

    一、第一张图片     1、画图三部曲 1.1导入包 import matplotlib.pyplot as plt 1.2绘制 plt.plot(x,y) 1.3显示 plt.show()  ...

    2017-09-23 17:33
    128
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部