Python数据分析--dataguru在线课程

转载自 http://www.dataguru.cn/article-8862-1.html?union_site=left_layer

转载的目的是, 如何系统性的学好数据分析.

快速报名:Python数据分析(第一期)


课程简介:
Python是一种面向对象、直译式计算机程序设计语言。也是一种功能强大而完善的通用型语言,已经具有十多年的发展历史,成熟且稳定。Python 具有脚本语言中最丰富和强大的类库,足以支持绝大多数日常应用。 Python语法简捷而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够很轻松的把用其他语言制作的各种模块(尤其是C/C++)轻松地联结在 一起。
2012年的时候我们说R是学术界的主流,但是现在 Python正在慢慢取代R在学术界的地位。从12年13.3%的使用率到15年30.3%的使用率, Python已经逐渐成为数据分析与挖掘软件的中流砥柱。所以,让我们一起来跟随课程的脚步,感受Python的魅力吧!
课程将从Python的基本使用方法开始,一步步讲解,从ETL到各种数据分析方法的使用,并结合实例,让学员能从中借鉴学习。

课程大纲:
第一部分. Python基础
第一课:Python的概览——Python的基本介绍、安装与基本语法、变量类型与运算符
第二课:了解Python流程控制——条件、循环语句与其他语句
第三课:常用函数——函数的定义与使用方法、主要内置函数的介绍
第四课:NumPy基础——数组的创建、组合与分割

第二部分 数据分析的准备
第五课:了解数据——数据加载、储存与文件格式;异常值的清理与缺失值处理
第六课:数据清洗与初步分析——数据清理、转换、合并与重塑;数据汇总与描述统计;
第七课:绘图与可视化——基本绘图命令与图形概览、图形元素设定与实例:地震危机数据的可视化
第八课:数据聚合与分组处理——数据聚合、分组运算与转换、透视表与交叉表

第三部分 数据分析初探
第九课:假设检验——常用假设检验与实例分析
第十课:线性回归——线性回归模型、分析结果呈现与解读;实例:商品价格预测
第十一课: logistic回归——logistic回归模型讲解;实例:电信客户流失分析
第十二课:时间序列分析——时间序列基本处理、时间序列模型构建与结果解读;实例:未来股票价格预测

第四部分 深入数据分析
第十三课:分类算法——knn、决策树、贝叶斯分类器等算法介绍;实例:网页注册用户预测
第十四课:聚类算法——k-means算法介绍;实例:通信基站聚类分析
第十五课:降维方法——主成分分析与因子分析算法介绍;实例:地区经济指标评分

授课时间:
课程将于2016年3月19日开课,课程持续时间大约为16周。

授课对象:
对数据分析感兴趣的、对Python感兴趣的学员;想要学习Python的基础数据分析方法的学员

预期收获:
了解Python的基本用法;懂得使用Python进行基本的数据分析

授课讲师:
何翠仪,中山大学统计学专业毕业,炼数成金专职讲师,在过去曾讲授《大数据的统计学基础》《大数据的矩阵计算基础》《R七种武器之数据加工厂plyr》等多门课程。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,你想了解银行营销数据分析Python+k-means实现方法,是吗? 首先,K-means是一种聚类算法,可以将数据样本划分为K个不同的类别。在银行营销数据分析中,可以使用K-means来识别客户群体,以便更好地定位和营销。 以下是使用Python和K-means实现银行营销数据分析的一些步骤: 1. 导入所需的库和数据集,例如pandas、numpy和sklearn。 ``` import pandas as pd import numpy as np from sklearn.cluster import KMeans ``` 2. 加载数据集并进行必要的数据预处理,例如删除缺失值、转换数据类型等。 ``` data = pd.read_csv('bank_marketing.csv') data.dropna(inplace=True) data['age'] = data['age'].astype('int64') ``` 3. 选择需要用于聚类的特征,并进行必要的数据标准化。 ``` X = data[['age', 'balance', 'duration']] X = (X - X.mean()) / X.std() ``` 4. 创建K-means模型并训练模型。 ``` kmeans = KMeans(n_clusters=3, random_state=0) kmeans.fit(X) ``` 5. 使用模型对数据进行分类,并将结果添加到原始数据集中。 ``` data['cluster'] = kmeans.labels_ ``` 6. 可视化聚类结果,例如使用散点图。 ``` import matplotlib.pyplot as plt plt.scatter(data['balance'], data['duration'], c=data['cluster']) plt.xlabel('Balance') plt.ylabel('Duration') plt.show() ``` 这些步骤可以帮助你使用Python和K-means实现银行营销数据分析。当然,在实际应用中可能需要更多的数据处理和模型优化等步骤。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值