数据分析课件代码
return_min
这个作者很懒,什么都没留下…
展开
-
day08课件代码
01-案例:航空用户聚类案例.py """ 目标: 对用户进行聚类 对聚类后的用户评估其价值 对不同价值的客户实行不同营销策略 客户价值: 收入来源于20%的顶端客户 90%收入来自于现有客户 大量资金被投入拓展用户上面 了解航空公司的现状 行业内存在竞争 行业间存在竞争 2012-03-31 ---2014-3-31...原创 2020-01-15 14:35:23 · 226 阅读 · 0 评论 -
day07课件代码(下)
04-sklearn算法实现聚类 import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import KMeans def build_data(): """ 加载数据 :return:data """ # 加载.txt文件 # python ---wi...原创 2020-01-15 14:32:38 · 191 阅读 · 0 评论 -
day07-means算法(上)
day07-k_means算法自实现 01-数据转化 import pandas as pd import numpy as np # 将非数值型类别型数据转化为数值型 # 哑变量转化---将数据转化为哑变量矩阵 # 加载数据 data = pd.read_excel('./meal_order_detail.xlsx') # print('data:\n',data) # print('da...原创 2020-01-14 16:18:27 · 270 阅读 · 0 评论 -
day06
01-合并数据 import pandas as pd """ import numpy as np numpy 合并数组 np.hstack() # 水平合并 np.vstack() # 垂直合并 np.concatenate() # 行的方向 axis = 0 np.concatenate() # 列的方向 axis = 1 """ # # 获取df数据 # df1 = pd.read...原创 2020-01-13 21:52:55 · 812 阅读 · 1 评论 -
day06-pandas高阶 课件代码下午
03-缺失值检测与处理 import pandas as pd import numpy as np # 加载数据 data = pd.read_excel("./qs.xlsx") print('data:\n', data) print('data的列索引:\n', data.columns) # 检测缺失值 # isnull + sum res_null = pd.isnull(d...原创 2020-01-13 19:19:30 · 143 阅读 · 0 评论 -
day06-pandas高阶 课件代码上午
01-数据合并 import pandas as pd """ import numpy as np numpy 合并数组 np.hstack() # 水平合并 np.vstack() # 垂直合并 np.concatenate() # 行的方向 axis = 0 np.concatenate() # 列的方向 axis = 1 """ # # 获取df数据 # df1 = pd.rea...原创 2020-01-13 11:31:11 · 168 阅读 · 0 评论 -
day05-pandas进阶 课件代码
01作业:多个箱线图绘制案例 import matplotlib.pyplot as plt import numpy as np # 构建数据 def build_data(): """ 构建数据 :return: 数据 """ # 加载数据 --返回对象 res = np.load("./国民经济核算季度数据.npz", allow_pi...原创 2020-01-10 21:00:53 · 203 阅读 · 0 评论 -
dataframe的一些操作
09-dataframe的修改操作 import pandas as pd # 加载数据 data = pd.read_excel("./users.xlsx") print('data:\n', data) print('data 的列索引;\n', data.columns) # 将age 修改18岁 # data.loc[:, 'age'] = 18 # 将sex 为 男 全部...原创 2020-01-09 20:59:07 · 449 阅读 · 0 评论 -
pandas的认识与dataframe的认识 day04课件代码
01-作业:多个柱状图的绘制案例 import matplotlib.pyplot as plt import numpy as np def build_data(): """ 构建数据 :return:数据 """ res = np.load("./国民经济核算季度数据.npz") columns = res["columns"] ...原创 2020-01-09 16:17:46 · 182 阅读 · 0 评论 -
day03课件代码(下午)
06-案例:国民生产总值折线图案例 import numpy as np import matplotlib.pyplot as plt def build_data(): """ 加载数据 :return:columns, values """ res = np.load("./国民经济核算季度数据.npz") # for tmp in ...原创 2020-01-08 19:12:53 · 122 阅读 · 0 评论 -
基础笔记1 补充
认识数据 认识数据 1.数据 1.1.数据对象 1.2.数据集 1.2.1.多个数据对象的集合 1.2.2.行代表着不同的样本,列代表着不同特征 1.3.数据的属性 1.3.1.标称属性 其值是一些符号或者事物的名称 如头发的颜色,如人的姓名 1.3.2.二元属性 特殊的标称属性 • 只有两种结果的标称属性 对称的二元属性 • 两种结果重要性一样 • 如:男女 非对称的二元属性 • ...原创 2020-01-08 19:06:22 · 107 阅读 · 0 评论 -
day03课件代码(上午)
01-数组的重复与去重 import numpy as np # 创建数组 # arr = np.array([9, 9, 9, 8, 8, 7, 6, 5, 7, 6, 5, 1, 2, 1, 2]) # 对数组进行去重 # unique # 1、去重 # 2、排序 # 注意:unique排序效果 对中文数组不太适用 # arr= np.unique(arr) # print("数组去重的...原创 2020-01-08 11:25:50 · 137 阅读 · 0 评论 -
数据分析课件代码 day2
01-数组的类型及形状 import numpy as np # 创建一个数组 # arr = np.array([1, 2, 3, 4], dtype=np.float32) # print("arr:\n", arr) # print("arr 的元素类型:\n", arr.dtype) # numpy里面数据类型 # numpy里面的数据类型,其实就是封装了Python里面基础的数据...原创 2020-01-07 17:22:06 · 132 阅读 · 0 评论 -
课件代码 day1
01- numpy初识 """ numpy ---科学计算库 结构核心: ndarray对象: 存储多维数组 单一数据类型 内存是连续的 两种存储风格: C风格 ---C语言风格----按行优先存储 F风格 ---fortran语言风格 ----按列优先存储 """ 02-数组的属性 impo...原创 2020-01-07 14:25:17 · 139 阅读 · 0 评论