数据分析
只要开始永远不晚
好好学习,天天向上!
展开
-
pandas的dataframe转spark的dataframe 互转
pandas的dataframe转spark的dataframespark的dataframe转pandas的dataframepandas的dataframe和spark的dataframe互转dataframe互转原创 2021-01-12 14:05:07 · 1081 阅读 · 0 评论 -
聚类分析上证50成分股
2020年3月10日是个划时代的日子,在全球主要市场一片惨淡的时刻,我们的大A终于走出了独立行情。为了纪念这一天,我决定用EM聚类算法对上证50的成分股做一次聚类,将其划分为十类。然后,我将从每类中随机选一只,打包一个投资组合,以上帝视角回测一下,PK一下ETF指数基金。数据为10日收盘时,50只成分股收盘时的涨跌幅、成交额、大单流入额等指标。数据加载原始数据我已经清洗完毕...原创 2020-03-11 17:56:17 · 1041 阅读 · 0 评论 -
数据分析方法论-不同的分析阶段
根据实际业务发展,针对产品的不同生命周期,数据分析的角度和策略是不同的。按阶段可有如下分析角度:描述型分析、诊断型分析、预测型分析和策略型分析。...原创 2020-03-22 19:27:02 · 583 阅读 · 0 评论 -
主数据和元数据的概述
企业数据管理的内容和范畴通常包含交易数据、主数据以及元数据。以下主要讨论主数据、元数据的概念及应用。主数据和主数据管理的概念企业主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;它是具有高业务价值的、可以在企业内跨越各个业务部门被重复使用的数据,并且存在于多个异构的应用系统中。主 数 据 (masterdata)指 在 企 业 范 围 内跨 部 ...转载 2020-02-15 22:23:46 · 3372 阅读 · 0 评论