数据分析
文章平均质量分 93
若如初见kk
人生苦短,我用python!
展开
-
BI数据分析笔试题及答案(华为音乐外包)
BI数据分析一、华为音乐外包1.数据仓库测试2.可视化时间空间数据3.信息与熵的计算4.基本数据的元数据5.数据粒度6.数据预处理7.非对称二元属性8.特征工程9.KDD10.无数据标签适合:聚类算法11.抽样方法12.聚类算法13.分类器14.非频繁模式15.离群点二、数据分析笔试题(选择题)1. 单选题2. 多选题三、参考文章一、华为音乐外包1.数据仓库测试ETL测试是为了确保从源到目的数据经过业务转换完成后是准确的。同时它还涉及数据的验证,及从源头到目的地数据各个不同阶段验证数据。测试流程原创 2022-02-14 21:32:20 · 3351 阅读 · 0 评论 -
Python常用标准库之正则表达式
Python常用标准库之正则表达式1.概念2.re模块常用函数2.1 match()2.2 search()2.3 findall()2.4 split()2.5 sub()3.特殊符号和字符3.1 管道符号4.在线测试工具5.常用正则表达式案例1.概念正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。许多程序设计语言都支持利用正则表达式进行字符原创 2021-01-03 19:24:26 · 1051 阅读 · 0 评论 -
Python计算商品复购率
1. Python计算产品复购率需求:给出数据商品购买数据,数据格式.csv,包含:购买月份、手机号,根据该数据计算产品的复购率。复购率算法:算法一:单位时间内(按每月):R = 复购人数/总购买人数算法二:单位时间内(按每月):R = 复购交易次数/总交易次数部分数据样式如下:2.参考代码# coding = utf-8import pandas as pdimport timeclass RepurchaseRate(object): """1.普通配置电脑百万条原创 2020-12-27 18:49:56 · 2483 阅读 · 4 评论 -
数据分析之数据预处理、分析建模、可视化
概述:简介、思路、发展历程、应用领域、开发流程;数据类型:结构化与非结构化、定性与定量、截面数据与时间序列数据;数据来源:外部来源、内部来源;数据预处理:数据清洗、数据集成、数据规约、数据变换;数据分析模型:对比分析、漏斗分析、留存分析、A/B测试、用户行为路径分析、用户分群、用户画像分析等;数据分析方法:描述统计、假设检验、信度分析、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分分析、因子分析、时间序列分析等;数据可视化:Excel、PowerBI、Tableau、Python;原创 2020-08-08 15:03:21 · 102992 阅读 · 40 评论 -
常见开源数据平台
常见开源数据平台金融财经数据互联网数据政府数据金融财经数据同花顺数据中心:提供股票债券等金融数据 http://data.10jqka.com.cn/新浪财经:提供国内国民经济、行业信息、对外经贸、居民收入等各种宏观的经济数据http://finance.sina.com.cn/mac/零壹财经:大大小小的网贷数据、排行榜等 https://www.01caijing.com/data/index.htm金融数据网:提供每日的黄金、汇率、农产品、汽油价格的相关数据 http://dc.xinhu原创 2020-08-08 13:53:19 · 6323 阅读 · 0 评论 -
【Kettle-ERROR】ETL工具-Kettle连接MySQL报错及解决方案
1.驱动问题在kettle中新建mysql连接时,一般都选择Native(JDBC)方法,这时需要下载与MySQL版本对应的connector连接jar包,放在kettle安装目录的 data-integration\lib下;低版本的MySQL数据库按这种方法一般没问题,但是mysql 8.0以上connector已经不再支持这个包名,所以会出现已经将mysql-connector-java-8.0.xx.jar包拷贝到lib目录下,但还是报错说找不到驱动。报错如下:错误连接数据库 [tcc]原创 2020-06-27 01:22:03 · 2133 阅读 · 0 评论 -
Windows下 的kettle的安装与配置
1.环境配置因为kettle是用Java写的所以需要先配置好JAVA虚拟环境Java8.0下载安装以及配置环境或者看这篇JDK8下载安装教程2.安装Kettlewindows下 的kettle 8.2 的安装与配置或者[windows下 的kettle 7.1 的安装与配...原创 2020-06-21 22:24:38 · 474 阅读 · 2 评论 -
MySQL数据库安装教程(Win10)
Windows10中MySQL数据库安装图解教程安装地址:https://dev.mysql.com/downloads/file/?id=495322通过这个地址打开MySQL的官网,找到MySQL Community (社区版),因为社区版是免费的,也比较好用,个人开发一般用这个,公司的话可以考虑企业版,打开网址后如下图:2.点击下载完成后开始安装文件大小一般为:300-400MB我安装的是:mysql-installer-community-8.0.20.0.msi,大概420MB安原创 2020-06-02 00:55:22 · 1812 阅读 · 0 评论 -
精选36道SQL练习题解析 from(原50道SQL练习题)
精选36道MySQL练习题解析 from 原50道SQL练习题对网络上流传的50道SQL练习题做了筛选,去掉了一些重复的题,剩下36道,总结分为6大类,几乎囊括了SQL查询绝大部分知识点,并给出了不同方法及解析,掌握这36道题,SQL查询语句基本上没啥大问题了原创 2020-05-29 10:51:08 · 17747 阅读 · 8 评论 -
Excel常用数据分析技能(PowerBI)
提纲1.数据处理/清洗1.1 通过Excel自带函数1.1.1 数学函数1.1.2 日期和时间函数1.1.3 逻辑函数1.1.4 文本函数1.2 通过PowerQuery2.数据分析2.1 函数2.2 数据透视2.3 PowerPivot3.数据可视化3.1 图表-Graphs3.2 PowerView/PowerMap4.其他/资源分享4.1 PowerBI4.2 资源分享Excel的数据分析技能用一张图概括:1.数据处理/清洗我们利用Excel做数据处理时,常会遇到一些格式转化、重复数据、不重要原创 2020-05-31 22:26:50 · 2924 阅读 · 0 评论