数据分析师
文章平均质量分 75
x qing
这个作者很懒,什么都没留下…
展开
-
业务分析模型(漏斗,波士顿,RFM)
漏斗模型可以用销售行为漏斗,用户行为漏斗等。波士顿模型(对产品进行分类。市场占有率:企业实力;销售增长率:市场需求)。步骤:算出产品所需的增长率和占有率,算出阈值。插入散点图,选择数据源确认横纵坐标,阈值,数据标签,坐标轴标题,坐标轴标签低位等。RFM模型对用户进行分类:R:最近一次消费日期距离观测日期的时间间隔;F:一段时间内用户的消费频次;M:一段时间内用户的消费金额。步骤:求出每个用户的R值、F值、M值;确定阈值(平均值、中位数、二八法则等);根据阈值划分R程度、F程度、M程度;根据分类模型进行分类原创 2024-08-06 10:34:30 · 247 阅读 · 0 评论 -
业务分析方法(帕累托、同期群,5W2H)
帕累托分析(又称二八法则),即80%的问题是由20%的原因造成的。帕累托图的制作。同期群分析按初始行为发生时间的不同划分同期群,对持续一段时间内的行为差异进行分析。常用的是客户留存率的解决。5W3H分析法What、Why、Who、When、Where;How much、How to do。确认数据及需求:1.访谈;2.收集业务分析需求;3.自行整理需求;4.进一步确认需求;5.确认数据表原创 2024-07-25 14:55:52 · 728 阅读 · 0 评论 -
考勤表的制作——小例子
根据样表制作动态考勤表,可选择年份(2021或2022)和月份(1至12月),下方的日期和星期行根据选择年月展现(如选择2021年6月,则展现1日至30日),同时周六日列突出显示。本文以WPS为例进行介绍。一、设置标题;二、制作日期1-31;三、制作星期数;四、突出显示周末;五、细节调整原创 2024-07-25 11:21:06 · 302 阅读 · 0 评论 -
excel图表进阶介绍
常用同比、环比等计算公式。图表(子弹图[次坐标轴]、对比图、子母饼图、目标完成率,瀑布图)粘贴链接图片功能(OFFICE可以,WPS没有这个功能),所有图表都可以用喜欢的图案代替,漏斗图要添加辅助列,以数据人数和辅助列作堆积条形图;3、将纵坐标轴勾选逆序排列;4、将在数据源中将辅助列放在系列的第一个;5、图中选中辅助列填充设置为无。原创 2024-07-18 16:23:06 · 840 阅读 · 0 评论 -
EXCEL的自定义功能
excel文件获取。单元格格式自定义,G/通用格式。数字的占位符通常是0,文本的占位符通常是@。格式代码可控制不同区段的格式,区段间用英文分号“;”分割。条件格式可以新建规则,用色阶可以做热力图,Excel工具栏里面的东西是可修改的,文件——选项——自定义功能区。原创 2024-07-18 15:59:45 · 607 阅读 · 0 评论 -
Power Query爬取并处理网络数据
用power query爬取上的不同城市的空气质量数据发现不同城市空气质量网址前边相同,后边不同,如:北京:上海:二、应用1. 获取北京空气质量数据打开Power BI——获取数据——web——输入网址——点击确定。在出现的导航器窗口中,勾选Table0表格——点击加载——即可导入北京空气质量数据。打开Power Query编辑器,可通过源查看。原创 2024-07-12 16:55:08 · 348 阅读 · 0 评论 -
Power BI 工具介绍
Power BI是一款商业智能(BI)软件,由微软开发,旨在帮助用户将复杂的数据转化为视觉化的交互式见解。Power BI提供了一套完整的工具,包括数据连接、数据准备、数据建模、数据分析和数据可视化等功能,使用户能够轻松地连接到各种数据源,发现数据中的关键信息,并将其转化为易于理解的图表、报表和仪表板。原创 2024-07-12 14:18:16 · 949 阅读 · 0 评论 -
MySQL数据表的基本操作
CHANGE 也可以只修改数据类型,实现和 MODIFY 同样的效果,方法是将 SQL 语句中的“新字段名”和“旧字段名”设置为相同的名称,只改变“数据类型”。新数据类型:指修改后的数据类型,如果不需要修改字段的数据类型,可以将新数据类型设置成与原来一样,但数据类型不能为空。ALTER TABLE ADD [约束条件] AFTER ;ALTER TABLE CHANGE ;原创 2023-04-26 10:28:30 · 440 阅读 · 0 评论 -
MySQL存储引擎
在高并发的情况下,MyISAM存储引擎会出现表锁定的问题,影响读写性能,在面对高并发数据写入的场景下,不适合使用MyISAM存储引擎。MEMORY存储引擎支持表级锁定和哈希索引等特性,并且数据表的所有数据都保存在内存中,不需要像磁盘存储一样进行IO操作,这使得MEMORY存储引擎在处理少量数据的情况下非常快。如果应用对事务的完整性有比较高的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询以外,还包括很多的更新、删除操作,那么 InnoDB 存储引擎是比较合适的选择。原创 2023-04-18 20:50:46 · 115 阅读 · 0 评论 -
MySQL数据类型的选择
在选择数据类型时,应该考虑数据的存储需求和计算精度等因素。以下是一些常见数据类型的选择建议:1. 整数类型(int、bigint等)用于存储整数数据。如果需要存储较大的整数,可以选择bigint甚至decimal类型。2. 浮点数类型(float、double等)用于存储具有小数部分的数据。浮点数类型可以存储非常大的值,但是其精度相对较低。3. 定点数类型(decimal)可用于需要高精度的数值计算,例如货币计算。原创 2023-04-12 23:02:49 · 677 阅读 · 0 评论 -
MySQL的5种数据类型
数据表由多个字段组成,每个字段在进行数据定义的时候都要确定不同的数据类型。向每个字段插入的数据内容决定了该字段的数据类型。MySQL 提供了丰富的数据类型,根据实际需求,用户可以选择不同的数据类型。不同的数据类型,存储方式是不同的。主要讲了整数型数据、浮点型数据、时间和日期型数据、字符串型数据和二进制型数据。原创 2023-04-12 17:25:06 · 3105 阅读 · 0 评论 -
MySQL语句注释、运行顺序、帮助系统
mysql 语句注释、执行顺序以及帮助系统的使用MySQL语句的执行顺序如下:FROM:确定要查询的表;ON:指定表与表之间的连接方式;JOIN:根据ON条件连接表;WHERE:对查询结果进行筛选;GROUP BY:将查询结果按照指定的列进行分组;WITH ROLLUP:将分组的结果再次聚合;HAVING:对分组后的结果进行筛选;SELECT:查询需要的数据列;DISTINCT:去重;ORDER BY:对结果集进行排序;LIMIT:指定返回结果的数量。原创 2023-04-08 14:03:04 · 461 阅读 · 0 评论 -
MySQL数据库基础操作
主要介绍了MySQL数据库的相关操作,如:数据库的创建、查看、修改、删除、选择等原创 2023-04-08 13:26:18 · 428 阅读 · 0 评论 -
MySQL的基础知识
SQL 具有如下优点。SQL 包含以下 4 部分:1)数据定义语言(Data Definition Language,DDL)用来创建或删除数据库以及表等对象,主要包含以下几种命令:2)数据操作语言(Data Manipulation Language,DML)用来变更表中的记录,主要包含以下几种命令:3)数据查询语言(Data Query Language,DQL)用来查询表中的记录,主要包含 SELECT 命令,来查询表中的数据。4)数据控制语言(Data Control Language,DCL)用来原创 2023-04-06 20:02:52 · 60 阅读 · 0 评论 -
MySQL入门
开源数据库具有免费使用、配置简单、稳定性好、性能优良等特点,而数据库正是开源数据库中的杰出代表。开源软件最大的特点应该是开放,也就是任何人都可以得到软件的源代码。可以在源代码的基础上加以修改学习,甚至重新发放,当然是在版权限制范围之内。原创 2023-03-28 21:29:51 · 97 阅读 · 0 评论 -
数据库入门
在日常生活中,随处可见数据库系统的应用。本文主要从身边的数据库,数据管理的三个阶段,数据库,数据库的优势,数据库系统以及常见数据库访问链接等方面展开论述。原创 2023-03-27 22:53:33 · 241 阅读 · 0 评论 -
MySQL之窗口函数
怎么样得到各部门工资排名前N名员工列表?查找各部门每人工资占部门总工资的百分比?累计求和如何计算?对于这样的需求,使用传统的SQL实现起来比较困难。这类需求不是简单的聚合可以实现的,费时费力且性能低下,难以维护。要解决此类问题,最方便的就是使用窗口函数。...原创 2022-08-06 22:55:48 · 4327 阅读 · 0 评论 -
MySQL的下载、安装和配置
本文是MySQL的下载、安装和配置。MySQL是一个关系型数据库管理系统是最流行的关系型数据库管理系统之一,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型和大型网站的开发都选择MySQL作为网站数据库。目前最新版本为8.0.29。...原创 2022-07-22 17:48:39 · 7303 阅读 · 0 评论 -
python.可视化基础
折线图 plot柱形图 bar直方图 hist箱线图 box密度图 kde面积图 area散点图 scatter饼图 pie可视化图的美化和丰富散点图的叠加绘制子图原创 2022-06-09 17:04:50 · 210 阅读 · 0 评论 -
python.(numpy,pandas)基础
numpy:基于矩阵的数学计算库。pandas:基于表格的统计分析库。numpyIn [1]: import numpy as npIn [2]: np.array([1,2,3])Out[2]: array([1, 2, 3])In [3]: type(np.array([1,2,3])) ...: #数据类型为n维数组Out[3]: numpy.ndarray#数组和列表类似,索引也类似In [4]: a = np.array([1,2,3])In [5]: a.原创 2022-05-27 23:44:40 · 158 阅读 · 0 评论 -
Python.函数基础
函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。...原创 2022-05-27 13:38:17 · 98 阅读 · 0 评论 -
python.读取sql数据
使用pandas读取sql查询后的数据。1. 需要使用sqlalchemy包import sqlalchemyimport pandas as pd2. 创建数据库连接,这里使用的是pymysql# engine = sqlalchemy.create_engine("mysql+pymysql://username:password@ip:port/store_name")#用户名:username, 密码:password,端口号:port,数据库名:store_namee.原创 2022-05-19 22:15:25 · 4602 阅读 · 0 评论 -
Python.控制流.随手记
控制流分为顺序,分支,循环;常用函数 if、while、for。注意:位置格式(缩进规则)、冒号。1.if函数In [1]: a=10In [2]: if a>10: ...: print('>10') ...: #elif是为了排除上边if的数据 ...: elif a==10: ...: print('=10') ...: else: ...: print('<10') =10In [1]: ..原创 2022-05-18 21:21:04 · 166 阅读 · 0 评论 -
统计基本知识
描述统计学其数据分为数值数据和分类数据。统计度量MEDIAN 函数返回中位数; MODE众数; weeknum 返回一年的第几周; weekday周几; var.p方差 stdev.p标准差(单位统一); 四分位数QUARTILE(array,quart)函数 array表示需要计算四分位点的数据集,quart决定需要返回哪一个四分位点。 quart参数的值在0~4之间,如果,0表示需要返回最小值;1表示需要返回第一个四分位点,即25%处的数据;如果该参数为2,表示需要返回第二个四分.原创 2022-05-07 11:31:50 · 247 阅读 · 0 评论 -
MySQL的基本操作——练习
基础知识MySQL的基本操作_x qing的博客-CSDN博客本文将完成以下练习:统计不同月份的下单人数? 统计用户三月份的回购率和复购率? 统计男女用户的消费频次是否有差异? 统计多次消费的用户,第一次和最后一次消费间隔是多少? 统计不同年龄段,用户的消费金额是否有差异? 统计消费的二八法则,消费的top20%用户,贡献了多少额度?不同月份的下单人数SELECT month(paidTime), count(userId),count(distinct userId) FR..原创 2022-05-05 13:07:37 · 962 阅读 · 0 评论 -
MySQL的基本操作
下载并安装MySQL,本文以下面的MySQL数据库为主排序orderbyxxx 升序; orderbyxxx desc 降序; orderbytt,hh tt和hh升序 中文的升序、降序没有显著的规律过滤、筛选where companyId=4184,选出companyId为4184的; where city="北京",中文的要加上引号; where companyId between 50 and 60,选择50到60之间的;...原创 2022-05-05 10:35:03 · 108 阅读 · 0 评论 -
图表——使用小技巧
首先做图表时,需要对图表着色,这个color.adobe.com配色网站应该能帮助不会配色的同学。下面以散点图为例。一、移动坐标轴,按需要分象限 按照给定数据自动生成了 选中纵(横)坐标轴——右击——设置坐标轴格式——在坐标轴选项中——选择横(纵)坐标轴交叉——在坐标轴值中设置自己需要的即可。二、给不同象限着不同色 上图中四个象限表现的结果都是蓝色的。首先我们先把数据分象限排序。 经过上面操作,把不同象限的数...原创 2022-04-29 11:18:51 · 971 阅读 · 0 评论 -
Excel常用函数——计算统计函数
Sum、Sumproduct、Count、Max、Min、Rank、Rand、Randbetween、Averagea、QuartileStdev、Substotal、Int、Round。1 Sumproduct.Sumproduct有两个英文单词组成,sum是和,product是积,所以是乘积之和的意思。2QuartileQUARTILE(array,quart)函数它的功能是返回数据集的四分位点,quart从0-4。3 StdevSTDEV(number1,numbe.原创 2022-04-23 17:33:03 · 607 阅读 · 0 评论 -
Excel 常用函数——关联匹配函数
1 Lookup说明:lookup函数,用于从一列或一行或数组中查找一个值。2 Match返回符合特定值特定顺序的项在数组中的相对位置。MATCH(lookup_value, lookup_array, [match_type]),第三个为可选参数默认为1。4Offsetoffset函数(参考系,向下移动几格,向右移动几格,x“行”,y“列”)最终确定一个或一些数据)5 Indexindex(array,row_num,column_num)。Column返回列号;Row返回行号原创 2022-04-23 13:24:12 · 3475 阅读 · 0 评论 -
Text函数的使用
将数值转换为按指定数字格式表示的函数。TEXT函数是一个非常有用的函数。1、语法TEXT(value,format_text)Value 要处理的数值Format_text 格式代码:与“设置单元格”中的“数字”是对应的,同时也支持自定义。2、text常用格式代码与例子日期:条件:TEXT(数值,"[>0]文本;[<0]文本;文本")默认是:[>0];[<0];[=0],此时[]和内部均可以省略如果需要自定义条件判断,则方括号不可省略。..原创 2022-04-22 14:01:44 · 5755 阅读 · 0 评论 -
数据分析师——业务
一、业务为什么重要?二、经典的业务分析指标1、指标(模型未动,指标先行)指标=结构化+公式化+业务化好的指标应该是比率(一个数值不能代表什么) 核心指标(主要目标) 好的指标应该能带来显著效果 好的指标不应该虚荣(效果和付出应有一定比例,不能增加一些流量,但是花费巨大) 好的指标不应该复杂2、市场营销指标客户/用户生命周期 企业/产品和消费者在整个业务关系阶段的周期。分为潜在用户,兴趣用户,新客户,老/熟客户,流失客户。用户价值 用户贡献 =...原创 2022-04-21 23:24:22 · 402 阅读 · 0 评论