自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 收藏
  • 关注

原创 数据挖掘与机器学习

【代码】数据挖掘与机器学习。

2024-04-18 21:23:20 1222 1

原创 pandas(用户画像)

【代码】pandas(用户画像)

2024-04-13 20:21:43 312

原创 pandas(day10)

result 是各个产品结构(比如金牛),对每个结构的数量进行热力图绘制。不同的渠道, 带来的用户质量(客单价 退货率 转换程付费率) 微信视频。50W 7点 开投 - 9店 10点。ROI : 投资回报比。

2024-04-11 23:45:12 246

原创 pandasday9( 细分市场的趋势)

是已经删除列全部为空,且空缺值大于90%,以及一些无用列的数据。

2024-04-10 23:30:25 191

原创 pandas(day8 市场分析案例)

假设现在有100公司 期中有一家占据89%的份额 其它的99家平分11%的份额 假设现在有100公司 期中有一家占据50%的份额 其它的99家平分50%的份额 假设现在有100公司 期中有一家占据30%的份额 其它的99家平分70%的份额。'.\\盘香灭蟑香蚊香盘市场近三年交易额.xlsx''.\\电蚊香套装市场近三年交易额.xlsx''.\\蚊香加热器市场近三年交易额.xlsx''.\\蚊香液市场近三年交易额.xlsx''.\\蚊香片市场近三年交易额.xlsx'

2024-04-10 00:19:19 315

原创 pandas(day7 其他图形 及 seaborn库 )

【代码】pandas(day7 其他图形 及 seaborn库 )

2024-04-08 23:29:11 264

原创 pandas(day6 图表)

【代码】pandas(day6 图表)

2024-04-07 23:01:47 452

原创 pandas(day5)

map() (是对series 进行循环的)if x<5:return "午夜"elif x<8:return "凌晨"elif x<12:return "早晨"elif x<15:return "中午"elif x<19:return "下午"elif x<22:return "傍晚"else:return "深夜"data["时段"] = data.日期.dt.hour.map(func)

2024-04-06 00:17:38 862

原创 pandas (day4)

但是 "老二" 表 已经是聚合过的 (按照城市 计算过sum) ,所以 df表也需要 groupby 城市 和 订单id。pd.pivot(data , index , columns) 透视数据 ,但是都是去重的(唯一的)

2024-04-05 16:30:37 438

原创 pandas ( day3)

数值越大,偏得越厉害。这里的 m 是样本量。

2024-04-02 09:28:07 761

原创 Pandas(day2 数据类型)

DataFrame[ " 列名 " ] = DataFrame.列名. mean() 计算平均 (就是写你要的数据)把最后一行复制下来,将订单id 改为 b01 加入到最后。1 : 正相关越强烈 一同增长 0.03。标准的正态分布(高斯分布 常态分布)-1 : 负相关 此消彼长。样本方差 就是 分母 -1。方差越接近 0 越相似。

2024-03-31 18:06:36 344

原创 pandas(day1)

numpy 生成的是 array 数组类型。

2024-03-29 00:09:44 410

原创 week08day01(power bi)

人口数量大量下降 , 一定会导致 需求量 下滑 , 但是有可能 导致 财富聚集 , 导致消费升级 , 服务业人员空缺。指数数量特别大,所以需要同一种的图片,聚合大量的指标,否则需要很多的小图形或卡片进行显示。技术含量 : 二醋酸 营销升级 服务升级。人的认知 : 汽车 大家电 手机 电脑。本期指标计算(算最后一天 , T+1)带入到商业数据中 : 阿里大数据。人口出生率低 : 母婴行业。

2024-03-18 22:55:32 392

原创 week07day04(powerbi 概况指标体系)

经营概况是表述公司经营现状的集中性反映,可以让管理决策层快速了解宏观的基本信息,了解当前情况是否是健康的。

2024-03-16 21:49:43 397

原创 week07day03(power bi dax公式 零售数据业务分析)

核心业务表,事实表包含与业务过程或事件相关的数值、度量或事实数据,例如销售金额、数量、成本等。DATESBETWEEN('日期时间表'[日期],DATE(2019,6,1),DATE(2019,06,30)),在事实表中添加维度表中的一列内容,#RELATED : 将维度表 当中的 "借用(复制)" 列 到 事实表。(Month-to-Date)TOTALMTD( sum([金额]),'日期时间表'[日期],'销售表'[金额] >0)将销售表的日期和日期时间表连接,统计是按照日期时间表的日期进行计算。

2024-03-14 20:44:32 848

原创 week07day02(powerbi)

4. 透视列中存在高级选项,根据所需选择相应功能(一般对于文本数据,可以选择高级选项中的不要聚合)1. 选择一列,然后再转换中选择透视列,被选择的这一列就会变成。1. 逆透视列就是将 横着数据的变成 竖着的数据(恢复成行数据)3. 透视表是二维表,数值匹配不上会用 null值 替代。返回为表中的每一行计算的表达式的和 (返回的是度量值)2. 只能选择一列,不能同时选择多列。

2024-03-14 09:15:12 366

原创 week07day01(powerbi)

power query: 进行简单的数据清洗power pivot : 进行指标计算power view : 进行报表视图。

2024-03-12 22:39:48 490

原创 week07day01(窗口函数)

对数据进行分区,数据的样式是不改变的,但是会多添加一列。窗口函数只能写在"结果集"中。

2024-03-12 01:17:13 880

原创 week06 day04 (数据库高级函数 procedure 、sql写函数)

调用直接 select#语法:Create function 函数名(形参) returns 返回的数据类型begin//函数体end#第一步#不带参数的函数beginreturn 123;end//#调用函数#Linux中的mysql不支持函数#先查看是否支持#进入/etc/my.cnf#放在[mysqld]#写好以后重启mysql服务器#带参数beginreturn num;end //#删除函数#自己封装 首字母大写beginend//

2024-03-09 17:06:13 969

原创 week6day03

111。

2024-03-08 20:00:51 104

原创 week06 day02(sql gropy by 、having、order by、limit、运算符、函数)

因为select 在sql执行中,在where和having之后,所以你给别名age,在where或者having进行条件筛选时没有作用,创建临时表,可以有效解决这一问题。这里用了 临时表, group by 分组, having 对分组后的结果进行进一步筛选。当不使用group_concat时,结果如下图,上海后的name只有一个人名字。在模糊查询中,_ 代表的是匹配一个字符串, %代表是0~多位。条件字段必须要在结果集中出现。城市有重复,看一共有哪些城市。GROUP BY 的后面。

2024-03-06 20:56:39 889

原创 week06day01 mysql

- varchar(65535/4) 65535是varchar最大容量,因为是uft8mb4,一个是4位,所以65535/4 是长度。alter table `表名` change `原字段名` `新的字段名` 数据类型 属性;# 特点: 复制后的表结构与原表相同,但是⾥⾯没有数据,是⼀张空表,可以复制主键。alter table `表名` add `字段名` 数据类型 属性;特点: 完整的复制⼀个表,既有原表的结构,⼜有原表的数据,不能复制主键。在cmd 中 输入 ipconfig。

2024-03-05 21:25:59 919

原创 week04day04(爬虫)

一.嵌套构造URL下载所有英雄的皮肤图片:因为每个英雄图片的网址不同,但是有共同点,通过构建这个网址,再经过循环建立 所有链接import requestsimport os# 1. 获取所有英雄的IDdef get_all_hero_id(): url = 'https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js' res = requests.get(url).json() retur

2024-02-23 19:10:24 415

原创 week04day03(爬虫 beautifulsoup4、)

json在netwok 中的 fetch/xhr 中找。

2024-02-22 17:40:57 611

原创 week04day02(爬虫02)

通过get请求加资源地址获取图片源文件。通过源码+re正则获取想要的数据列表。通过列表的循环一一获取资源地址。需要通过get获取网页源代码。

2024-02-21 17:03:13 414

原创 week04day01(爬虫)

200 成功# 1xx 服务器返回信息代码 2xx成功状态码 3xx重定向代码 4xx 客户端错误代码 5xx服务器错误代码# 响应头:包含了服务器返回的元数据,例如内容类型 编码方式 时间等# 响应的原始字节数据# 返回响应解码后的文本内容#尝试转为json格式'''html 提供网页内容 超文本标签语言css 设置内容的样式和布局js 复杂页面的变化'''

2024-02-20 16:59:05 1765

原创 week03day05(类和对象)

类就是分类,类别;就是对拥有相同属性或者相同功能对象的集合。对象:对象就是这个概念的具体表现。例如人就是类,我和具体的某一个人就是人类的对象。保温杯是类,我的保温杯就是对象'''语法:class 类名:类的说明文档类的内容说明:class - 关键字,固定写法类名 - 由程序员自己命名(采用大驼峰命名方式)类的说明文档: - 本质就是多行注释类的内容: - 包含属性和方法1. 属性:定义在类的变量,分为类属性和对象属性2.方法: 定义在类中的函数,分为对象方法、类方法和静态方法。

2024-02-02 15:55:14 221

原创 week03day04(正则表达式2)

如果在正则表达式中有不确定的匹配次数,这个正则在匹配字符串的时候可以分为贪婪和非贪婪两种模式#这样只会选择amnb, +?是取最小的满足匹配规则的# 想让一个小数进行匹配, 因为 . 在正则中是匹配任意字符功能,加个 \ ,让其功能消失# 放在[] 里 符号失去功能。

2024-02-01 17:11:54 1127

原创 week03day03(文件操作、正则表达式1)

正则表达式是一种可以让复杂的字符串问题变得简单的工具不管通过正则表达式解决的是什么样的字符串问题,写正则表达式都是在描述字符串规则。

2024-01-31 17:24:46 1031

原创 week03day02(迭代器)

容器型数据类型,可以同时保存多个数据不能直接用代码创建一个迭代器数据,只能将别的容器转换成迭代器是一个可以创建多个数据的容器(不具备同时保存多个数据的能力)(例如母鸡和鸡蛋关系)模块就是py文件程序报错就叫程序出现异常程序如果在执行过程中出现异常,程序会直接结束(执行之前的正常输出)

2024-01-30 17:16:41 616

原创 wee03day01(函数的返回值)

返回值就是从函数内部传递到函数外部的数据(实现函数功能的时候可能会产生新的数据,这个数据如果不通过函数的返回值返回,在函数外部是无法使用这个数据的)#错误代码### 会报错本质还是函数(匿名函数是可以用一条语句来实现函数功能的)

2024-01-29 21:55:43 836

原创 week02day05(函数)

函数就是实现某一特定功能的封装。(函数就是把实现了某个功能的所有代码打成一包,以后需要这个包中包含的代码实现的功能的时候直接使用函数)。由程序员自己创建的函数def 函数名( 形参列表 ):函数说明文档函数体'''说明:def - 关键字;固定写法函数名 - 由程序员自己命名- 两个要求: a.标识符 b.不是关键字- 三个规范:a.见名知意b. 所有字母小写,单词和单词之间下划线隔开(不用驼峰式命名)c.不使用系统函数名、类名和模块名() : - 固定写法。

2024-01-26 21:38:42 634

原创 week02day04(字符串、格式字符串)

str.maketrans(字符串1,字符串2) --- 让字符串1和字符串2中的字符一一对应创建一个对应关系表。字符串1.rindex(字符产2) ---- 字符串1中查找倒数第一个字符串2出现的位置。字符串1.split(字符串2,N ) ---- 将字符串1中的前n个字符串2作为切割点对字符串1进行切割。字符串1.rfind(字符串2) --- 字符串1中查找倒数第一个字符串2出现的位置。字符串1.find(字符串2, 开始下标,结束下标)

2024-01-25 17:12:57 851

原创 week02day03(集合、 字符串、字符编码)

是一种容器型数据类型;{ } 作为容器的标志,里面多个元素用逗号隔开 {数据1,数据2,数据3,......... }集合是可变的、是无序的#True集合的元素:元素必须是不可变类型的数据;元素是唯一的(自动去重)空集合表示s1 =set()字符串是容器型数据类型,可以保存多个文字符号。将 ' ' , " " , ''' ''' , """ """ , 作为容器的标志。''' ''' , """ """, 为多行字符串,里面的内容可以直接通过回车键进行换行。

2024-01-24 17:15:19 839

原创 week02day02(字典、元组)

字典是容器型数据类型;将{ }作为容器的标志,里面多个键值对用逗号隔开:{键1:值1,键2:值2,键3:值3, .....}字典是可变的(支持增删改),字典是无序的(顺序不影响结果,不支持索引操作)字典对元素的要求字典中的元素必须全部是键值对,键值对必须成对出现键必须是不可变类型数据,一般为字符串。键是唯一的没有要求dict1 = {} #空字典print({'a':10, 'b':20} == {'b':20, 'a':10}) #字典是无序的 True#键必须是不可变类型的数据。

2024-01-23 20:41:09 883

原创 week2day1 列表操作()

输出为奇数, 因为if x % 2 进行判断时,答案为True (1)才运行,x为奇数余数才为1,所以这是判断为奇数时才继续运行。值1 if条件 else 值2 (判断条件是否成立,如果成立结果为值1,否则值2)值1:值2 (条件为真 运算结果为值1, 否则为值2)分析:用的三目运算符, 遍历nums, 如果为偶数,整除2,否则*2.利用列表推导式将nums中所有的偶数都除以2,所有奇数*2。利用列表推导式将nums是中所有的元素都乘以2。利用列表推导式提取nums中所有的偶数。

2024-01-22 17:07:13 809

原创 Day05 python的基础知识及语法(列表)

列表是python自带的一种容器型数据类型。将[ ]作为标志,里面用多个逗号隔开:[数据1,数据2,....... ]列表是可变的(可变是指列表中的元素个数和值是可以变化的-)支持增删改列表是有序的(其顺序影响结果,支持索引操作列表对元素(容器中每一个独立的数据)没有要求,而且同一个列表中的元素类型可以不一样。

2024-01-19 16:58:44 398

原创 Day04 python的基础知识及语法(for循环、while循环、循环关键字(continue\ break)、猜数字游戏)

解析:else和for 在一列时: 遍历列表,进入if循环,进行判断如果数字类型是整数型,不进入循环,再看列表中的下一个数字,再看类型。如果不是整数类型,进入循环体,打印非整数列表,然后结束整个代码。6、7 同样不进入循环体,直接输出, 但是8 ,对4取余为0, 进入循环体, break。执行循环体时如果遇到了break,整个循环直接结束(本次循环没执行的部分不再执行,也不进入下次循环)是一个控制流语句,用于跳过循环体中剩余的代码,直接进入下一次循环迭代。提示用户输入密码直到用户输入正确为止。

2024-01-18 17:25:33 1212

原创 Day03 python的基础知识及语法(变量、数字运算符、比较运算符、逻辑运算符、闰年判断、赋值运算符、if分支结构)

变量名1,变量名2, 变量名3, 变量名4 = 数据1,数据2,数据3,数据4。

2024-01-17 19:49:52 1078

原创 Day02 python的基础知识及语法(注释/数据类型及转换/print/input/变量)

注释是在代码中添加的一种说明性文本,用于解释代码的目的、提供上下文信息或添加任何其他有用的说明。注释不会被编译或执行,它们仅供开发者阅读和理解代码时参考。

2024-01-16 17:04:50 972

week08day01(power bi)

week08day01(power bi)

2024-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除