- 博客(202)
- 资源 (36)
- 收藏
- 关注
原创 数据分析思维模型和方法
数据分析从入门到进阶很重要的一个就是分析方法和思维,这个可以说是数据分析的底层能力。数据分析是一种能力,任何岗位都应该具备一定的分析方法和思维。
2022-08-22 23:10:19 234
原创 数据异常问题分析方法
对于数据分析师而言,监控日常指标数据是必不可少的工作,数据异常分析也是数据分析工作中最常见且重要的分析主题。且指标异动问题也是面试的高频考点。
2022-08-18 00:27:16 789
原创 数分面试(一)----与业务相关
现定为新用户第一次登录时间为第0天,新用户定义为第一次登录的用户,登录行为的代号为1。次日留存率:第0天新增用户中,新增日之后的第1天还登录的用户数 / 第0天新增总用户数;7日留存率:第0天新增用户中,新增日之后的第7天还登录的用户数 / 第0天新增总用户数;30日留存率:第0天新增的用户中,新增日之后的第30天还登录的用户数 / 第0天新增总用户数;...
2022-08-02 23:00:21 206
原创 子查询作为检索表时的不同使用场景以及是否需要添加别名的问题
子查询主要分为以下三种情况,其中对应的情况如下: 1.单行单列 也就是结果是一个的 例如 1,此种情况不需要起别名 2.多行单列 也就是结果是一组数据的 例如(1,2,3),此种情况不需要起别名 3.多行多列 也就是结果是一张表,此种情况需要起别名,才能访问表中字段......
2022-07-28 00:12:17 892
原创 【遗传算法】求解TSP问题
旅行商问题,即TSP问题(Traveling Salesman Problem)又译为旅行推销员问题、货郎担问题,是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市,他必须选择所要走的路径,路径的限制是每个城市只能拜访一次,而且最后要回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路径之中的最小值。遗传算法求解TSP问题...
2022-06-26 16:06:07 8620
原创 Mysql触发器
触发器,就是一种特殊的存储过程。触发器和存储过程一样是一个能够完成特定功能、存储在数据库服务器上的SQL片段,但是触发器无需调用,当对数据库表中的数据执行DML操作时自动触发这个SQL片段的执行,无需手动条用。 ②在MySQL中,只有执行insert,delete,update操作时才能触发触发器的执行 ③触发器的这种特性可以协助应用在数据库端确保数据的完整性 , 日志记录 , 数据校验等操作 ④使用别名 OLD 和 NEW 来引用触发器中发生变化的记录内容...
2022-06-21 00:26:01 160
原创 Mysql索引
索引是存储引擎用来快速查找记录的一种数据结构,按照实现的方式类分,主要有Hash索引和B+Tree索引 B+Tree索引 创建主键索引的方式常常有两种②修改表结构 添加主键索引 4.4.2、唯一索引(UNIQUE)(了解)特点: 索引列的所有值都只能出现一次, 必须唯一. 唯一索引可以保证数据记录的唯一性。 事实上,在许多场合,人们创建唯一索引的目的往往不是为了提高访问速度,而只是为了避免 数据出现重复。...
2022-06-19 15:52:25 177
原创 【思维方法】之第一性原理
通常人们对事物的认知有两种逻辑形式,第一种逻辑形式叫做归纳法,归纳法是对感性经验的归纳,第二种是更高级一点的逻辑形式叫做演绎法,演绎法是对理性思维的演绎。
2022-06-11 21:29:02 1093 1
原创 Hadoop及Hive环境介绍
重点讲述Hadoop及Hive的环境介绍,主要的内容包含有分布式文件系统[HDFS] 、分布式计算(MapReduce)、数据仓库工具(Hive)、数仓分层 等相关的知识
2022-06-10 23:59:28 300
原创 格式错误的转换处理(含日期格式以及编码格式错误)
在工作中,碰到了load CSV文件时,日期格式读写错误的情况,CSV文件的日期格式显示为date的格式,即为yyyy-MM-dd hh:mm:ss,但hive在读取日期格式的数据时,自行转换成了yyyy/MM/dd的这种字符串格式。
2022-05-28 08:48:47 2134
原创 MySQL实现商品协同过滤系统推荐
在讲解该项目之前,我们先了解下,协同过滤的常规业务场景与作用。你想想抖音里,你看的小说里,是不是会发现你喜欢的内容都几乎比较同质化,或同类化,这都是商家在后台进行了一定的用户画像以及使用了一定的推荐算法来实现的,本文不在于讲解推荐算法,重在讲解以推荐算法的数学模型的基础上以MySQL的方式来进行数据分析。当数据量大到一定程度后,往往会采用Hive或者MySQL数据库存储数据,数据量较大时,往往在使用编程语言读取内容会较为吃力,故本文在以MySQL的视角下分享协同过滤的问题。
2022-05-25 00:59:36 437
原创 创建表时出现Duplicate column product问题的解决
本文将介绍MySQL在创建表时出现‘Duplicate column product’问题的解决方法,问题如下
2022-05-21 19:29:57 1398
原创 01路径规划问题的相关理论
本专栏将会由浅入深的讲解各种VRP问题,包括从不同的VRP问题,以及对应的智能优化算法以及源码分享等,目前VRP专栏的更新进度才刚开始,敬请各位朋友们耐心等待,也欢迎对VRP问题感兴趣的朋友关注此专栏,因为工作原因,整理项目包括排版分享等工作较耗时间,但作者相信,大家的等待一定是值得的。
2022-05-15 17:17:38 7842 5
原创 MySQL函数【2】之高阶窗口函数的应用
上一章节讲述了MySQL函数的基础应用,包括数学函数、日期函数、字符串函数、条件判断函数以及系统函数,本小节将会讲述函数查询的大杀器----高级窗口函数,若是在面试过程中考到了SQL问题,窗口函数是必会被提问的,所以窗口函数在SQL中的地位就举足轻重,是必须且重点掌握其使用方法。
2022-05-15 03:24:17 287
原创 机器学习初级项目--房价预测案例
项目背景:运用回归模型进行房价预测。 影响房价的因素有很多,在本题的数据集中有79个变量几乎描述了爱荷华州艾姆斯(Ames,lowa)住宅的方方面面,要求预测最终的房价。数据介绍: 我们要使用BartdeCock于2011年收集 [DeCock,2011], 涵盖了 2006−2010 年期间亚利桑那州埃姆斯市的房价。技术栈: 特征工程(Creative feature engineering) 回归模型(Advanced reg
2022-05-14 21:42:44 1340
原创 MySQL函数【1】之基础应用
前面章节讲述了MySQL的增删改查功能,其中针对Mysql的查询做了非常详细的梳理与介绍,在掌握基本的Mysql语法以后,我们接下来将会重点对于常用到的Mysql函数以及核心大招函数--高级的窗口函数进行讲解,相信学完本小节,你基本可以应对绝大多数的业务场景了。前面章节讲述了MySQL的增删改查功能,其中针对Mysql的查询做了非常详细的梳理与介绍,在掌握基本的Mysql语法以后,我们接下来将会重点对于常用到的Mysql函数以及核心大招函数--高级的窗口函数进行讲解,相信学完本小节...
2022-05-13 00:35:26 225
原创 MySQL核心查询【2】多表查询
上一章节讲述了MySQL核心查询【1】之单表查询以及单表与多表之间的关系约束,本章节就能顺理成章的过渡到多表查询。连接是关系数据库模型的主要特点。连接查询是关系数据库中最主要的查询,主要包括内连接、外连接等。通过连接运算符可以实现多个表查询。在关系数据库管理系统中,表建立时各数据之间的关系不必确定,常把一个实体的所有信息存放在一个表中。当查询数据时,通过连接操作查询出存放在多个表中的不同实体的信息。当两个或多个表中存在相同意义的字段时,便可以通过这些字段对不同的表进行连接查询。本节将...
2022-05-09 01:29:34 347
原创 查找在职员工自入职以来的薪水涨幅情况
查找在职员工自入职以来的薪水涨幅情况,给出在职员工编号emp_no以及其对应的薪水涨幅growth,并按照growth进行升序
2022-05-08 17:35:39 690
原创 MySQL核心查询【1】单表查询与SQL约束
上一小节重点针对简单的增删改查做了讲解汇总,本小节将进入SQL查询的核心阶段,主要是排序查询、分组查询、聚合查询以及分页查询,最后在文章的末尾也讲解了SQL的相关约束,为讲解多表查询打下基础。1、排序查询如果我们需要对读取的数据进行排序,我们就可以使用 MySQL 的 order by 子句来设定你想按哪个字段哪种方式来进行排序,再返回搜索结果。(排序只是显示效果,不会影响真实数据)。
2022-05-04 22:06:14 765
原创 机器学习实战之KNN实现mnist手写数字分类
在讲述完机器学习算法之后,本小节将会带领大家一步一步根据算法原理来自己实现算法设计,而不是直接调用现有的机器学习算法库,通过该阶段的学习与训练,相信你会对算法的原理有更深入的一个认识,对机器学习的认识也会更上一层楼,真正理解算法的工作原理。
2022-04-29 21:43:36 1957
原创 数据分析学习目录
如下为数据分析的整个目录一、数据分析思维二、数据分析中常用的Excel技巧三、MySQL编程四、可视化BI软件五、大数据六、数据分析的编程基础七、统计学理论八、数据挖掘九、数据分析项目............................................................
2022-04-21 22:02:38 2537
原创 获取当前薪水第二多的员工的emp_no以及其对应的薪水
该文章主要记录在学习SQL的过程,觉得比较好的一个SQL题,作为记录学习。请你获取薪水第二多的员工的emp_no以及其对应的薪水salary
2022-04-16 22:46:43 1249
原创 Mysql中字符串提取函数substring以及substring_index
如下重点讲述数据库Mysql中,字符串的两个函数用法,主要用于提取字符串。1、substring()函数作用:从具有特定长度的位置开始提取一个子字符串。SUBSTRING(string,position)有两个参数:string参数是要提取子字符串的字符串。position参数是一个整数,用于指定子串的起始字符,position可以是正或负整数。如果position为正,则SUBSTRING函数从字符串的开始处提取子字符串。请参阅以下字符串。例如,要从“MySQL SU
2022-04-10 19:13:34 731
原创 PS安装出现浏览器或操作系统不支持以及需要登录的处理方式
前面的基础操作就不做过多赘述,傻瓜式解压安装,重点讲述后面的操作过程。1.双击鼠标打开软件【Photoshop CC 2019】注意点:关闭网络状态,不然以后右会弹出问题窗口2.将压缩包内的内容解压到D盘【Photoshop CC 2019】文件夹。文件夹一般放在D盘,反正不要是C盘就行,放哪无所谓。选中【Set-up.exe】文件后,鼠标右击选择【以管理员身份运行】。安装完成后,点击最右上方的关闭按钮。若出现【我们无法验证您的订阅状态】或其它相关错误时,点击【退出Photoshop C
2021-11-07 13:23:37 37086 5
原创 Dijkstra算法求解图中最短路径距离
前言:这里是自学内容,讲解的是用python来实现Dijkstra算法,算是入门求解图中最短路径问题的典型案例。算法简介: 迪杰斯特拉(Dijkstra)算法是一个按照路径长度递增的次序产生的最短路径算法。下图为带权值的有向图,作为程序中的实验数据 其中,带权值的有向图采用邻接矩阵graph来进行存储,在计算中就是采用n*n的二维数组来进行存储,v0-v5...
2019-07-19 15:13:27 4986 1
多目标灰狼算法MOGWO资源matlab代码实现
2024-06-04
cplex代码与学习资料包含多种运筹优化问题
2023-10-26
遗传算法求解非线性函数的Matlab资源
2023-05-10
模拟退火算法求解TSP问题资源python实现
2023-03-30
粒子群算法求解TSP问题资源python实现
2023-03-30
蚁群算法求解TSP问题资源python实现
2023-03-30
TSP-collectionTSP算法全复现 - 资源包含8种算法
2023-03-27
VRPTW-GA-Matlab源代码(具有时间窗的车辆路径问题)matlab
2023-02-26
VRP-MultiDepot(Matlab)多配送中心的路径规划问题(Matlab)
2023-02-12
PSO-VRPTW-Matlab版本粒子群优化算法求解带时间窗的路径规划问题(Matlab版本)
2023-02-12
从零开始将金融数据分析全套代码资料
2022-07-06
电商排序数据分析(含电商代码分析、推荐排序、小组实验聚类,完整的数据)
2022-07-06
经纬度转换&测距(企业内部使用工具)
2022-06-19
GOC-EVRPTW京东物流仓储网络智能库存管理赛题解决方法
2022-05-25
VRPSPDTW问题(具有同时配送和时间窗的车辆路径问题),算法具有高效的局部搜索和扩展邻域的功能
2022-05-23
强化学习(一个端到端的框架)解决车辆路径问题
2022-05-22
Dynamic Attention Model for Vehicle Routing Problems
2022-05-15
Python数据分析实战源代码
2022-05-15
机器学习初级项目--房价预测案例
2022-05-15
VRPCTW-MultiDepot(python)多中心的带时间窗的路径规划问题(python)
2022-05-13
多目标多商品的二级车辆路径问题(M2-2E-VRP)
2022-05-13
ALNS-VRPPD(Python)自适应大邻域搜索解决取送货的VRP问题(Python)
2022-05-13
Pickup-Delivery-VRP(python)取送货的VRP问题(Python)
2022-05-13
改进版PSO-VRPTW-Python 改进版粒子群算法求解带时间窗的车辆路径问题(python)
2022-05-13
VRPTW-Column-Generation(Python)列生成算法求解VRPTW问题(Python)
2022-05-13
multi-objective two-echelon Vehicle Routing多目标二级车辆路径问题的协同进化算法求解
2022-05-13
VRP-CW-python节约算法求解VRP问题(Python)
2022-05-13
GA-VRPTW-python版本遗传算法求解带时间窗的路径规划问题(Python版本)
2022-05-13
Multi-Objective PSO in MATLAB多目标粒子群优化算法(MOPSO)
2022-05-07
资源为多目标优化的升级版NSGA-III,该算法是以结构化的方式实现 使用参考点方法处理多目标优化问题
2022-05-06
在MATLAB的distribution中使用经典方法和智能方法(PSO、ICA、NSGA-II和SPEA2)进行投资组合优化
2022-05-05
供应链需求预测赛题数据集与TOP10模型方法 该资源考为虑商品制造、航运、商品入仓等链路过程中一个远期的商品销售预测模型方案
2022-05-03
VRPTW data and best solve 带时间窗的测试数据集与对应的最优解
2022-05-03
GA&NSGA-II for job shop schedul遗传算法和改进的非支配排序遗传算法(Python版本)
2022-04-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人