自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 【SQL学习记录】SQL Server全文本搜索

SQL Server全文本搜索

2022-08-28 20:08:32 775 1

原创 【数据分析】SQL面试题整理

-事件是在特定时刻自动执行任务,操作数据库。比如我们想在每天都执行删除过期日志,就可以创建一个事件,在每天特定时刻来自动执行这一操作。concat(字段A,字段B) 合并两个字段limit(n,m) 跳过m条语句返回前n条case when(条件1)then(结果1)when(条件2)then(结果2)else(结果3)end as(列名)DATE_ADD(Date,interval -rn day)TIMESTAMPDIFF(DAY,atime,btime)......

2022-06-11 21:47:42 479

原创 【Literature Reading】Term Set Expansion(术语集扩展/种子词扩展)

论文文献阅读

2022-06-04 15:48:00 339 3

原创 【数据分析/商业分析】面试知识点——K-Means聚类

K-Means1.简述K-Means算法原理:将样本分为K个类,类内拥有高相似度,类间相似度较低计算过程:①随机选取K个对象,作为K个类各自的中心②对剩余样本,计算与每个类中心的距离,将它赋给最近的类③根据聚类的结果,重新计算每个类的类中心(取类中所有元素各自维度的算术平均数)④将元素全部按照新的类中心重新聚类⑤重复③④步,直到聚类结果不再变化为止优化函数:(算法即优化成本函数)优点:简单易行,效果较好,只需要调一个参数K缺点:受初始类中心影响,可能会产生局部最优解。对于不是凸的数据集

2022-05-04 20:42:46 1068

原创 【数据分析/商业分析】MYSQL面试题总结

这里写目录标题1 查找第N高的薪水/成绩2 树节点3 分数排名(连续排名)4 连续出现的数字5 求每个班在年级中的人数占比1 查找第N高的薪水/成绩知识点:limit n:表示查询结果返回前n条数据offest m:表示跳过m条语句limit n,m:表示查询结果跳过m条语句,读取前y条。也就是如果n为3 m为2,那么表示跳过2条语句读取前3条,也就是读取原来顺序的第3,4,5条数据ifnull(a,b):表示如果value1不是空,返回a,若value1是空,返回bselect ifNu

2022-05-04 16:43:34 932

原创 【数据分析/商业分析】数据分析中使用的商业模型(学习总结)

总结数据分析中使用到的商业模型一、AARRR海盗模型二、RFM模型三、OGSM模型一、AARRR海盗模型模型含义关注指标解决问题A获取,用户如何发现(并来到)你的产品日新登用户数DNU1.渠道贡献的用户份额 2.宏观走势,确定投放策略 3.是否存在大量垃圾用户 4.注册转化率分析A激活,用户的第一次使用体验如何日活跃用户数DAU1.核心用户规模 2.产品生命周期分析 3.产品活跃用户流失,分解活跃用户 4.用户活跃率,活跃用户计用户量周活跃用户数W

2022-05-02 00:09:47 912

原创 【数据分析/商业分析】面试题整理——统计学/机器学习/业务专题

SQL编程专题:【数据分析/商业分析】面试题整理——SQL专题文章目录统计学机器学习SQL大数据业务知识python统计学怎么做假设检验偏态分布怎么处理假设检验的基本原理,为什么会是反证的思想假设检验的p值,显著性水平是什么,怎么理解实验的样本量怎么确定卡方,z,t检验的使用场景区别如何和一个没有统计背景的人解释MLE如果实验组、对照组的流量分配不均匀,如何消除影响解释大数定律,中心极限定理10.皮尔森相关系数以及如何解读相关、独立、线性相关的区别机器学习两个向量之.

2022-04-28 15:49:34 4596

原创 【数据分析/商业分析】面试题整理——SQL专题

数据分析\商业分析—面试题整理自己总结的SQL类的面试题文章目录数据分析\商业分析—面试题整理1.新增用户2.活跃用户数量3.连续登录4.次(n)日留存5.每个科目下分数最高的两名学生

2022-04-28 11:07:13 1310

原创 【数据结构】使用Python队列实现银行排队问题

使用python数据结构中的队列来实现银行排队问题,其问题描述如下:银行有n个窗口,总服务时间为ServTime(这两者也是所需输入的参数);每时刻都有一定概率会到达一名顾客,且顾客的所需服务时间随机生成(本文假设顾客所需服务时间范围为[1,20);顾客会选择目前等待时间总和最短的队列进行排入。4.每过一个时刻,(若该队列不为空)则队头的顾客所需服务时间-1。当其时间为0时,出队。【给大家po个视频讲解:银行排队问题之代码讲解】设计思路:该问题的设计思路如下图所示:代码实现:imp

2022-03-26 20:51:59 5753 3

原创 【网络安全模型介绍】PDR、P2DR、PDR2、PDR2A、WPDRRC

文章目录1.PDR模型2.P2DR模型3.PDR2模型4.PDR2A模型[1]5.WPDRCC模型参考资料1.PDR模型PDR模型是最早体现主动防御思想的一种网络安全模型。是后期提出其他网络安全模型的基石。[3]PDR模型提出美国ISS公司意义最早体现主动防御思想的一种网络安全模型组成①Protection :采用一切可能的措施来保护网络、系统以及信息的安全。通常采用的技术及方法主要包括加密、认证、访问控制、防火墙及防病毒等。

2022-03-09 17:10:48 24337 2

原创 消费者的“隐私悖论”与企业对消费者信息收集的合理措施 ——基于“支付宝账单事件“的思考

本文基于《中国管理案例共享中心案例库》中”支付宝账单事件:如何保护消费者信息与隐私——《ISO26000》的指引“。(案例正文可以自行寻找)——本文未经允许禁止搬运。一、关于“支付宝账单事件”的分析与问题引出尽管移动互联网的发展已经较为成熟,其安全问题仍然层出不穷。对于社交媒体网络有关的最具争议的讨论之一是关于在线环境中消费者的私人数据的使用和暴露[1] 。本文首先从“支付宝账单事件”入手,通过分析案例,进而讨论关于消费者的“隐私悖论”和企业信息收集的合理措施。该案例主体可分为“隐藏账单”和“官方

2022-03-06 22:31:54 10002

原创 【Python数据可视化】桑基图html文件无法显示的问题

如果出现打开桑基图的html文件无法显示的情况,可以去echarts官网下载桑基图的对应文件echarts.min.js(官网地址)。然后更改html源码中的src地址标签。具体操作如下:参考资料:Python桑基图制作的一些坑1、去官网下载echarts.min.js文件下载好的文件如下所示~将此文件与你生成的桑基图html文件放入同一个文件夹中。这是一个JavaScript的文件2、更改html源码这部分我是用VScode打开生成的html文件,在源码中更改一下src地址,直接保存就可以:

2022-03-06 11:49:34 2507

原创 【知识图谱可视化】csv文件_节点与关系_导入Neo4j Desktop(学习记录)

提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档本篇内容准备:一、将准备好的csv文件导入你创建的project的import文件夹下1、找到import文件夹2、将你的csv文件放置在该文件夹下二、节点数据的导入三、关系数据的导入分享一个视频资料,讲的非常详细,来自张曙光老师:用csv文件在neo4j中批量建立节点和关系准备:Neo4j Deskt

2022-02-27 11:38:14 2921 3

原创 【知识图谱可视化】Neo4j Desktop与Pycharm的连接(学习记录)

分享一下Neo4j桌面版本与Pycharm的连接。准备:pycharmNeo4j Desktop这两个软件的安装都非常简单,这里不再详细展开,详细教程参考:第一:Pycharm安装(非常详细)篇一:Neo4j图形数据库的安装与环境配置(普通版与Desktop版)下面正式操作开始(这里分为两部分:neo4j的配置 +pycharm的连接)一、关于Neo4j Desktop配置这部分参考:通过pycharm完成对neo4j数据库的连接和使用(一)(1)在Desktop里先创建一个自己的

2022-02-26 11:12:15 4521 3

原创 【知识图谱可视化】实体抽取结果预处理,Neo4j数据导入(学习记录)

本篇内容:实体抽取内容的初步数据处理(之后会发关于导入neo4j数据库的相关内容)初始数据:进行实体抽取之后的结果数据↓(这里方便举例,只拿出了小部分数据。这里解释一下数据含义,最左边是每个旅游产品的ID,第二列表示的是旅游产品中包含的景点,第三列是途径城市,第四列是住宿地点。后边同理)下面我们就正式开始!1. 实体内容抽取我们知道,图数据库的基本数据结构是“实体-关系-实体”。将这些原始数据构建成图网络,首先应该根据需要确定我们需要提取的实体和关系。在这里,我们确定具体需求为:

2022-02-25 20:25:08 3393 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除