自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

转载 共现图谱建立python+gephi

gephi安装1、gephi的下载链接:http://www.pc6.com/softview/SoftView_410864.html2、gephi使用需要配置Java环境:Jdk下载地址:https://www.jb51.net/softs/691593.htmljdk配置:https://www.cnblogs.com/xiaoyh/p/9570398.html3、走好以上步骤,启...

2020-02-18 18:20:51 2770

原创 数据运营2 聚类分析及实例

典型应用场景目标用户的群体分类:根据运营或商业目的挑选出来的变量,对目标群体进行聚类,将目标群体分成几个有明显的特征区别的细分群体,在运营活动中为这些细分群体采用精细化、个性化的运营和服务,提升运营的效率和商业效果不同产品的价值组合:按特定的指标变量对众多产品种类进行聚类。将产品体系细分成具有不同价值、不同目的、多维度产品组合,在此基础上制定相应的产品开发计划、运营计划和服务计划探索、发现...

2020-02-09 15:48:23 856

原创 mysql知识点

join on后的and和where条件执行顺序创建数据create table table1 (id int,grade int);create table table2 (id int,name varchar(20));insert into table1 values(1,20);insert into table1 values(2,70);insert into table...

2020-02-04 12:10:18 144

转载 关联规则挖掘 fp_growth算法

写在前面前面说了apriori算法,但是面对上百万,复杂关联的数据集时,执行真的太慢了,fp_growth算法就快的一批,下面先贴个github地址,亲测给力,除了输出频繁项集,还输出了强关联规则结果:https://github.com/blackAndrechen/data_mine调用很简单,下载之后,打开一个新的程序界面,输入类似以下命令即可:(要和源码文件在一个路径下执行。data...

2020-01-17 18:06:20 587

原创 python常用操作整理

一、列表操作操作1:删除列表中的nan值test_list = [ i for i in test_list if i == i]#删掉nan值注:np.nan=np.nan返回false,正常值返回true操作2:找到两个列表中的重复值栗子a=[1,2,3]b=[2,3,4]result=set(a)&set(b)print(result)结果{2, 3}...

2020-01-15 18:27:17 149

转载 hive常用操作(持续更新)

操作1:将int类型日期(如:20200114)转化为日期类型的日期(如:2020-01-14)step1 创建表并写入数据create table tb (dt INT);insert into tb values (20180701);insert into tb values (20180715);step2 日期转化select dt,from_unixtime(unix_...

2020-01-14 19:27:11 169

转载 excel统计两列重复值的数量

最后,推荐一个学excel的公众号:韩老师讲office

2020-01-09 18:18:10 1998

转载 关联规则挖掘 Apriori算法

数据要求执行部分里修改文件路径, csv文件输入,第一列为事务列,第二列及以后为项集列参数调节可调参数:执行部分里的k=2, min_support=0.01,min_conf=0.15可调节,并有说明import timeimport csvdef readData(fileName):#数据导入 """ read the csv data into a dictio...

2020-01-08 21:08:27 1790

转载 转载:excel跨工作表进行对应属性数据对应放置(vlookup)

https://blog.csdn.net/xuke100/article/details/50684125

2020-01-07 17:41:59 220

翻译 数据运营1 概述

数据运营背景互联网运营部门的数据化运营包括:网站流量监控分析、目标用户行为研究、网站日常更新内容编辑、网络营销策划推广等数据运营中的数据挖掘总思路:针对具体的业务需求分析,先确定分析思路,然后根据这个思路去寻找合适的分析算法和技术,可以尝试多个算法去分析,最后根据验证的效果和资源匹配等进行权衡,确定最终思路。数据运营常用算法决策树:(分类、预测)优势:可处理高维数据;分枝规...

2020-01-06 17:33:25 292

翻译 Google的OR-Tools求解器——调度问题

问题背景一个常见的调度问题是job shop,即在几台机器上处理多个作业。 每个作业都包含一系列任务,这些任务必须以给定的顺序执行,并且每个任务都必须在特定的机器上进行处理。 例如,作业可以是制造单个消费品,例如汽车。 问题为如何在机器上安排任务,以最大程度地减少调度时间(完成所有作业所花费的时间)。作业车间问题有几个约束条件:在完成该作业的上一项任务之前,无法启动该作业的下一项任务。一...

2020-01-05 21:08:53 3900 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除