自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 Tableau连接MongoDB数据库

Tableau支持大量的文件类型数据的连接和数据库连接但是目前,Tableau不能直接连接MongoDB数据库,需要借助MongoDB Connector for BIMongoDB Connector for BI下载链接:https://www.mongodb.com/download-center#bi-connector下载安装完成后,安装目录的bin目录下出现两个可执行文件首先打开Mon...

2018-05-25 17:42:41 3031 3

原创 数据挖掘or数据分析?

关于数据挖掘与数据分析的区别和联系,我在网上搜集了一些,自己挑选了几种形象利于理解的答案简单罗列如下:(1)从实际工作角度:数据分析更侧重业务,数据挖掘则更侧重技术数据分析强调基于新的发现支持业务决策,关键是要转换到业务行动中发挥数据价值;数据挖掘关注焦点在于技术创新而非业务含义,当业务问题转化为数据问题后,建模工作主要是寻求可行的技术解决方案,过程中业务人员起的是辅助作用。另外,数据挖掘从实验室...

2018-05-25 11:50:09 677

转载 三分钟看懂大数据风控中用户行为数据的采集、分析及应用( 转 )

据统计,目前银行传统的风控模型对市场上70%的客户是有效的,但是对另外30%的用户,其风控模型有效性将大打折扣。大数据风控作为传统风控方式补充,主要利用行为数据来实施风险控制,用户行为数据可以作为另外的30%客户风控的有效补充。那么,大数据风控运营中,会主要分析用户的哪些行为数据,怎么分析?1.行为数据的采集和分析用户行为数据:主要包含用户在网站和移动App中的浏览/点击/发帖等行为,行为数据其实...

2018-05-24 20:03:49 37888

转载 sql之 <>与 !=

<> 这个是最早的用法。!=是后来才加上的。两者意义相同,在可移植性上前者优于后者故而sql语句中尽量使用<>来做不等判断

2018-05-21 10:36:25 40604 1

原创 sql之 if 与 like 关键字

like:    从上面的 "Persons" 表中选取居住在以 "N" 开始的城市里的人:    sql语句:select * from Persons where City like ‘N%’    注:"%" 可用于定义通配符(模式中缺少的字母)if:    表达式为:IF( expr1 , expr2 , expr3 )    expr1 为true,则返回expr2 ,否则返回expr3...

2018-05-20 17:41:52 2891

原创 sql优化之count distinct vs. count group by

很多情况下,尤其是对文本类型的字段,直接使用count distinct的查询效率非常低,而先做group by再count往往能提升查询效率。但是,实验表明,对于不同的字段,count distinct与count  group by的性能并不一样,而且其效率与目标数据集的数据重复度相关。举例:分别使用count distinct 和 count group by对 bigint, macadd...

2018-05-20 11:04:44 3433

原创 sql之聚合函数使用总结

Having是一个经常与聚合函数搭配使用的关键字。它的作用是筛选满足条件的组,即在分组之后过滤数据,条件中经常包含聚合函数什么是聚合函数?聚合函数一般会出现在哪?顾名思义,聚合函数就是按照某种规则将特定字段进行规约,常见的聚合函数如:(1)求个数:count(2)求总和:sum(3)求最大值:max(4)求最小值:min(5)求平均值:avg在诸多应用中,聚合函数更多的辅助group by使用,而...

2018-05-20 10:38:10 4381

原创 sql查询语句的书写顺序、执行顺序及注意事项(优化策略)

查询中用到的关键词主要由6个,分别是:select、from、where、group by、having、order by书写顺序:顺序与上一行一致。不过其中select和from为必须,其他关键词是可选执行顺序:from、where、group by、having、select、order byfrom:从哪张表检索数据where:设置条件,过滤表中数据group by:将上面过滤出的数据,进行...

2018-05-19 19:13:14 4486

原创 sql多表连接查询

初始表环境如下:表1:student表2:course1.外链接:    又分为:左连接、右连接、完全外连接    左连接:select * from student left join course on student.ID=course.ID    查询结果为:                            右连接:select * from student right join c...

2018-05-19 17:22:11 10049 1

原创 sql实战:查找入职员工时间排名倒数第三的员工所有信息

查找入职员工时间排名倒数第三的员工所有信息CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14) NOT NULL,`last_name` varchar(16) NOT NULL,`gender` char(1) NOT NULL,`hire_d...

2018-05-19 11:40:32 787

原创 准确率(accuracy)、召回率(recall)的意义和区别

1.

2018-05-18 15:41:17 46545 6

原创 Scrapy安装错误,安装Twisted时出现,Microsoft Visual C++ 14.0 is required.

解决步骤:(1)下载对应的whl文件  https://www.lfd.uci.edu/~gohlke/pythonlibs/  (2)打开cmd,输入 pip install whl文件路径  点击回车进行安装

2018-05-17 18:58:33 322

原创 关于Fatal error in launcher: Unable to create process using '"'的一个坑

Windows环境下:使用MSI安装完python,默认安装在了C:\Users\xxx\AppData\Local\Programs配置完path:C:\Users\xxx\AppData\Local\Programs\Python36 和 C:\Users\xxx\AppData\Local\Programs\Python36\Scripts打开一个新的终端:输入python  和 pip 均...

2018-05-17 18:47:36 2567 1

原创 Java容器(集合)

1.集合类和数据的区别:    数组元素既可以是基本类型的值,也可以是对象;而集合类主要负责保存、盛装其他数据,因此集合类也被称为容器类。2.Java容器大致可分为Set、List、Map和Queue四种体系:Set:代表无序、不可重复的集合;List:代表有序、可重复的集合;Map:代表具有映射关系(key/value对)的集合(key-value对应关系唯一;key唯一,不可有相同值;valu...

2018-05-16 18:42:25 621

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除