自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Nieson2012的专栏

技术黑客

  • 博客(7)
  • 资源 (17)
  • 收藏
  • 关注

原创 大数据研究常用软件工具与应用场景

如今,大数据日益成为研究行业的重要研究目标。面对其高数据量、多维度与异构化的特点,以及分析方法思路的扩展,传统统计工具已经难以应对。工欲善其事,必先利其器。众多新的软件分析工具作为深入大数据洞察研究的重要助力, 也成为数据科学家所必须掌握的知识技能。然而,现实情况的复杂性决定了并不存在解决一切问题的终极工具。实际研究过程中,需要根据实际情况灵活选择最合适的工具

2015-10-29 09:31:52 1583

转载 数据挖掘算法之-关联规则挖掘(Association Rule)

在数据挖掘的知识模式中,关联规则模式是比较重要的一种。关联规则的概念由Agrawal、Imielinski、Swami 提出,是数据中一种简单但很实用的规则。关联规则模式属于描述型模式,发现关联规则的算法属于无监督学习的方法。一、关联规则的定义和属性 考察一些涉及许多物品的事务:事务1 中出现了物品甲,事务2 中出现了物品乙,事务3 中则同时出现了物品甲和乙。那么,物品甲和

2015-10-20 16:29:16 3092

转载 基础篇:数据挖掘的聚类算法和优势

文|十方比较分类算法的话,大概考虑这几个维度:时间空间复杂度,鲁棒性,参数敏感性,处理不规则形状,适合的类数量,类间差异(范围大小,样本个数,形状差异)可以参照一下sklearn网站给出的列表:2.3. Clustering除了这些聚类方法以外,统计老师讲过一些传统的聚类方法,归属于系统聚类的范畴,先定义观测间的距离和类之间的距离计算方法,然后按照距离把最接

2015-10-20 16:27:11 1081

转载 用户画像数据建模方法

从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。相比传统的线下会员管理、问卷调查、购物篮

2015-10-20 16:22:42 1587

转载 从银行、保险到证券,揭开大数据在金融行业的应用

从银行、保险到证券,揭开大数据在金融行业的应用数据显示,中国大数据IT应用投资规模以五大行业最高,其中以互联网行业占比最高,占大数据IT应用投资规模的28.9%,其次是电信领域(19.9%),第三为金融领域(17.5%),政府和医疗分别为第四和第五。根据国际知名咨询公司麦肯锡的报告显示:在大数据应用综合价值潜力方面,信息技术、金融保险、政府及批发贸易四大行业潜力最高高。具体到行业内

2015-10-19 13:35:56 7506

转载 基于R语言的关联规则实现

1993年,Agrawal等人首先提出关联规则概念,同时给出了相应的挖掘算法AIS,但是性能较差。1994年,他们建立了项目集格空间理论,并依据上述两个定理,提出了著名的Apriori算法,至今Apriori仍然作为关联规则挖掘的经典算法被广泛应用。基于Apriori算法需要理解以下8个概念:项集,说白了就是组成购物篮中的商品集合;关联规则,一般记为

2015-10-17 21:02:48 2818

原创 多重共线性问题的几种解决方法

在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。

2015-10-08 22:08:51 161855 5

《良心作品,绝对免费》利用Python进行数据分析(第二版)高清中文版英文版和源代码

《良心作品,绝对免费》利用Python进行数据分析(第二版)高清中文版英文版和源代码! 这本书找了无数个链接,发现中文版本的PDF实在难获取,网上都是付费版本,这里诚心放送免费版供大家使用。

2019-04-17

Tableau图表实战演练

主​要​介​绍​T​a​b​l​e​a​u​8​.​2​的​各​类​图​表​的​制​作​,​包​括​了​每​一​步​的​具​体​操​作​步​骤​,​以​及​操​作​后​形​成​的​图​表​;​并​且​介​绍​了​仪​表​盘​和​数​据​分​析​的​功​能​,​非​常​适​合​T​a​b​l​e​a​u​爱​好​者​入​门​操​作​。

2015-05-25

深入浅出统计学

《深入浅出统计学》具有深入浅出系列的一贯特色,提供最符合直觉的理解方式,让统计理论的学习既有趣又自然。从应对考试到解决实际问题,无论你是学生还是数据分析师,都能从中受益。本书涵盖的知识点包括:信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区间的构建、假设检验、卡方分布、相关与回归等等,完整涵盖AP考试范围。本书运用充满互动性的真实世界情节,教给你有关这门学科的所有基础,为这个枯燥的领域带来鲜活的乐趣,不仅让你充分掌握统计学的要义,更会告诉你如何将统计理论应用到日常生活中。

2015-04-23

SPSS统计分析与数据挖掘(最新完整版)谢龙汉

本书基于SPSS 19.0编写,结合大量的实例对SPSS各模块的统计分析功能及图形功能等进行了详细讲解。每章均给出大量分析案例,具体内容为SPSS简介、SPSS数据挖掘系统介绍、SPSS数据文件管理、SPSS数据预处理、SPSS基本统计分析、多重反应分析、均值比较与检验、统计图制作、参数检验、回归分析、方差分析、相关分析、聚数分析、判别分析、因子分析、对应分析与结合分析、信度分析、生存分析、对数线性模型、时间序列分析、缺失值分析,以及SPSS在财务智能、数据预测、股市分析、社会经济分析、金融数据分析等方面的数据挖掘应用。 本书最大特点是抛弃了其他同类书籍中只介绍理论用法、缺乏案例分析的弊病,全书给出许多数据挖掘分析案例,为读者展示SPSS在数据分析、信用风险管理、直销分析、社会经济分析等实际项目中的应用技术。

2015-04-17

大嘴巴漫谈数据挖掘(完整版)

《大嘴巴漫谈数据挖掘(全彩)》适合想从事数据挖掘方面的工作的初学者、数据分析爱好者、分析师,以及一线的数据挖掘开发人员参考阅读,也适合客户经理针对如何开展针对性的营销活动,避免客户流失而阅读学习,更适合产品经理阅读,因为针对如何预测产品的目标用户,促进用户活跃和业务有效使用,靠经验已经不行了,数据才最有说服力,更适合企业管理者将其作为一本通俗易懂的数据挖掘基础读物阅读学习,对下属的工作方向给予指导,以及适合教师学生数据挖掘课程辅导之用。

2015-03-10

谁说菜鸟不会数据分析(工具篇)完整版.pdf

谁说菜鸟不会数据分析(工具篇)完整版,与“入门篇”配合学习和使用,适合初级、中级数据分析师学习和参考

2015-01-10

Lingo11数学建模软件

Lingo11是数学建模的通用软件,简单易用,操作方便!

2014-04-12

RacerPro-2-0-Users-Guide-2-0-Preview.pdf

RacerPro2.0用户操作手册,RacerPro-2-0-Users-Guide-2-0-Preview.pdf

2013-12-01

结构方程模式的理论与应用

该文章中将会详细介绍结构方程模型的理论与应用

2013-11-11

Java API文档中文版

Java API文档中文版,比较实用的一篇文档,对于Java的学习有很大的帮助,学习期间经常要查阅的!

2013-04-30

mysql-connector-java-5.1.22-bin.jar

mysql-connector-java-5.1.22-bin.jar

2012-12-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除