自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Nieson2012的专栏

技术黑客

  • 博客(8)
  • 资源 (17)
  • 收藏
  • 关注

原创 机器学习中用可视化手段来进行模型评估和参数调优

本篇文章详细阐述机器学习模型评估和参数调优。将主要围绕两个问题来阐述:“知其所以然”:当你选择的一个机器学习模型运行时,你要知道它是如何工作的;“青出于蓝”:更进一步,你得知道如何让此机器学习模型工作的更优。模型评估的方法一般情况来说,F1评分或者R平方(R-Squared value)等数值评分可以告诉我们训练的机器学习模型的好坏。也有其它许多度量方式来评

2017-04-27 15:27:51 5500

原创 sqoop同步数据实践

本章主要介绍了Sqoop在数据同步场景下的应用实践,主要涉及到讲解Sqoop同步数据方面的多种实现方式和功能。Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

2017-04-25 16:05:14 2225

原创 用Shell脚本操作mysql数据库

可以用shell脚本操作MySQL数据库,使用mysql的-e参数可以执行各种sql的(创建,删除,增,删,改、查)等各种操作 。MySQL -hhostname -Pport -uusername -ppassword -e 相关mysql的sql语句,不用在mysql的提示符下运行mysql,即可以在shell中操作mysql的方法。

2017-04-25 14:32:12 924

原创 生产经营中常用的预测算法

常见的预测算法有:1.简易平均法,包括几何平均法、算术平均法及加权平均法;2.移动平均法,包括简单移动平均法和加权移动平均法;3,指数平滑法,包括 一次指数平滑法和二次指数平滑法,三次指数平滑法;4,线性回归法,包括一元线性回归和二元线性回归,下面我一一的简单介绍一下各种方法。一,简易平均法是一种简便的时间序列法。是以一定观察期的数据求得平均数,并以所求平均数为基础,预

2017-04-20 13:35:50 7855

原创 Cloudera在Ubuntu的安装部署

1. 安装前的准备 准备好Ubuntu离线source,配置/etc/apt/source.list 准备好Cloudera Hadoop离线source,配置/etc/apt/source.list.d/cloudera.list 同步集群的/etc/hosts ssh免密码登录,cloudera-scm-server所在机器能够免密码登录其他cloudera-scm

2017-04-13 11:26:52 1011

原创 Hue上的Oozie如何构建工作流和定时任务

Oozie是什么?Oozie是一种Java Web应用程序,它运行在Java servlet容器——即Tomcat——中,并使用数据库来存储以下内容:工作流定义当前运行的工作流实例,包括实例的状态和变量Hue是什么? Hue是一个可快速开发和调试Hadoop生态系统各种应用的一个基于浏览器的图形化用户接口。 Hue能干什么? 1,访问HDFS和文件浏

2017-04-13 11:09:12 10780 2

原创 利用sqoop将hive数据导入导出数据到mysql

运行环境  centos 5.6   Hadoop  Hivesqoop是让hadoop技术支持的clouder公司开发的一个在关系数据库和hdfs,hive之间数据导入导出的一个工具在使用过程中可能遇到的问题:sqoop依赖zookeeper,所以必须配置ZOOKEEPER_HOME到环境变量中。sqoop-1.2.0-CDH3B4依赖hadoop-core-0.20

2017-04-13 10:52:49 3547 2

转载 MySQL 的时间日期处理

1.1 获得当前日期+时间(date + time)函数:now()除了 now() 函数能获得当前的日期时间外,MySQL 中还有下面的函数:current_timestamp()   current_timestamplocaltime()   localtimelocaltimestamp()   localtimestamp    这些日期时间函数,都等同于 now()

2017-04-01 15:49:52 778

《良心作品,绝对免费》利用Python进行数据分析(第二版)高清中文版英文版和源代码

《良心作品,绝对免费》利用Python进行数据分析(第二版)高清中文版英文版和源代码! 这本书找了无数个链接,发现中文版本的PDF实在难获取,网上都是付费版本,这里诚心放送免费版供大家使用。

2019-04-17

Tableau图表实战演练

主​要​介​绍​T​a​b​l​e​a​u​8​.​2​的​各​类​图​表​的​制​作​,​包​括​了​每​一​步​的​具​体​操​作​步​骤​,​以​及​操​作​后​形​成​的​图​表​;​并​且​介​绍​了​仪​表​盘​和​数​据​分​析​的​功​能​,​非​常​适​合​T​a​b​l​e​a​u​爱​好​者​入​门​操​作​。

2015-05-25

深入浅出统计学

《深入浅出统计学》具有深入浅出系列的一贯特色,提供最符合直觉的理解方式,让统计理论的学习既有趣又自然。从应对考试到解决实际问题,无论你是学生还是数据分析师,都能从中受益。本书涵盖的知识点包括:信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区间的构建、假设检验、卡方分布、相关与回归等等,完整涵盖AP考试范围。本书运用充满互动性的真实世界情节,教给你有关这门学科的所有基础,为这个枯燥的领域带来鲜活的乐趣,不仅让你充分掌握统计学的要义,更会告诉你如何将统计理论应用到日常生活中。

2015-04-23

SPSS统计分析与数据挖掘(最新完整版)谢龙汉

本书基于SPSS 19.0编写,结合大量的实例对SPSS各模块的统计分析功能及图形功能等进行了详细讲解。每章均给出大量分析案例,具体内容为SPSS简介、SPSS数据挖掘系统介绍、SPSS数据文件管理、SPSS数据预处理、SPSS基本统计分析、多重反应分析、均值比较与检验、统计图制作、参数检验、回归分析、方差分析、相关分析、聚数分析、判别分析、因子分析、对应分析与结合分析、信度分析、生存分析、对数线性模型、时间序列分析、缺失值分析,以及SPSS在财务智能、数据预测、股市分析、社会经济分析、金融数据分析等方面的数据挖掘应用。 本书最大特点是抛弃了其他同类书籍中只介绍理论用法、缺乏案例分析的弊病,全书给出许多数据挖掘分析案例,为读者展示SPSS在数据分析、信用风险管理、直销分析、社会经济分析等实际项目中的应用技术。

2015-04-17

大嘴巴漫谈数据挖掘(完整版)

《大嘴巴漫谈数据挖掘(全彩)》适合想从事数据挖掘方面的工作的初学者、数据分析爱好者、分析师,以及一线的数据挖掘开发人员参考阅读,也适合客户经理针对如何开展针对性的营销活动,避免客户流失而阅读学习,更适合产品经理阅读,因为针对如何预测产品的目标用户,促进用户活跃和业务有效使用,靠经验已经不行了,数据才最有说服力,更适合企业管理者将其作为一本通俗易懂的数据挖掘基础读物阅读学习,对下属的工作方向给予指导,以及适合教师学生数据挖掘课程辅导之用。

2015-03-10

谁说菜鸟不会数据分析(工具篇)完整版.pdf

谁说菜鸟不会数据分析(工具篇)完整版,与“入门篇”配合学习和使用,适合初级、中级数据分析师学习和参考

2015-01-10

Lingo11数学建模软件

Lingo11是数学建模的通用软件,简单易用,操作方便!

2014-04-12

RacerPro-2-0-Users-Guide-2-0-Preview.pdf

RacerPro2.0用户操作手册,RacerPro-2-0-Users-Guide-2-0-Preview.pdf

2013-12-01

结构方程模式的理论与应用

该文章中将会详细介绍结构方程模型的理论与应用

2013-11-11

Java API文档中文版

Java API文档中文版,比较实用的一篇文档,对于Java的学习有很大的帮助,学习期间经常要查阅的!

2013-04-30

mysql-connector-java-5.1.22-bin.jar

mysql-connector-java-5.1.22-bin.jar

2012-12-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除