数据预处理--数据降维

数据规约产生更小但保持数据完整性的新数据集。在规约后的数据集上进行数据分析和挖掘将更有效率。机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式。 y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的)。f可能是显式的或隐式的、线性的...
阅读(132) 评论(0)

协同过滤算法

在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题1 什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电...
阅读(122) 评论(0)

动态 SQL、EXECUTE IMMEDIATE、using、into、returning

很多时候我们需要在存储过程中使用动态的SQL,要怎么用好动态SQL呢,怎样执行效率最高呢。下面来介绍一下,如何使用动态SQL操作数据库。在存储过程中执行一个简单的SQL语句使用下面的方法即可。DECLARE BEGIN /* 使用该方法来创建一个新数据表,但这方法需要当前用户具有创建表的权限。 */ EXECUTE IMMEDIATE 'create table test (data1 n...
阅读(223) 评论(0)

python数据类型详解

目录1、字符串2、布尔类型3、整数4、浮点数5、数字6、列表7、元组8、字典9、日期1、字符串1.1、如何在Python中使用字符串a、使用单引号(')用单引号括起来表示字符串,例如:str='this is string';print str;b、使用双引号(")双引号中的字符串与单引号中的字符串用法完全相同,例如:str="this is string";print str;c、使用三引号('...
阅读(142) 评论(0)

DG备库ORA-01196故障-归档日志丢失恢复一则

问题:由于机房停电,其中一DG备库无法open,启动时报错--启动数据库时报下面的错误SQL> alter database open;alter database open*第 1 行出现错误:ORA-10458: standby database requiresrecoveryORA-01196: 文件 1 由于介质恢复会话失败而不一致ORA-01110: 数据文件 1:'+DATA/htd...
阅读(532) 评论(0)

异常:Project configuration is not up-to-date with pom.xml解决方案

一、异常信息:导入maven工程后,出现如下错误: Description    Resource    Path    Location    TypeProject configuration is not up-to-date with pom.xml. Run project configuration update    rdc        line 1    Maven Config...
阅读(1362) 评论(0)

异常解决:util.NativeCodeLoader: Unable to load native-hadoop library for your platform

刚装好Hadoop的时候,每次输入命令运行都会出现:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-Java classes where applicable提示hadoop不能加载本地库。以前官网会提供32位的安装包,但目前提供的下载包为64位的,在...
阅读(1289) 评论(0)

Mysql中模拟分析函数

[sql] view plain copySET @add_sal=0;    SELECT deptno, empno, ename, sal, @add_sal := @add_sal + sal AS add_sal    FROM emp   ORDER BY empno;    +--------+-------+--------+------+---------+  | deptno ...
阅读(434) 评论(0)

shinyapps安装部署

Shinyapps.io is a platform as a service (PaaS) for hosting Shiny web apps (applications). This guide will show you how to create a shinyapps.io account and deploy your first application to the cloud.B...
阅读(893) 评论(0)

shiny-server 启动失败:start: Job failed to start

问题:启动shiny-server时失败,如下:[root@hadoop2 ~]# status shiny-servershiny-server stop/waiting[root@hadoop2 ~]# start shiny-server start: Job failed to start分析:查看shiny-server日志[root@hadoop2 ~]# tail -100f  /v...
阅读(1234) 评论(0)

Plot wordcloud2 in shiny

在使用shiny展示wordcloud2 的云词时,不能再使用传统的plotOutput和renderPlot函数了,应该使用对应的。wordcloud2Output和renderWordcloud2函数,如下面介绍的: DescriptionFunction for plotting wordcloud2 in shinyUsage1 2 3 4 5 6wordcloud2Output(out...
阅读(1362) 评论(0)

Linux下安装ROracle包

1.下载oracle clienthttp://www.oracle.com/technetwork/topics/linuxx86-64soft-092277.htmloracle-instantclient11.2-basic-11.2.0.4.0-1.x86_64.rpmoracle-instantclient11.2-devel-11.2.0.4.0-1.x86_64.rpm 2.安装or...
阅读(1435) 评论(0)

readOGR加载shape文件时报错

加载shape文件时报错:> library(rgdal)> maps +                 layer = "ne_50m_admin_1_states_provinces_lakes", +                  encoding = "UTF-8",verbose=FALSE)Error in ogrInfo(dsn = dsn, layer = layer, en...
阅读(2159) 评论(0)

Hive CLI – Migrating to Beeline

Hive Beeline的用法转载:http://www.teckstory.com/hadoop-ecosystem/hive-new-cli-beeline-for-hive/Hive is the data warehouse software of Hadoop ecosystem. It provides a mechanism to project structure onto lar...
阅读(6995) 评论(0)

sqoop导入错误:Hive does not support the SQL type for column col_name

问题:把mysql导入到hive时,由于hive的类型不支持mysql的类型,出现导入错误,如下:[hdfs@hadoop0 ~]$ sqoop import --connect jdbc:mysql://10.1.32.34:3306/dicts --username sqoop --password sqoop  -m 1 --table ua --hive-import --hive-ove...
阅读(3522) 评论(0)
370条 共25页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:1120892次
    • 积分:13507
    • 等级:
    • 排名:第1066名
    • 原创:298篇
    • 转载:67篇
    • 译文:5篇
    • 评论:92条
    最新评论