- 博客(512)
- 资源 (5)
- 收藏
- 关注
原创 数学之路-sas备忘(9)
view视图libname saslib "k:\sas";data saslib.testview4/view=saslib.testview4; set saslib.test4;run;proc print data=saslib.test4 noobs label;run;proc sql; select testview4.id as 学号 ,testview4.scor
2015-03-06 23:07:12 1487
原创 extjs5备忘(2)
Welcome to ExtJS! 本博客所有内容是原创,如果转载请注明来源http://blog.csdn.net/myhaspl/
2015-03-05 16:41:45 1212
原创 extjs5备忘(1)
Extjs51、 安装便携版的U盘appache服务器。然后进入rootdir,清空目录内容,放入自己的内容。2、 HelloworldHtml:Index.html如下: Welcome to ExtJS! Js:app.js内容如下:Ext.application({ name : 'MyApp
2015-03-03 17:17:04 1098
原创 数学之路-sas备忘(8)
输入与输出格式libname saslib "H:\sas";data saslib.test4; input id$ name:$char15. score birthday; label id="学号" name="姓名" score="成绩" birthday="生日"; format score COMMA5.2 birthday
2015-03-02 15:31:55 1270
原创 C++备忘-QT(4)
用户登录-creator编程画好以下界面: 编译时,会自动生成如下内容的头文件ui_mainwindow.h /********************************************************************************** Form generated from reading UI file'mainwindow.ui'**** Creat
2015-03-01 17:49:37 1331
原创 curl语言备忘(3)
{curl 8.0 applet}{curl-file-attributes character-encoding ="gb2312"}{applet manifest ="manifest.mcurl", {compiler-directives careful? = true}} {include "vle-container.scurl"}||本行为注释行,输出转义字符第一行\n第二行
2015-02-27 22:13:13 1239
原创 数学之路-sas备忘(7)
显示变量名libname saslib "H:\ sas";/*varnum表示按观测位置排序变量名,默认为按字母顺序*/data saslib.Student; input name $ Age Score; datalines;李四 25 85.6王五 27 98.12张三 30 78;proc contents varnum data=saslib.Student;r
2015-02-27 17:22:13 1638
原创 curl语言备忘(2)
代码:{curl 8.0 applet}{curl-file-attributes character-encoding = "gb2312"}{applet manifest = "manifest.mcurl", {compiler-directives careful? = true}}{include "vle-container.scurl"}这个例子演示在Curl applet使
2015-02-27 16:57:23 999
原创 curl语言备忘(1)
start.curl内容如下:{curl 8.0 applet}{curl-file-attributes character-encoding ="gb2312"}{applet manifest ="manifest.mcurl", {compiler-directives careful? = true}} {include "vle-container.scurl"} {value {
2015-02-27 12:06:39 1177
原创 数学之路-sas备忘(6)
连接外部数据CONNECT TO 数据库类型选项 连接ACCESS:proc sql;connect to access as db(path=”e:\xx.mdb”);连接excel:proc sql;connect to EXCEL(PATH="k:\docs\机器学习第3版\底稿\src\sas\student_excel.xlsx" GETNAMES=YES);SELECT * FROM
2015-02-26 21:31:42 1292
原创 C++备忘-QT(3)
猜数字游戏本博客所有内容是原创,如果转载请注明来源http://blog.csdn.net/myhaspl/main.cpp/**猜数字游戏*author: http://blog.csdn.net/myhaspl*date:2015.02.25*/#include#include"guessdialog.h"intmain(intargc,char*argv[]){ QApplicatio
2015-02-25 20:01:48 1265
原创 C++备忘-QT(2)
#include #include #include #include //滑动条int main(int argc, char *argv[]){ QApplication app(argc, argv); QWidget *window =new QWidget; window->setWindowTitle("测试"); QSpinBox *spinbox=new Q
2015-02-24 21:50:18 836
原创 flex备忘(1)
xmlns:s="library://ns.adobe.com/flex/spark" xmlns:mx="library://ns.adobe.com/flex/mx" minWidth="955" minHeight="600"> import mx.controls.Alert; public function clickhandler(clickevent:Eve
2015-02-24 16:31:17 802
原创 C++备忘-QT(1)
#include #include int main(int argc, char *argv[]){ QApplication a(argc, argv); QLabel *label=new QLabel("您好"); label->show(); return a.exec();}main.ccp如上:本博客所有内容是原创,如果转载请注明来源http://blog.c
2015-02-23 20:24:53 942
原创 数学之路-sas备忘(5)
导入数据与导出数据PROC IMPORTDATAFILE="文件名" //规定要导入文件的完整路径和文件名OUT=逻辑引用库名.数据集DBMS=导入文件类型 //如果有这个标志,则说明覆盖存在的SAS数据集导入文件选项PROC EXPORTDATAFILE="文件名"
2015-02-21 12:15:52 1947
原创 数学之路-sas备忘(4)
5、excel文件读入 *读入EXCEL文件到临时数据集class1*;procimport OUT=work.class1dbms=EXCEL REPLACE DATAFILE="J:\docs\机器学习第3版\底稿\src\sas\student_excel.xlsx"; SHEET="student"; GETNAMES=YES;RUN;*显示数据*
2015-02-19 11:04:41 1665
原创 数学之路-sas备忘(3)
构造文本文件从文本文件中创建临时SAS数据集在编辑器中输入数据1 liuhui 28 98.5 88.92 zhangfang 31 88.2 81.83 wangwu 29 78.2 89.14 lisi 32 66 78.1将编辑器中的数据另存为dat文件data myclass; infile "J:\docs\机器学习第3版\底稿\src\sas\student.dat"; in
2015-02-19 10:10:16 1630
原创 数学之路-sas备忘(2)
DATA数据步:创建SAS数据集PROC过程步:分析数据DATA步读取并修改数据并拥有一个内置循环语句,数据步每行第变量读取本博客所有内容是原创,如果转载请注明来源http://blog.csdn.net/myhaspl/OPTIONS语句指定系统选项:下面是一些可能用到的一般系统选项CENTER|NOCENTER输出是否居中,还是左对齐。默认居中DATE|NODATE今天的日期是否出现在输出的顶
2015-02-16 11:21:57 1067
原创 数学之路-sas备忘(1)
简单的数据集输出日志85 libname saslib base 'E:\sasdata';NOTE: 已成功分配逻辑库引用名“SASLIB”,如下所示: 引擎: BASE 物理名: E:\sasdata8687 data saslib.Student;88 input name $ Age Score;89 datal
2015-02-13 22:24:21 2222
原创 数学之路-R语言备忘(1)
1、aggregate()对分组中的每个变量调用tapply()2、dataframetapply()针对数据框进行分组并运算split()同上,但仅分组,不计算3、listlapply()4、vector、matrixapply针对矩阵和向量
2015-02-11 17:06:31 1027
原创 数学之路-python计算-Theano(1)
Theano是一个Python库,可定义、优化和计算数学表达式,用它可与手工使用C解决问题竞争,包括大数据。它能多个数量级超越纯在CPU上执行的C,因为可利用GPU计算。Theano应用了对商业非常友好的BSD开源协议,由LISA实验室写成。 下载Theanohttps://pypi.python.org/pypi/Theano#downloadsE:\Theano-0.6.0>cd Theano
2015-01-22 15:03:08 2484
原创 数学之路-R-GUI编程(1)
> install.packages("RGtk2")--- 在此連線階段时请选用CRAN的鏡子 ---试开URL’http://mirror.bjtu.edu.cn/cran/bin/windows/contrib/3.1/RGtk2_2.20.31.zip'Content type 'application/zip' length 13920060 bytes (13.3 Mb)打开了URLd
2014-12-30 19:58:59 2182
原创 数学之路-分布式计算-hadoop、python与R(3)
二、ubuntu 12.04hadoop2.6配置与安装1、java7配置#su#addusermyhaspl下面增加su权限使得myhaspl用户属于sudo组#vi/etc/groupsudo:x:27:,myhaspl然后重新启动#reboot 转到myhaspl用户,开始下载解压java。本博客所有内容是原创,如果转载请注明来源http://blog.csdn.net/myhaspl/#s
2014-12-22 11:26:38 2618
原创 数学之路-分布式计算-disco(4)
第一个参数iter是一个迭代器,涉及被map函数产生的键和值,它们是reduce实例。在本例中,单词随机被委托给不同的reduce实例,然后,要单词相同,处理它的reduce也相同,可确保最终合计是正确的。第二个参数params与map函数中一致,在此,仅简单使用disco.util.kvgroup()来提取每个单词统计计数,累计计数,yield(产生)结果。运行作业下面开始运行作业,可使用大量参
2014-12-18 23:09:48 1720
原创 数学之路-分布式计算-storm(3)
5、安装zookeeper本博客所有内容是原创,如果转载请注明来源http://blog.csdn.net/myhaspl/myhaspl@aaayun:~/jzmq-master$cd ..myhaspl@aaayun:~$wget http://apache.fayea.com/zookeeper/zookeeper-3.3.6/zookeeper-3.3.6.tar.gz myhaspl@a
2014-12-17 18:13:29 1800
原创 数学之路-分布式计算-storm(2)
storm 单机版,ubuntu安装与配置1、首先安装并配置好java。2、输入以下命令安装相关工具。myhaspl@aaayun:~$ sudo apt-get installlibtoolmyhaspl@aaayun:~$ sudo apt-get installautoconfmyhaspl@aaayun:~$ sudo apt-get installautomake g++ uuid-de
2014-12-17 16:04:44 1360
原创 数学之路-分布式计算-hdfs(3)
可通过部署一对主/备NameNode实现NameNode高可用性(HA),主/备NN都能访问edits的WAL,因此将edtis放置在共享存储设备上,使用NFS实现这种共享存储。主/备NN可配置为手动或自动故障切换模式,默认为手动故障切换模式。通常来说,次NN会同时承担备NN的角色,由于NN在内存中的元数据大小限制,可以使用NN联盟,由一组各自独立的NN组成,每个NN负责管理目录结构的不同部分,N
2014-12-15 08:15:08 1863
原创 数学之路-分布式计算-storm(1)
一个storm集群和hadoop集群相似,然而,hadoop集群可运行mapreduce jobs,而在storm中,运行topologies(拓扑),mapreduce jobs(作业)和topologies是不同的:一个关键的不同在于mapreduce job最终会完成,而topolopy将永远在处理消息(你可以人为终止它)。 有2种storm集群的结点:主节点和工作结点。主结点运行
2014-12-09 16:52:59 2094
原创 数学之路-数据分析进阶-Cox比例风险回归模型
Cox比例风险回归模型(Cox’s proportional hazards regression model),简称Cox回归模型。该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。h(t/X)=h0(t) exp (β1 X1 + β2 X2 + …… + βp Xp )h0(t): 基准风险函数 即所有变量取零时的t时刻的风险
2014-12-08 09:27:55 11810
原创 数学之路-分布式计算-disco(3)
DDFS提供了一个分布式存储层,DDFS是为支持Disco和mapreduce而设计的,可存储和处理大量不可变的数据,这让它非常适合存储,比如:日志数据,大型二进制数据(图片、视频、指数)或增量收集的未加工数据(原始)数据,比如:WEB爬行。在此情况下,DDFS是对传统关系数据库分布式存储的补充,在扩展到TB级或PB级数据时存在困难。虽然DDFS代表了Disco分布式文件,但它不是一般用途Posi
2014-12-06 21:33:18 1680
原创 数学之路-数据分析进阶-广义线性模型
在统计学上, 广义线性模型 (Generalized linear model) 是一种受到广泛应用的线性回归模式。此模式假设实验者所量测的随机变量的分布函数与实验中系统性效应(即非随机的效应)可经由一链结函数(link function)建立起可资解释其相关性的函数。广义线性模型(generalized linear model, GLM)是简单最小二乘回归(OLS)的扩展,在广义线性模式中,假
2014-12-05 23:28:43 2331
转载 数学之路-数据分析进阶-转化率
一、什么叫转化率指标用法:当你在不同的地方测试新闻订阅、下载链接或注册会员,你可以使用不同的链接的名称、订阅的方式、广告的放置、付费搜索链接、付费广告(PPC)等等,看看那种方式是能够保持转换率在上升?如何增强来访者和网站内容的相关性?如果这个值上升,说明相关性增强了,反之,则是减弱。转化目标(Goal)转化目标,也叫做转化目标页面或目标页面,指商户希望访客在网站上完成的任务,如注册、下订单、付款
2014-12-05 23:10:05 5179
原创 数学之路-分布式计算-hdfs(2)
1、DataNode为每个数据复制数据副本,保存在其它DataNode中。2、NameNode文件系统的元数据全保存在RAM中,DataNode初始化以及每隔1小时,向NameNode发送块报告,以便NameNode掌握各个DataNode的运行状态,并进行DataNode的映射。3、预写日志。通过在edits中顺序增加的方式减少I/O操作。4、fsimage:NameNode启动后,加载fsim
2014-12-04 16:17:09 1687
原创 数学之路-分布式计算-hdfs(1)
一、hdfs写数据1、客户端通过Hadoop文件系统相关API 发送请求。打开一个要写入的文件,如果该用户拥有足够的权限,这一请求会被发送到NameNode,在NameNode上建立该文件的元数据。2、刚建立的新文件元数据并未将该文件和任何数据块关联,客户端仅收到打开文件成功的响应。3、客户端在API层面上将数据写入流中,数据被自动拆分成数据包,数据包保存在内存队列中。4、客户端有一个独立的线程,
2014-12-04 10:54:26 1647
原创 数学之路-分布式计算-disco(2)
Disco旨在较大的应用程序轻松集成,比如web服务,那样要求计算的任务可以委托给独立于核心应用程序的集群去执行。Disco提供了一个非常紧凑的Python API——通常只需要两个函数,以及一个rest样式的Web API的工作控制和简单易用的状态监控Web界面。此外,Disco还拥有了一个简单的工作协议,允许作业以任何语言编写,实现协议。 Disco对LINUX商业服务器集群非常友好
2014-12-04 08:59:06 1882
原创 数学之路-数据分析进阶-总体方差检测
var.test(x, ...)## Default S3 method:var.test(x, y, ratio = 1, alternative = c("two.sided", "less", "greater"), conf.level = 0.95, ...)## S3 method for class 'formula'var.test(
2014-12-03 18:29:22 1698
原创 数学之路-分布式计算-disco(1)
Disco是一个轻量级的、开源的基于mapreduce模型计算的框架,Disco强大且易于使用,这都要归功于python,Disco分发且复制数据,可高效安排作业。Disco甚至拥有能对数以亿计的数据点进行索引以及实时查询的工具。Disco于2008年在Nokia研究中心诞生,解决了在大量数据处理方面的挑战。Disco支持大数据集的并行计算,在不可靠的计算机集群中,Disco是一个完美的分析和处理
2014-12-02 22:26:13 2611
转载 数学之路-数据分析进阶-数据归一化
一、min-max标准化(Min-Max Normalization)也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间。转换函数如下:其中max为样本数据的最大值,min为样本数据的最小值。这种方法有个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。二、Z-score标准化方法这种方法给予原始数据的均值(mean)和标准差(standard devi
2014-11-29 10:34:30 1230
原创 数学之路-分布式计算-numpy在centos下的安装
numpy安装1、下载numpy,网址为:http://www.scipy.org/scipylib/download.html。2、系统更新。[myhaspl@localhost ~]$ su密码:[root@localhost myhaspl]# yum install update3、安装相关工具。[root@localhost myhaspl]# yum install wget[root
2014-10-30 11:43:42 2548
原创 数学之路-数据分析进阶-区间估计与假设检验(2)
某商城需要针对某类商品建立该类VIP大客户,定期向该客户推送相关广告,客户服务部门推荐了客户A,在数据库随机抽取了100个客户资料的前4个季度平均季消费数据(在这里用平均随机数模拟数据),客户A平均季消费为元,检测其是否消费处于中上水平(位于中位数以上)> sample(200:50000,100)->sale> sale [1] 8447 13987 8809 44437 22973 280
2014-10-07 22:20:59 1936
python线性神经网络库mplannliner
2013-07-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人