- 博客(61)
- 资源 (6)
- 收藏
- 关注
转载 交叉检验---训练数据,验证数据和测试数据
最近在Coursera上学习Data Analysis课程,课程论坛中有个帖子针对交叉检验(Cross Validation)中训练数据集(train dataset),验证数据集(Validate dataset)和测试数据集(test dataset)展开讨论,内容挺好的,记录到这里,作为备忘。 交叉检验(Cross Validation)在数据分析中,有些算法
2013-05-08 11:41:08 1619 1
转载 线性回归,logistic回归和一般回归
线性回归,logistic回归和一般回归http://blog.csdn.net/junnan321/article/details/8483358判别模型、生成模型与朴素贝叶斯方法http://blog.csdn.net/junnan321/article/details/8483365
2013-04-26 13:50:26 801
原创 python 相关模块
python 的相关模块:python标准库中有不少专门用于处理数值类型对象的模块,增强并扩展了内建函数的功能和数值运算功能一、数字类型的相关模块:、核心模块:random该模块包含多个伪随机数生成器,均以当前的时间戳为随机数种子。该模块常用的函数:
2013-04-16 23:51:28 618
翻译 基础一
Python 语言参考一、语法分析(一)line 结构1.logical lines2.physical lines3.comments注释一般都是以#开头4.encoding declarations注释一般都是以下这种结构# -*- coding: -*-5.explicit line joining通常是以‘\’这个字符结尾
2013-04-16 23:08:17 679
原创 python
fobj = open('F:\programing\AUC\prtest.txt','r')for eachLine in fobj: print (eachLine,)打印文件中的内容print 中的‘,’很重要2.错误和异常try: filename = input('Enter file name:') fobj = open(filename,'r')
2013-04-16 22:37:50 744
转载 信息检索(IR)的评价指标介绍 - 准确率、召回率、F1、mAP、ROC、AUC
在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall) =
2013-04-07 23:51:43 792
翻译 weka关联的ARFF文件
weka中的arff数据文件1.ARFF(Attribute-Relation File Format)文件时一个ASCII文件,用于描述一组共享某些属性的实例。主要是两部分:Header information and Data information1>Relation information: 格式: @ralation 比如说:@RELATION ir
2013-03-19 08:51:20 2089
原创 Java通过weka接口建立RF和SVM分类器
一、Instance 实例类该类是用于处理一个有序的权重实例典型的使用方法:import weka.core.converters.ConverterUtils.DataSource; ... // Read all the instances in the file (ARFF, CSV, XRFF, ...) DataSource source = new DataS
2013-03-18 23:12:41 5442 3
转载 apache httpd.conf配置文件设置关联php文件
如何设置 Apache HTTP Server 的文件根目录(DocumentRoot) 。在安装 Apache 时,系统会给定一个缺省的文件根目录。如果你觉得将网页存在这个缺省目录不方便,觉得应该另外设个目录作为 Apache 文件根目录,你可以修改 Apache 的配置文件 httpd.conf 里有关文件根目录的设置。Apache HTTP Server 的缺省文件根
2013-03-15 14:17:39 2456
转载 windows下JAVA安装
首先上官网下个JDK和Eclipse(最好下载最新的版本)下面我给出了几个下载的链接。JDK1.6官方下载_JDK6官方下载地址:http://www.java.net/download/jdk6/6u10/promoted/b32/binaries/jdk-6u10-rc2-bin-b32-windows-i586-p-12_sep_2008.exe Eclipse下载地
2013-03-12 09:21:06 2646
原创 基于商品的协同过滤
一、协同过滤(collaborative filtering,CF)1.由于v(信息量)> v(处理过程),所以有限时间里浏览有用商品。也就是使用集体的智慧来推荐相关产品。2.传统的是基于用户的,根据用户的行为习惯进行相似的预测。3.两个主要的挑战:scalability和quality,一般情况下是the more ,the worse4.那基于商品的有什么优点:items之间可
2013-03-06 23:19:01 2593
转载 AT&T汇编参考
AT&T ASM 开发一个OS,尽管绝大部分代码只需要用C/C++等高级语言就可以了,但至少和硬件相关部分的代码需要使用汇编语言,另外,由于启动部分的代码有大小限制,使用精练的汇 编可以缩小目标代码的尺寸。另外,对于某些需要被经常调用的代码,使用汇编可以提高性能。所以我们必须了解汇编语言,即使你有可能并不喜欢它。 如果你是计算机专业的话,在大学里你应该学习过Intel
2013-03-05 20:22:25 913
转载 C语言的文件读写
文件打开关闭函数:fopen()和fclose() FILE *fopen(char *filename, char *mode) int fclose(FILE *fp)字符读写函数 :fgetc()和fputc()int fgetc(FILE *fp)int fputc(int ch, file *fp)字符串读写函数:fgets()和fputs()
2013-02-27 23:03:25 484
原创 标准IO库
一、面向对象的标准库C++的输入输出都是由标准库提供。标准库中还定义了一族类型,支持对文件和控制窗口等设备的读写。比如说,IO类型在三个独立的头文件中定义:iostream定义读写控制窗口的类型;fstream定义读写已命名文件的类型;sstream定义的类型则用于读写存储在内存中的string对象。IO标准库类型和头文件头文件 类型
2013-02-26 21:30:49 1234
转载 删除所标进程
步骤1:用以下SQL查看进程列表,判断出被锁定的表SELECT dob.OBJECT_NAME Table_Name,lo.SESSION_ID||', '||vss.SERIAL# 删除号,lo.locked_mode,lo.SESSION_ID, vss.SERIAL#,vss.action Action,vss.osuser OSUSER, vss.LOGON_TIME,
2013-02-26 11:07:56 581
转载 win7安装ubuntu双系统
1.磁盘分区管理装Ubuntu分配的硬盘大小最好是(20G以上)不要太小,这里请注意,ubuntu和windows文件系统完全不同,所以我们划好要给ubuntu的分区后,删除卷。到时候,安装好的ubuntu的分区,在windows下是看不到的,但是进入ubuntu是可以访问windows的磁盘的。这才叫双系统的吧,和wubi那种不一样哦。2.准备两个东西EasyBCD软件和iso镜像(
2013-02-04 21:01:19 10532
原创 gdb 基本命令总结
一般的,GDB主要调试的是C/C++的程序。要调试C/C++的程序,首先在编译时,要把调试信息加到可执行文件中。使用编译器(cc/gcc/g++)的-g参数可以做到这一点。>cc -g hello.c -o hello>g++ -g hello.cpp -o hello1.break func 设置断点,在函数func()的入口处2.info break 查看断点信息
2012-12-19 11:26:23 1111
原创 vim 基本命令
4.:r filename#读入一个文件内容,并写入到当前编辑器中5.:w newfilename#将该编辑器中的内容写入到一个新文件中6.:w#在编辑的过程中保存文件,相当于word中的ctrl+s7.:! command暂时离开 vi 到指令列模式下执行 command 的显示结果!例如:!ls#在编辑过程中执行shell命令ls8.
2012-12-18 10:38:26 481
原创 Bash 简介
1.Bash is a commonly used shell in Linux(Ubuntu)bash, tcsh, csh2.ls,cd,pwd,cp, rm,mkdir,top3.touch : generate a new emptyfile, or change the timestamp of an existing file4.which: t
2012-12-18 09:17:56 467
原创 bash nohup pid
工程中,我们经常要将一些运行的任务放到后台上运行,这样我们可以通过任务的pid(process id)来启动和停止任务。1.首先是后台运行命令bash task.sh &查看后台进程运行情况:ps -ef | grep task.sh2.将上面的一系列命令写到脚本中,通过pid进行操作:# start.shecho "start program at :
2012-12-10 09:01:24 3251
翻译 PL/SQL的Block结构
引入PL/SQL的block结构和匿名block PL/SQL程序单元一般讲代码都组织成block。一个没有任何命名的block叫做匿名block。匿名block是在PL/SQL里面是一个最简单的单元。为什么叫做匿名block,是因为在数据库中并没有对该block进行保存。这些匿名block都是一次性的,用完就关了,当然这都是在一些特定的情况下使用,比如说是创建测试单元。下面是一个简单
2012-12-06 10:04:30 2264
转载 plsql,sql,sql*plus之间的关系
在SQL*Plus中可以处理三种类型的命令:SQL语句、PL/SQL块和SQL*Plus命令。但三者之间是有区别的。1)SQL语句是以数据库为操作对象的语言,主要包括数据定义语言DDL、数据操纵语言DML和数据控制语言DCL以及数据存储语言DSL。当输入SQL语句后,SQL*Plus将其保存在内部缓冲区中。当SQL命令输入完毕时,有三种方法可以结束SQL命令:在命令行的末尾输入分号(;
2012-12-05 17:05:07 2748
转载 oracle 数据库中的临时表
目前所有使用Oracle作为数据库支撑平台的应用,大部分数据量比较庞大的系统,即表的数据量一般情况下都是在百万级以上的数据量。当然在Oracle中创建分区是一种不错的选择,但是当你发现你的应用有多张表关联的时候,并且这些表大部分都是比较庞大,而你关联的时候发现其中的某一张或者某几张表关联之后得到的结果集非常小并且查询得到这个结果集的速度非常快,那么这个时候我考虑在Oracl
2012-10-21 22:33:58 1141
转载 gdb breakpoint
http://sourceware.org/gdb/current/onlinedocs/gdb二、断点设置gdb断点分类:以设置断点的命令分类:breakpoint可以根据行号、函数、条件生成断点。watchpoint监测变量或者表达式的值发生变化时产生断点。catchpoint监测信号的产生。例如c++的throw,或者加
2012-10-18 15:56:21 3062 1
转载 SQL 在表中建立索引的作用
索引的作用就在于,为某个字段建立了索引之后,查询这个字段里面的数据的时候,效率更高,也就是快,比如create index doc_info_index on yq_zs_doc_info(title);为yq_zs_doc_info表的title字段建立了索引,那么查询时,select * from yq_zs_doc_info where title like '%中国%';这个时候效
2012-09-29 17:26:18 1049
转载 matlab生成随机数函数
1. MATLAB 函数 rand产生在区间 (0, 1)的均匀随机数,它是平均分布在 (0,1)之间。一个称为seed的值则是用来控制产生随机数的次数。均匀随机数函数的语法为rand(n),rand(m,n),其结果分别产生一矩阵含n×n个随机数和一矩阵含m×n的随机数。注意每次产生随机数的值都不会一样,这些值代表的是随机且不可预期的,这正是我们用随机数的目的。我们可利用这些随机数代入算式中
2012-09-25 16:07:27 7868
原创 oracle数据库出现maximum open cursors exceed问题
问题的根源:资源的操作不当引起该问题,没用的资源没有及时释放在oralce的OCCI接口操作过程中,每个conn.createStatement都会打开一个cursor,一般数据库的默认最大cursor数据量是1000。所以,在创建了1000个statement之后,就再也打不开statement。解决方法之一,可以调节oracle数据库的默认cursor上限,虽然这样可以
2012-09-23 17:00:18 2040
原创 Linux 开启VNCSERVER
一般,通过ssh来远程连接linux服务器,进行命令操作。但是没有图形化界面确实有些不太方便,因此可以通过ssh来启动vncssh和vncserver以及vnc软件的安装这里就不再介绍。首先,启动vncserver,可能会提示如下warning和errorperl: warning: Setting locale failed.perl: warning:
2012-09-21 22:00:07 1060
转载 sql 查询优化
一、操作符优化1、IN 操作符用IN写出来的SQL的优点是比较容易写及清晰易懂,这比较适合现代软件开发的风格。但是用IN的SQL性能总是比较低的,从Oracle执行的步骤来分析用IN的SQL与不用IN的SQL有以下区别:ORACLE试图将其转换成多个表的连接,如果转换不成功则先执行IN里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用IN的SQL至
2012-09-20 14:25:10 394
原创 plsql developer 注册码
product code :4v6hkjs66vc944tp74p3e7t4gs6duq4m4szbf3t38wq2serial number:1412970386password: xs374calincense number :999
2012-09-20 11:37:06 424
原创 回溯法
回溯法是一种技术,有点像分割-合并方法。一般而言,回溯法在优化问题中很有用,可以很快的找到有效解。对于回溯法的抽象,我们可以将问题的解定义成一个n元组(x1,x2,…xn),其中每个xi都是有限集Si中的元素。因此,抽象的回溯问题,我们可以定义如下:1. 找到一个向量,能够使目标函数P(x1,x2,…,xn)达到最优。2. 找到一个向量,能够满足一个特定标准函数P(
2012-09-20 00:24:52 839
原创 date日期转换成整数
今儿在系统中出现了一个问题 ,08:value too great for base (error token is "08")查了一下发现,定义的一个整数,用date +%d进行赋值,当日期是8号,得到的08无法赋值到整型变量解决办法:将date得到的日期号转化为10进制,如下declare -i todaytoday=10#`date +%d`
2012-09-08 19:54:11 5584
翻译 CUDA C的并行编程
1.首先我们可以先看一下传统的CPU向量编程#define N 10void add( int *a, int *b, int *c ) { int tid = 0; // this is CPU zero, so we start at zero while (tid < N) { c[tid] = a[tid] + b[tid];
2012-09-06 10:17:55 1208
原创 CUDA开发环境搭建
1.安装Toolkit将下载好的toolkit进行安装,其中安装路径最好不要含有空格,像是安装到D:\Toolkit\CUDA2.安装SDK将下载好的SDK进行安装,例如:D:\ProgramData\NVIDIA_Corporation\SDK以上两种资源可以去NVIDIA官网进行相应的下载3.安装CUDA_VS_Wizard (http://sourcefo
2012-08-31 11:47:32 1147
转载 浅谈MySQL索引背后的数据结构及算法
摘要本文以MySQL数据库为研究对象,讨论与数据库索引相关的一些话题。特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等。为了避免混乱,本文将只关注于BTree索引,因为这是平常使用MySQL时主要打交道的索引,至于哈希索引和全文索引本文暂不讨论。文章主要内容分为四个部分
2012-08-29 11:16:55 354
转载 mysql数据库的优化
先学习一下MySql的相关优化问题,主要是从提高MySql数据库服务器的性能的思路进行考虑,主要包含以下8个方面的优化:1、选取最适用的字段属性; 2、使用连接(JOIN)来代替子查询(Sub-Queries); 3、使用联合(UNION)来代替手动创建的临时表; 4、事务; 5、锁定表; 6、使用外键; 7、使用索引; 8、优化的查询语句;下面就对
2012-08-28 16:28:26 612
转载 __declspec(dllexport) & __declspec(dllimport)
__declspec(dllexport)声明一个导出函数,是说这个函数要从本DLL导出。我要给别人用。一般用于dll中 省掉在DEF文件中手工定义导出哪些函数的一个方法。当然,如果你的DLL里全是C++的类的话,你无法在DEF里指定导出的函数,只能用__declspec(dllexport)导出类__declspec(dllimport)声明一个导入函数,是说这个函数是从别的
2012-08-23 11:28:59 490
原创 数据归一化总结
近来,在网上搜了很多关于数据归一化的帖子,看了太多,很杂,这里整理总结一下归一化是一种数据预处理方法,就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内,为了后面数据处理的方便,其次是保正程序运行时收敛加快。比如说,对于奇异样本数据(所谓奇异样本数据数据指的是相对于其他输入样本特别大或特别小的样本矢量),奇异样本数据存在所引起的网络训练时间增加,并可
2012-08-21 16:51:02 7309 1
原创 PL/SQL Developer的详细安装过程
一、安装oracle客户端http://www.oracle.com/technetwork/database/features/instant-client/index-097480.html二、配置下TNSNAME1.在PL/SQL Developer选择Tools > Preferences > options > "Oracle Home" and "OCI
2012-08-20 12:48:28 10430
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人