自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 WEKA算法解析 -- 多层感知器(BP神经网络)

<br />     这次详细第看了看WEKA里神经网络的实现,涉及的代码挺多的,我把跟图形化相关的删除了,另外有些地方我自己也不是很清楚,不过大体上还是很清楚的了,这是一项比较老的技术了,没什么好介绍的了,来这里看的各位估计都是懂的。直接贴代码了。<br /> <br /> public void buildClassifier(Instances i) throws Exception { // 验证数据类型是否为算法所支持的类型 getCapabilities().te

2011-04-30 15:27:00 15539 2

原创 WEKA算法解析 -- PART决策树

     PART 决策树算法是一种由 WEKA 的作者 Eibe Frank 和 lan H. Witten 在1998年发明的算法,他们在1998年发表了论文Generating accurate rules sets without global optimization 详细地介绍了PART决策树的原理,并在WEKA中完整地实现了PART决策树。由于之前的股票数据挖掘的决策树部分就是用的这个算法,所以看了源代码,涉及的类比较多,贴上主要的一部分。     另外不得不说的是,笔者相当佩服 Eibe F

2011-04-26 16:24:00 8157

原创 WEKA算法解析--ID3

<br />    最近由于实际需要,要把以前看过的算法复习下,我基本每行代码都按自己的意思理解了下,不知道对不对,不过贴出重点部分,供大家围观。第一篇先找简单的下手,嘿嘿,ID3,来吧。<br /> /** 变量定义: */ /** 保存决策树节点的数组 */ private Id3[] m_Successors; /** 分裂属性 */ private Attribute m_Attribute; /** 叶子节点的分类 */ private doub

2011-04-24 17:54:00 4321

原创 编程解决工作指派问题(运筹学)

<br />    今天要交运筹学动态规划部分的作业,我看了看书,发现有个问题能写出一个不错的程序来,于是心血来潮编程搞了下,效果还不错,嘿嘿,怀念高中时候的动态规划啊~~~<br />题目是这样的:<br />    有4个工人,要分别指派他们完成4项工作,每人做各项工作的时间如下表:<br />                   A                B               C               D<br />    甲           15             

2011-04-18 18:28:00 6830 1

原创 科创之股票数据挖掘(6)

<br />    已经很久没有更新我的博客了,最近做了一些小项目,事情比较多,数据挖掘的进度慢了下来,一是因为技术上遇到了一些瓶颈,需要我们解决;二是因为我在想办法提高我们数据挖掘的质量,神经网络上遇到的麻烦一直困扰着我。最近我们的工作需要写一些总结去参加学校的一个论坛,虽然我不觉得有什么意义,但是可以作为一个整理思绪的理由,加上一些朋友也在关注着我们,于是我决定继续写下去。这一篇不会涉及太多的技术问题,更多的是工程问题,也就是我们在实际操作过程中的麻烦事,我会从头开始讲起,写出来给大家分享。从下一篇开始

2011-04-06 12:23:00 3113 3

原创 科创之股票数据挖掘(5)

<br />      本来这篇是关于BP神经网络的,但是我已经受够了被欺骗的感觉,得先发几句牢骚。<br />      那些发股票数据挖掘说什么BP神经网络,或者SVM在用XX方法挖掘效果非常明显,非常有效的本科生,硕士生,博士生,甚至教授们,你们这是在做学术么?我只是一个小小的做应用的人,都看不下去了,全TMD扯淡!!好吧,我现在来分析下相关论文介绍,论文的风格都大同小异,无非是先把算法拿出来分析一遍,再讲讲神经元的训练过程,相关参数的调整,弄得大张旗鼓,很高科技似地。好了,最后,取XX年XX月到XX

2010-11-27 18:45:00 2970 6

原创 写给这五天的自己

<br />      这五天非常的不在状态,在走神、失落、恐慌中度过,心情焦躁,身体却懒得出奇,几乎天天睡懒觉,逃课逃成了习惯,反而上课让我感到不自然。我不知道自己这是怎么了,像是丢了魂一样。玩了几天的游戏,但是游戏给我带来的却不是快乐,甚至越玩越心烦,玩到一半就关了,然后继续走神。还好已经习惯了思考,最后的两天也让我逐渐地从自我羁绊中走出来,因为长期的不思考问题会让我感到浑身不舒服。其实我在周3就意识到我应该振作一点的,只是身体慢了思想一拍,现在才算基本有些起色。<br />      想想前一阵子做的

2010-11-19 23:46:00 1066

原创 科创之股票数据挖掘(4)

<br />      我们的队长在挖掘的过程中提出对于股票之间的涨跌关联的挖掘。首先讨论用什么样的算法可以做这样的挖掘,我们提取出从1990年开市以来每支股票每日的涨跌幅作为数据集进行挖掘,这样一来规模就稍显有些大了。用关联规则的APRIORI算法吃不消,其他的关联规则算法我不熟悉,所以没办法用。我尝试了用BP神经网络来做,不过我把JVM的运行空间调到了1.5G,依然无法承受这个规模的数据,不过我觉得即使能用好一点的机器做了,意义并不大,因为BP神经网络本身是基于黑盒测试的技术,我们无法得知它是怎么预测到

2010-11-14 02:07:00 2623 1

原创 2010-11-15安排

<br />      这十天做了不少事,首先参加了ACM成都赛区比赛,本来就是抱着旅游的心态去的,不过最后打铁还是挺遗憾的。A了两道,后面两个程序都没调出来,可惜了。不过没有多少付出,就算收获了也只能说明运气好。之后和BM回了德阳,窝在屋子里做股票数据挖掘,具体的内容我会单独写文章介绍。现在回到了学校,该安排安排新的生活。<br />      明天早上抄实验报告,下午和晚上复习集合论和数理逻辑吧。

2010-11-14 01:10:00 806

原创 2010-11-04安排

<br />今天没有完成预期计划,主要原因是睡了懒觉,导致自己到现在都还没干完事。<br />今天已经完成的任务有:<br />1、完成了读书和习题的大部分。<br />2、完成了虚拟光盘库的申报材料的大部分。<br />3、修改了C语言考试系统申报书的修改。<br /> <br />明天就不安排了,开会,实验,还有看书,第二章的剩余部分,然后早点休息,后天早上飞机了。。。

2010-11-03 22:55:00 714

原创 《数据库系统基础教程》读书笔记——第二章 关系数据模型(1)

<br />     本书第二章涉及到了具体的内容,这部分内容是数据库系统的理论基础,是本书的核心之一,我当初准备用两天的时间完成对第二章的阅读和分析,不过现在看来似乎没那么简单,事实上到现在为止我也没有完全完成2.4节及之前的所有习题。不过大致的内容已经差不多清楚了,我会专门留给自己一些时间来思考难题。<br />     进入正题,这一章讲述的是关系代数,何为关系代数,我没有认知得很清楚,但是学校开设了数理逻辑与集合论这门课,关系代数与这门课有着非常密切的联系,因此如果有数理逻辑和集合论基础,学习起这一

2010-11-03 17:31:00 1703

原创 2010-11-03安排

今天已经完成:1、提前做的模拟电路实验。2、与郑老师的交流,并已经将C语言考试系统科创申请书写好。3、完成了《数据库系统基础教程》2.4及之前章节的作业。4、没状态了,今天到此结束,很累。明天需要完成:1、早上补充完成第二章的作业和读书笔记。2、下午抄写实验报告并写虚拟光盘库申请报告的相关部分。3、晚上写今天的模拟电路实验报告。4、如果有时间,看数电书并做练习。坚持啊~~~

2010-11-02 20:53:00 728

原创 《数据库系统基础教程》读书笔记——第一章 数据库系统世界

<br /><br />      首先说说读这本书的原因,因为自己最近接触到的一些项目比较多地接触到了数据库,但是自己还没有系统地看过数据库方面的教材,于是找本书看,补补自己的基础。我选了《数据库系统基础教程》,这本书是斯坦福的数据库教材,应该很不错。再说说自己做读书笔记的原因,一方面是为了引发自己的思考,另外一方面也是为了克服自己的惰性。<br />      今天仔细地看了第一章,第一章是一个大体地综述,用名词概述的方法来总结今天的学习成果,可能理解有误,不过先写下来好了:<br /> <br />数

2010-11-02 10:10:00 2186

原创 2010-11-02安排

<br />      寝室有一个同学,他十分会安排自己的生活,他提前一天计划自己第二天要做的事,我觉得这十分值得学习,所以我也尝试着提前一天决定第二天的安排。<br />明天作以下安排:<br />1,早上八点到实验室做模拟电路实验。<br />2,做完实验去与郑老师讨论为学校做C语言考试系统的事。<br />3,中午之前反思与老师交流的内容,并把系统的构架和做法初步确定。<br />4,吃完午饭写C语言考试系统的科创申请报告,争取在晚饭前完成。<br />5,晚上阅读《数据库系统基础教程》至2.5,并完

2010-11-01 21:41:00 924

原创 一个计算机爱好者的回忆录(2)

<br />    恩,忙了一天,继续上次的,回忆一下过去,就当是自我娱乐吧。<br />    话说我们与PASCAL接触,是在学校组织的计算机兴趣班里面,为了培养我们对计算机的兴趣,学校组织了一个利用课余时间学习编程的班,这可把我乐坏了,当时用的是FREE PASCAL,就是一打开屏幕满眼都是蓝色的那种,我有了之前学习两种语言的经历,PASCAL虽然结构比QBASIC更复杂,功能更加强大,但是还是差不多的,相信很多学计算机语言的朋友都有这样的感觉,学会了任何一种,其他的就好学了。不过当时最大的收获还是接

2010-10-21 21:58:00 1017 1

原创 一个计算机爱好者的回忆录(1)

<br />    文笔不好,所以想多写点文字,练习的同时,也算是排解内心的寂寞。<br />    记得上小学的时候,家里有一台小霸王学习机,那时候电脑还是个稀奇玩意,我自然是没有见过。不过小霸王学习机足以满足我的需求——只要能插上黄色的游戏卡打游戏,那自然是足够了。我是个游戏迷,打了上百种游戏,每天很效率地写完作业,其他大多数时间都泡在了游戏里,游戏卡堆得比我人还高。家里人觉得我贪玩,但是成绩还算不错,于是就没有管得太多。后来学校开设了计算机课,当我把教材看完一遍的时候,我就立刻被吸引住了,显示器,主机

2010-10-19 12:13:00 1398

原创 我的笔记

 我的笔记内容我会更新在我的博客中http://blog.csdn.net/jacksonislwj欢迎各位来小弟的博客做客

2010-10-12 22:01:00 1255

原创 科创之股票数据挖掘(3)

    最近越来越忙了,不过今天还是抽出时间操作了一下上一篇文章讲的挖掘方法,还好我操作了一下,这东西还是要看实效说话的,如果挖不到有价值的信息,再高级的算法,再好的想法,都是空谈。上一篇文章做了一下分析,具体的操作也说了下,不过由于时间比较仓促,我没有进一步做分析,那么这篇文章我来讲述一下我自己的实际操作。由于数据库的几百万行数据还在处理,指标的建模也还未完成,所以这里只拿一个小规模数据来做,不过足以得到部分信息。    我们以601899紫金矿业为例,首先从大智慧新一代里面,把KDJ,RSI,PSY数据

2010-10-12 21:18:00 3151 1

原创 科创之股票数据挖掘(2)

<br />    本来文章准备今天下午发,但是有事耽误一直拖到现在,今天的事不想拖到明天,就现在发吧。<br />    今天谈论的内容是和关联规则相关的股票预测,具体怎么做,我先在网上找了一些论文看,觉得做得都不够好,我有一些自己的思想,就写出来吧,因为是对自己学习的总结,也供大家参考。<br />    首先我们可以从算法上分析,关联规则的APRIORI算法是很基础的,也是很好用的,它能挖掘出频繁K项集,也就是满足支持度阀值(当然,也必须有较高的置信度)的所有集合,但是它有一个较大的局限,就是它所适用

2010-10-11 02:14:00 3602 2

原创 科创之股票数据挖掘(1)

    其实早就想写这东西了,只是一直没有整理好思绪,所以拖到了今天,今天晚上夜黑风高,又不想写数据结构作业,于是终于有时间写点东西怨念下了。    首先说说数据挖掘吧,接触这东西也是机缘巧合,上学期听说ZYN学姐在做科创,于是问了问具体情况,她说跟数据挖掘有关,这词我还是第一次听说,听起来很高级啊,我看了些资料,觉得非常感兴趣,于是就阴差阳错地加入了,还拉了BM和BAQ同学入伙。于是悲剧就开始上演了,我们小组组成以后才发现,原来大家都不懂,什么叫数据挖掘?于是项目没法成立,因为连挖啥都不知道。    于是

2010-10-10 00:21:00 3966

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除