- 博客(16)
- 收藏
- 关注
原创 NoSQL实践——Neo4j
NOSQL——Neo4j1, 介绍&配置近几年互联网大数据的不断发展导致了各种DBMS的发展,除了传统的RDBMS(关系型DBMS),NOSQL发展也较迅速,最著名的是文本型数据库Mongodb,今天介绍的是一种基于图的NOSQL——Neo4j。适合一些图型数据(如下图)的存储,比如社交关系网络等。 从官网上可以获得更详细的介绍和下载,下载分三个版本——社区版(Community
2013-03-13 15:55:01 5778
原创 Feelings On Life II
好久没写写自己的一些感悟,最近一直都很累,但是最终还是有点回报的。时间果然很快,还清楚记得暑假起早贪黑看着书的情景,开学初忙着保研的奔波,国庆难得一次的放松。。。一转眼10月已到底,一年甚至都快结束了。最近看到校招进行着,周围同学一个个参加宣讲会,参加笔试面试,想着3,4年后自己也要这样,不禁四顾心茫然,人生的道路或许已经不知不觉铺好。这两个多星期基本是在焦虑和抑郁中度过,Lab那边没
2012-10-25 15:18:13 782
原创 数据挖掘读书笔记一——数据认识
最近偏重看数据挖掘方面的知识,整了本韩家炜的《数据挖掘》慢慢研究,特整理此系列作为读书随笔。第一篇是数据的相关知识,对应书上的第二章,主要讲述了数据有关基础的内容,和统计线性代数相关。Part1,数据基础一,数据属性与类别属性简介从广义上来讲,数据集中包含了每一个数据对象,每一个数据对象代表了一个实体,这倒颇有一点OO的思想。对于任何一个数据,如
2012-10-24 13:59:19 3747
原创 Java学习随笔——MyEclipse控制台输入中文乱码解决
之前写java用到控制台的主要是字符和数字,中文输入貌似真的还没用过,所以就遇到了一个悲剧的老问题,估计每个程序员都会遇到——中文乱码。用的是MyEclipse开发环境,Window->General->Workspace下的编码、控制台的编码、项目的编码都是UTF-8,就连代码都设置了UTF-8读取,结果还是中文乱码,实在诡异,最后终于发现了解决方法,主要是修改MyEclipse的配置文件,
2012-09-26 20:51:01 6977
原创 Facebook应用开发——Heroku简介
其实FB开发并不一定要Heroku,我们完全可以依托本地服务器或企业服务器来支撑起我们的app,但是在初学阶段,还是先用用这个云服务器再说。先看一下从网上找的一个简单介绍:Heroku 是一个商业的Rails主机托管解决方案,提供的是“无需准备的部署服务”,因为操作和扩展都是自动的,无需任何系统管理。虽然相较于其它服务商而言Heroku目前的价格较高。为适应不断变化
2012-09-15 21:09:05 2781
转载 Python写一个简洁拼写检查器
网上看到的一篇神文,利用的是朴素贝叶斯模型实现了一个简单的拼写检查器。英文原文链接见这里,中文翻译如下====================================================================================================================================怎样写一个
2012-09-11 20:08:41 6895 1
原创 数据挖掘随笔记录一
数据挖掘应用领域里存在四种完全不同的学习方式。1,分类学习(classification learning)是用一个已分类的样本集来表示学习方案,并希望从这个样本集中学习对未来样本进行分类的方法。这个感觉就类似机器学习中的监督学习(supervised learning),从给定的训练集和结果中训练得到。2,关联学习(association learning):寻找任何特性之间的关联,
2012-09-07 15:04:19 686
原创 【算法】01背包问题的Java实现
动态规划算是一个非常著名的算法,基于此的各类问题也有很多,背包问题也算是赫赫有名,最近看一些OJ机试上都有此类题目。背包问题主要是指一个给定容量的背包、若干具有一定价值和重量的物品,如何选择物品放入背包使物品的价值最大。其中又分01背包和无限背包,这里主要讨论01背包,即每个物品最多放一个。而无限背包可以转化为01背包。先说一下算法的主要思想,利用动态规划来解决。每次遍历到的第i个物品,根
2012-09-01 15:47:56 4605 3
转载 EM算法简介
最近看分类方面的内容,目前接触的一些算法主要是k-means算法和EM算法,k-means算法还好,比较容易理解,而EM算法第一次看则是一头雾水(菜鸟一枚啊~~~),网上找了几个讲解,记录一下。===================================================================================================
2012-08-25 22:54:27 812
原创 机器学习阶段总结一
最近一直在看机器学习相关内容,主要是看的斯坦福的Andrew Ng教授的公开课视频,可以点这里看了前四讲,最大的感觉就是这简直就是概率论+线代,用到的数学知识着实不少,不过也挺有趣的,继续学下去。初步总结一下,主要是关于监督学习,回归分类方面的。1,机器学习中主要有两个基本的学习方法:监督学习和非监督学习。简单来说,监督学习是告诉了机器某个训练集并且指明了这个集中每个训练样本的特征
2012-08-25 16:09:58 1287
原创 生成模型和判别模型
今天看了斯坦福机器学习课程的第五讲,有提到生成学习,看了下,之前所讲的是各种回归分类问题属于判别模型,这两者一定要熟悉。对于样本的学习主要有两种方式,就是生成学习和判别学习。简单来说,根绝学习过程中的focus点来划分。对于判别学习,主要是focus在 p(y|x)上,也就是根据给定一个观察值,给出这个值属于某个域的概率,这其实和我们正常的思维差不多,比如观察到一只狮子,要判断
2012-08-09 15:02:13 950
原创 Windpws下Common Lisp的实现
好吧,又是一篇傻瓜式配置文件。貌似所有方面都是没有完全深入,只是停留在初步的层次,看来这个习惯要改。这次是Lisp,一个古董级的语言,算是现在还在使用的第二历史最久的语言,仅仅排在Fortran后面。具体的关于Lisp的深入介绍可以参见Lisp中文社区。其实Lisp本身并不像Java,Python那样有固定的sdk'或安装包,Lisp仅仅是一个标准,在该标准下有多个实现,这也是Lisp
2012-08-08 19:07:10 1226
原创 Feelings on Life
最近心里平静了许多,前一段时间各种纠结,现在反而越来越想通了,既然入了这一行,技术+实践才是王道,何必要追求其他虚名。况且目前的状态已经不错了,知足者常乐没有出去实习,暑假还是呆在学校静下心看点书,最近感觉看了不少方面的内容。先是数学+数据结构算法扎实一下基础,然后是机器学习的一些初步入门,还有Hibernate,Struts2再熟悉熟悉,此外还有Lisp的接触,感受一下Lisp的永恒
2012-08-07 21:25:59 698
原创 Mahout初体验——配置+HelloWorld
最近在看机器学习方面的内容,不过一直在看理论方面未免略枯燥,正好发现了一个Apache下的开源项目——Mahout,是一个Java的机器学习算法库,遂看之。Mahout的主页Apache Mahout,正如其主要介绍的,这是一个Scalable Machine Learning库,而且基于Map/Reduce,可运行在Hadoop集群上。事实上它提供的库就有两种,一种是单机版的,独立运行在
2012-08-02 20:53:16 6039 2
转载 KNN ( K最近邻法) 原理。
Posted By Mr. Thursday 各位看到標題,如果沒有聽過KNN演算法,會不會覺得疑惑:KNN是甚麼呢?是不是CNN看久了,就變成DNN、ENN、最後變成KNN了呢?當然不是啦 XD!KNN全名是k-th nearest neighbor,中文意思是「第k位最接近的鄰居」。甚麼是「第k位最接近的鄰居」呢?假設在一個廣場上,有100個朋友,每位朋友都是你的鄰居,最接近你的鄰居,
2012-07-28 10:08:59 6044 1
原创 Python实现BBS自动登录并发帖
初学Python有了一段时间,寒假里又看了一些Web编程方面的知识,就写了一个实现bbs自动登录和发帖的Python脚本由于本人学校BBS站首页使用js加载,貌似通过首页登录不大可行,然后就分析表单,发现是通过POST一些data到特定的地址,之后获取返回的cookie。这样就好办了,废话不多说,上代码。(初学,不够 Pythonic,见谅)#-*-coding:utf-8-*-#l
2012-02-06 11:09:00 12033 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人