再见 明天就要离校了,感谢导师两年多的指导与帮助,让我得以入门科研,感谢同实验室同宿舍的朋友的陪伴,让这段日子不那么孤单。感谢丰富人生的另一些事,让我苦恼、开心与悲伤,可惜我不是作家,不然可以增加很多可写的东西...
Confession:关于本博客以及实习 本来写这些博客有很大原因是因为觉得对找工作有用,其实面试了两个实习我也从来没提过这个博客,想着帮助可能也不大。已经大半年没有更新了,今天谈谈实习那些事。首先是找实习工作,我真正准备的有华为、百度、招商银行fintech训练营三个。百度笔试被刷了,也是意料之中,编程都没编出来,问答题也一窍不通,选择题估计错误也不少,还是准备的不足。招商银行是我挺想去的一个公司,因为不太喜欢互联网公司的加班文化,同时...
关于投稿 从十月份到上周二,我投了两篇论文。一篇是在导师会议论文上做延伸,投到一篇逻辑学的SCI期刊上。另一篇是这段时间一直做的一个课题,投到了数据挖掘领域还可以的一个会议PAKDD上。写这两篇论文我深切地体会到了导师的重要性。首先,他会和你就课题展开讨论,去明确问题定义与算法实现等。然后,基于他在这一领域上的研究,他会给出很多有价值的参考文献。最后,在论文写作上,他又可以给出专业的指导,尤其是规范化英语写作
换个角度思考问题——频繁项集挖掘的两个优化策略 在以前的博客中介绍过数据挖掘的一个基本问题频繁项集挖掘。对于这一问题,有很多不同思想的算法。同时,也有一些优化策略可以在算法基本不变的情况下大大提高算法的效率。今天介绍两个:竖向数据库(Vertical database)、Diffsets
自然语言处理Java开源包FNLP(FudanNLP)的使用 自然语言处理是如今计算机科学领域比较火热的一个方向,其也确实有很大的应用场景。前面说过,我参加了微软编程之美的比赛,这个比赛其所基于的就是自然语言处理。我本身并不是学自然语言处理的,甚至连这门课也没有选过,可是为了完成资格赛我自己在网上找了一些资料。时间所限,也是能力所限,我当然不会自己去实现一些诸如中文分词与词性标注的自然语言处理算法。自然的,我想到了在网上找一些开源包。我主要考虑的是三个包...
参加了一个比赛 学计算机的,项目经历还是很重要的,参加一些竞赛对找工作也很有帮助。周围同学基本上都报名了一些比赛,我准备参加微软的编程之美比赛。原因是我比较喜欢它的赛制,它的时间比较宽裕,而且也有一定的培训。困难在于我不太熟悉C#编程昨天找了三个队友,一位是清华深研院先进制造部的博士学长,一位是我隔壁寝室的同学,还有一位是大一的本科生。我对于队员配置还比较满意,之后就靠我们的努力了。。。
Ubuntu 初步使用经验(虚拟机安装、命令行简单操作、常见问题) 因为我们实验室将于近期购买一批服务器,并会在后续开展大数据的相关研究。所以为了对以后的大数据技术(spark、Hadoop)的学习做一些准备,我决定熟悉一下Linux环境。在这篇博客里面我将介绍在VMware workstation里安装Ubuntu,Ubuntu使用中的一些问题,远程连接Ubuntu。一、 VMware workstation下安装Ubuntu首先是在VMware官网上下载安装包,
反向传播神经网络(BP网络)介绍及Java实现 介绍了神经网络的经典算法反向传播神经网络(Backpropagation Neural Network),介绍了算法过程以及网络分类过程、训练过程。也详细介绍了推导过程,并提供了java实现
HUI-Miner:高效的高效用项集(high-utility itemset)挖掘算法 在之前的博客中我介绍过我的研究方向高效用挖掘算法。今天我将介绍解决这一问题的一个运行速度很快,并且很容易理解的一个算法–HUI-Miner,并会提供Java实现。