- 博客(14)
- 资源 (1)
- 收藏
- 关注
原创 计算投资学(computational invest)
大概浏览了一下cousera上Tucker Balch博士的计算投资学,属于机器学习和金融的交叉学科。是很有意思的一个领域,可以把数据挖掘技术直接转换成真金白银的一个领域。挑了一些视频看了一下,总体感觉信息量不大,课件过于简单,相对于金融的课程金融方面讲的很基础,相对于机器学习的课程,从机器学习或者数据分析的角度看算法都很简单,数据分析的结论也是很容易解释的。作为入门还是不错的,只要熟悉pyt
2014-02-04 00:38:20 2223
转载 python 正则表达式
就其本质而言,正则表达式(或 RE)是一种小型的、高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现。使用这个小型语言,你可以为想要匹配的相应字符串集指定规则;该字符串集可能包含英文语句、e-mail地址、TeX命令或任何你想搞定的东西。然後你可以问诸如“这个字符串匹配该模式吗?”或“在这个字符串中是否有部分匹配该模式呢?”。你也可以使用 RE 以各种方式来修
2013-01-12 18:20:37 1601
原创 学校技能树与公司技能树
学校:1,读paper,发现问题的能力(研究生前期中期大量的时间都是花在这上面,在新的领域要积累大量的知识);2,研究问题,一些相关的技术能力(前期中期);3,文字能力,英文水平,paper撰写能力,基金申请书撰写能力(中期后期,这是个收获的季节,paper被录用的时间段);4,一些快速出成果的所谓技巧(中后期,科研不再神秘,完成论文只是一种流水线作业而已);5,一些做横向项目
2013-01-07 15:55:38 1758
原创 几个练习编程的网站
http://bit.ly/oUHI4Ghttp://geeksforgeeks.org/forum/forum/interview-questionshttp://www.careercup.com/pagehttp://codekata.pragprog.com/2007/01http://www.leetcode.com/
2012-12-22 23:09:19 2095
转载 Python 数据挖掘推荐模块
best python modules for machine learning, data mining, natural language processing, network analysis, and web scrapingThis list is my summary of Quora question What are the best Python 2.7 modul
2012-11-20 23:37:33 3101
原创 数据挖掘竞赛
1, kaggle, 很不错,竞赛很多,奖金丰厚,并且有一些初级的教程。http://www.kaggle.com/ 2, KDD Cup 国际知识发现和数据挖掘竞赛,不必多说。 3, Topcoder Marathon 有时会有一些数据挖掘的题目。 4, 国内的数据挖掘竞赛 http://cnnicdata.datatang
2012-11-20 23:35:20 2796
原创 站在科学与技术的边缘
如果经常上科学网博客,会经常看到我们的科研工作者们批判中国的科研体系,类似的言论很多,如“一流的本科,二流硕士,三流博士”,“要建设世界一流大学,但学生却以出国为荣”,“看不起自己培养的研究生”,“青年教师生存的艰难”,“大学的官本位”,“导师的放羊式管理,研究生的自生自灭与自学成才”。看到这些很是心酸,若干年前,一腔热血,想在科学领域有所建树,去追逐理想,追逐不到只能立足现实,如今,虽然多篇SC
2012-11-12 17:51:14 1859
原创 国外数据挖掘方面的经典博客
总体感觉数据挖掘行业在国内尚没有收到足够重视,国内的相关博客的内容也不够丰富,下面列出了一些国外数据挖掘方面的经典博客。数据挖掘是一个有趣的以及具有足够学术价值和商业价值的领域,大数据挖掘也是IT行业未来发展的大趋势,在这个领域我们或许可以找到自己想要的东西。Abbott Analytics: both industry and research oriented posts coveri
2012-11-11 23:13:26 5189 2
转载 UCI数据集和源代码&数据挖掘的数据集资源
《UCI数据集和源代码》UCI数据集是一个常用的标准测试数据集,下载地址在http://www.ics.uci.edu/~mlearn/MLRepository.html我的主页上也有整理好的一些UCI数据集(arff格式):http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip在看别人的论文时,别人使用的数据集会给出数据
2012-11-11 22:51:36 3983 1
原创 人为什么能分辨图片---谈机器学习原理在神经解码中的应用
信息传导是神经系统的关键问题,特定的神经元把外部刺激转换为神经编码,这些信息通过特定通道进入由几十亿神经元组成的大脑或神经中枢,并与其它信息合并。神经系统根据收到的信息做出决定,并通过运动指令使肌肉运动从而产生行为,这一系列活动是动物生存的必要条件。 从神经系统生理学的角度来看,神经元是基本的编码单元,神经系统的信息传导通过神经放电的传导实现。神经科学的一个经典假说是神经元的尖峰放
2012-10-24 19:00:13 1925
原创 模式识别简介(2) 分析框架
模式识别的分析框架大概可以分成数据预处理,特征提取和分类。(1)数据预处理:通常来说,采集到的数据都是最原始的数据,在数据的采集过程中,由于环境或者仪器本身的原因,数据并非真实的而是混合了一些干扰因素,比如噪声,工频干扰等。所以需要对原始数据进行处理降噪,也就是数据的预处理。从而把数据整理成更标准的形式为后续的分析提供方便。(2)特征提取:特征提取主要是采用不同的方法对数据进行降维,从
2012-05-31 14:10:59 2072
原创 要时刻提醒自己的几件事
1,停止空想,做实事。2,保持简单3,克制自己4,保持平衡5,对自己有信心6,有的放矢,不浪费精力7,胡思乱想,消极时,借助一切手段切换状态8,世界是平的9,珍惜最亲近的人10, 一段时间内,只做一件事11, 借助他人的力量12, 不要畏惧,什么事都是可以做成的
2012-02-04 21:24:21 1492
原创 模式识别简介(1)
本文就模式识别的一些基本思想进行简单介绍,有具体需求时,再有的放矢的进行专项的学习将更有效率。 模式识别的最终目的可以简单理解为分类,如我们熟悉的垃圾邮件识别,人脸识别,文字等,其包含以下要素:模式定义,传感信息输入,模式表示,特征提取与选择,聚类分析,分类器设计和学习,训练和学习样本选择,效能评价。虽然经过五十年的发展,模式识别领域有了长足的进步,解决了一系列问题,但是一些复杂的问题
2012-02-04 21:04:44 1767
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人