自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ee_mc的专栏

数据挖掘 机器学习

  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

翻译 成功数据分析师的五个习惯

数据科学家及数据分析师成为互联网新时代的热门职业,那么做一名成功的数据分析师需要注意什么呢?

2014-02-08 23:46:43 2324

原创 计算投资学(computational invest)

大概浏览了一下cousera上Tucker Balch博士的计算投资学,属于机器学习和金融的交叉学科。是很有意思的一个领域,可以把数据挖掘技术直接转换成真金白银的一个领域。挑了一些视频看了一下,总体感觉信息量不大,课件过于简单,相对于金融的课程金融方面讲的很基础,相对于机器学习的课程,从机器学习或者数据分析的角度看算法都很简单,数据分析的结论也是很容易解释的。作为入门还是不错的,只要熟悉pyt

2014-02-04 00:38:20 2223

转载 python 正则表达式

就其本质而言,正则表达式(或 RE)是一种小型的、高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现。使用这个小型语言,你可以为想要匹配的相应字符串集指定规则;该字符串集可能包含英文语句、e-mail地址、TeX命令或任何你想搞定的东西。然後你可以问诸如“这个字符串匹配该模式吗?”或“在这个字符串中是否有部分匹配该模式呢?”。你也可以使用 RE 以各种方式来修

2013-01-12 18:20:37 1601

原创 学校技能树与公司技能树

学校:1,读paper,发现问题的能力(研究生前期中期大量的时间都是花在这上面,在新的领域要积累大量的知识);2,研究问题,一些相关的技术能力(前期中期);3,文字能力,英文水平,paper撰写能力,基金申请书撰写能力(中期后期,这是个收获的季节,paper被录用的时间段);4,一些快速出成果的所谓技巧(中后期,科研不再神秘,完成论文只是一种流水线作业而已);5,一些做横向项目

2013-01-07 15:55:38 1758

原创 几个练习编程的网站

http://bit.ly/oUHI4Ghttp://geeksforgeeks.org/forum/forum/interview-questionshttp://www.careercup.com/pagehttp://codekata.pragprog.com/2007/01http://www.leetcode.com/

2012-12-22 23:09:19 2095

转载 Python 数据挖掘推荐模块

best python modules for machine learning, data mining, natural language processing, network analysis, and web scrapingThis list is my summary of Quora question What are the best Python 2.7 modul

2012-11-20 23:37:33 3101

原创 数据挖掘竞赛

1,  kaggle, 很不错,竞赛很多,奖金丰厚,并且有一些初级的教程。http://www.kaggle.com/ 2, KDD Cup  国际知识发现和数据挖掘竞赛,不必多说。    3, Topcoder Marathon  有时会有一些数据挖掘的题目。 4, 国内的数据挖掘竞赛 http://cnnicdata.datatang

2012-11-20 23:35:20 2796

原创 站在科学与技术的边缘

如果经常上科学网博客,会经常看到我们的科研工作者们批判中国的科研体系,类似的言论很多,如“一流的本科,二流硕士,三流博士”,“要建设世界一流大学,但学生却以出国为荣”,“看不起自己培养的研究生”,“青年教师生存的艰难”,“大学的官本位”,“导师的放羊式管理,研究生的自生自灭与自学成才”。看到这些很是心酸,若干年前,一腔热血,想在科学领域有所建树,去追逐理想,追逐不到只能立足现实,如今,虽然多篇SC

2012-11-12 17:51:14 1859

原创 国外数据挖掘方面的经典博客

总体感觉数据挖掘行业在国内尚没有收到足够重视,国内的相关博客的内容也不够丰富,下面列出了一些国外数据挖掘方面的经典博客。数据挖掘是一个有趣的以及具有足够学术价值和商业价值的领域,大数据挖掘也是IT行业未来发展的大趋势,在这个领域我们或许可以找到自己想要的东西。Abbott Analytics: both industry and research oriented posts coveri

2012-11-11 23:13:26 5189 2

转载 UCI数据集和源代码&数据挖掘的数据集资源

《UCI数据集和源代码》UCI数据集是一个常用的标准测试数据集,下载地址在http://www.ics.uci.edu/~mlearn/MLRepository.html我的主页上也有整理好的一些UCI数据集(arff格式):http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip在看别人的论文时,别人使用的数据集会给出数据

2012-11-11 22:51:36 3983 1

原创 人为什么能分辨图片---谈机器学习原理在神经解码中的应用

信息传导是神经系统的关键问题,特定的神经元把外部刺激转换为神经编码,这些信息通过特定通道进入由几十亿神经元组成的大脑或神经中枢,并与其它信息合并。神经系统根据收到的信息做出决定,并通过运动指令使肌肉运动从而产生行为,这一系列活动是动物生存的必要条件。       从神经系统生理学的角度来看,神经元是基本的编码单元,神经系统的信息传导通过神经放电的传导实现。神经科学的一个经典假说是神经元的尖峰放

2012-10-24 19:00:13 1925

原创 模式识别简介(2) 分析框架

模式识别的分析框架大概可以分成数据预处理,特征提取和分类。(1)数据预处理:通常来说,采集到的数据都是最原始的数据,在数据的采集过程中,由于环境或者仪器本身的原因,数据并非真实的而是混合了一些干扰因素,比如噪声,工频干扰等。所以需要对原始数据进行处理降噪,也就是数据的预处理。从而把数据整理成更标准的形式为后续的分析提供方便。(2)特征提取:特征提取主要是采用不同的方法对数据进行降维,从

2012-05-31 14:10:59 2072

原创 要时刻提醒自己的几件事

1,停止空想,做实事。2,保持简单3,克制自己4,保持平衡5,对自己有信心6,有的放矢,不浪费精力7,胡思乱想,消极时,借助一切手段切换状态8,世界是平的9,珍惜最亲近的人10, 一段时间内,只做一件事11, 借助他人的力量12, 不要畏惧,什么事都是可以做成的

2012-02-04 21:24:21 1492

原创 模式识别简介(1)

本文就模式识别的一些基本思想进行简单介绍,有具体需求时,再有的放矢的进行专项的学习将更有效率。     模式识别的最终目的可以简单理解为分类,如我们熟悉的垃圾邮件识别,人脸识别,文字等,其包含以下要素:模式定义,传感信息输入,模式表示,特征提取与选择,聚类分析,分类器设计和学习,训练和学习样本选择,效能评价。虽然经过五十年的发展,模式识别领域有了长足的进步,解决了一系列问题,但是一些复杂的问题

2012-02-04 21:04:44 1767

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除