自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (12)
  • 收藏
  • 关注

原创 斯坦福大学机器学习——特征选择(Feature selection)

特征选择是一种及其重要的数据预处理方法。假设你需要处理一个监督学习问题,样本的特征数非常大,但是可能仅仅有少部分特征会和对结果产生影响。甚至是简单的线性分类,如果样本特征数超过了n,但假设函数的VC维确仍然是O(n),那么,除非大大扩展训练集的数量,否则即会带来过拟合的问题。在这样的情况下,可以使用特征选择算法降低特征的数量。

2015-01-22 14:06:02 22904

原创 斯坦福大学机器学习——交叉验证(Cross Validation)

交叉验证是一种模型选择方法,其将样本的一部分用于训练,另一部分用于验证。因此不仅考虑了训练误差,同时也考虑了泛化误差。从这里可以看出机器学习、数据挖掘与传统统计学的一个重要差别:传统统计学更注重理论,追求理论的完整性和模型的精确性,在对样本建立某个特定模型后,用理论去对模型进行各种验证;而机器学习/数据挖掘则注重经验,如交叉验证,就是通过不同模型在同一样本上的误差表现好坏,来选择适合这一样本的模型,而不去纠结理论上是否严谨。

2015-01-19 09:27:07 64681 1

原创 斯坦福大学机器学习——误差理论(Error Theory)

一、偏倚(bias)和方差(variance)在讨论线性回归时,我们用一次线性函数对训练样本进行拟合(如图1所示);然而,我们可以通过二次多项式函数对训练样本进行拟合(如图2所示),函数对样本的拟合程序看上去更“好”;当我们利用五次多项式函数对样本进行拟合(如图3所示),函数通过了所有样本,成为了一次“完美”的拟合。图3建立的模型,在训练集中通过x可以很好的预测y,然而

2015-01-09 22:07:04 33953 5

From Data Mining to Knowledge Discovery in Databases

经典的数据挖掘的综述性文章,介绍了数据挖掘常用的方法和步骤。

2015-05-03

通信的数学原理

《通信的数学原理》 香农开创信息论的原文

2013-06-26

人工智能基础 人工智能基础

人工智能基础 人工智能基础 人工智能基础 人工智能基础

2010-08-15

人工智能 (尼尔逊)-------人工智能入门著作

人工智能入门著作 人工智能入门著作 人工智能入门著作 人工智能入门著作

2010-08-15

WINDOWS核心编程(中文版)

《Windows核心编程》是为打算理解Windows的C和C++程序员精心设计的,作为Windows开发人员的必备参考。第5版全面覆盖 Windows XP,WindowsVista和WindowsServer2008中的170个新增函数和Windows特性。书中还讲解了Windows系统如何使用这些特性,我们开发的应用程序又如何充分使用这些特性,如何自行创建新的特性。 《Windows核心编程》重要主题: 如何为32位和64位Windows系统构建和实现应用程序; 如何新建和处理进程与作业; 如何调度.管理、同步和销毁线程; 如何通过I/O完成端口执行同步和异步设备I/O操作; 如何使用虚拟内存、内存映射文件和堆之类的各种技术来分配内存; 如何处理默认调拨的线程栈物理存储; 如何为延迟加载、API拦截和进程注入构建DLL; 如何使用结构化异常处理、Windows错误恢复和应用程序重启等机制。 《微软技术丛书》包括以下几个子系列: 从入门到精通:适合新手程序员的实用教程;侧重于基础技术和特征;提供范例文件。 技术内幕:权威、必备的参考大全;包含丰富、实用的范例代码;帮助读者熟练掌握微软件技术。 高级编程:侧重于高级特性、技术和解决问题;包含丰富、适用性强的范例代码;帮助读者精通微软技术。 精通&宝典:着重剖析应用技巧,以帮助提高工作效率;主题包括办公应用和开发工具。 认证考试教材:完全根据考试要求来阐述每一个知识点;提供可供搜索的Ebook(英文版)和训练题;提供实际场景、案例分析和故障诊断实验。

2010-02-21

Visual C++ 2008入门经典(英文版)

《Visual C++2008入门经典》系编程语言先驱者Ivor Horton的经典之作,是C++编程方面最畅销的图书品种之一。不仅涵盖了Visual C++ 2008编程知识,还全面介绍了标准C++语言和C++/CLI。《Visual C++2008入门经典》延续了Ivor Horton讲解编程语言的独特方法,从中读者可以学习Visual C++ 2008的基础知识,了解如何使用MFC进行本地ISO/ANSI C++ Windows应用程序开发以及如何使用Windows Forms进行C++/CLI Windows应用程序开发,并全面掌握在MFC和Windows Forms中访问数据源的技术。《Visual C++2008入门经典》各章后面的习题将有助于读者温故而知新,并尽快成为C++高效程序员。

2010-02-11

C++编程思想(英文原版)

C++编程思想(英文原版) 绝对的经典,程序员必备

2010-02-07

数据库系统概论(第三版)

1983年第一版,一个经得起时间考验的国内教材,值得初学者学习

2010-02-06

程序员考试历年真题(1991-2005)有答案

程序员考试历年真题(1991-2005) 软考上午、下午主客观题考试

2010-02-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除