2015年01月_linkin1005

01月

原创斯坦福大学机器学习——特征选择（Feature selection）

特征选择是一种及其重要的数据预处理方法。假设你需要处理一个监督学习问题，样本的特征数非常大，但是可能仅仅有少部分特征会和对结果产生影响。甚至是简单的线性分类，如果样本特征数超过了n，但假设函数的VC维确仍然是O(n)，那么，除非大大扩展训练集的数量，否则即会带来过拟合的问题。在这样的情况下，可以使用特征选择算法降低特征的数量。

2015-01-22 14:06:02 22904

原创斯坦福大学机器学习——交叉验证（Cross Validation）

交叉验证是一种模型选择方法，其将样本的一部分用于训练，另一部分用于验证。因此不仅考虑了训练误差，同时也考虑了泛化误差。从这里可以看出机器学习、数据挖掘与传统统计学的一个重要差别：传统统计学更注重理论，追求理论的完整性和模型的精确性，在对样本建立某个特定模型后，用理论去对模型进行各种验证；而机器学习/数据挖掘则注重经验，如交叉验证，就是通过不同模型在同一样本上的误差表现好坏，来选择适合这一样本的模型，而不去纠结理论上是否严谨。

2015-01-19 09:27:07 64681 1

原创斯坦福大学机器学习——误差理论（Error Theory）

一、偏倚（bias）和方差(variance)在讨论线性回归时，我们用一次线性函数对训练样本进行拟合（如图1所示）；然而，我们可以通过二次多项式函数对训练样本进行拟合（如图2所示），函数对样本的拟合程序看上去更“好”；当我们利用五次多项式函数对样本进行拟合（如图3所示），函数通过了所有样本，成为了一次“完美”的拟合。图3建立的模型，在训练集中通过x可以很好的预测y，然而

2015-01-09 22:07:04 33953 5

From Data Mining to Knowledge Discovery in Databases

经典的数据挖掘的综述性文章，介绍了数据挖掘常用的方法和步骤。

2015-05-03

通信的数学原理

《通信的数学原理》香农开创信息论的原文

2013-06-26

人工智能基础人工智能基础

人工智能基础人工智能基础人工智能基础人工智能基础

2010-08-15

人工智能 (尼尔逊)-------人工智能入门著作

人工智能入门著作人工智能入门著作人工智能入门著作人工智能入门著作

2010-08-15

WINDOWS核心编程(中文版)

《Windows核心编程》是为打算理解Windows的C和C++程序员精心设计的，作为Windows开发人员的必备参考。第5版全面覆盖 Windows XP，WindowsVista和WindowsServer2008中的170个新增函数和Windows特性。书中还讲解了Windows系统如何使用这些特性，我们开发的应用程序又如何充分使用这些特性，如何自行创建新的特性。《Windows核心编程》重要主题：如何为32位和64位Windows系统构建和实现应用程序；如何新建和处理进程与作业；如何调度．管理、同步和销毁线程；如何通过I/O完成端口执行同步和异步设备I/O操作；如何使用虚拟内存、内存映射文件和堆之类的各种技术来分配内存；如何处理默认调拨的线程栈物理存储；如何为延迟加载、API拦截和进程注入构建DLL；如何使用结构化异常处理、Windows错误恢复和应用程序重启等机制。《微软技术丛书》包括以下几个子系列：从入门到精通：适合新手程序员的实用教程；侧重于基础技术和特征；提供范例文件。技术内幕：权威、必备的参考大全；包含丰富、实用的范例代码；帮助读者熟练掌握微软件技术。高级编程：侧重于高级特性、技术和解决问题；包含丰富、适用性强的范例代码；帮助读者精通微软技术。精通＆宝典：着重剖析应用技巧，以帮助提高工作效率；主题包括办公应用和开发工具。认证考试教材：完全根据考试要求来阐述每一个知识点；提供可供搜索的Ebook（英文版）和训练题；提供实际场景、案例分析和故障诊断实验。

2010-02-21

Visual C++ 2008入门经典(英文版)

《Visual C++2008入门经典》系编程语言先驱者Ivor Horton的经典之作，是C++编程方面最畅销的图书品种之一。不仅涵盖了Visual C++ 2008编程知识，还全面介绍了标准C++语言和C++/CLI。《Visual C++2008入门经典》延续了Ivor Horton讲解编程语言的独特方法，从中读者可以学习Visual C++ 2008的基础知识，了解如何使用MFC进行本地ISO/ANSI C++ Windows应用程序开发以及如何使用Windows Forms进行C++/CLI Windows应用程序开发，并全面掌握在MFC和Windows Forms中访问数据源的技术。《Visual C++2008入门经典》各章后面的习题将有助于读者温故而知新，并尽快成为C++高效程序员。

2010-02-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

linkin1005的专栏

原创斯坦福大学机器学习——特征选择（Feature selection）

原创斯坦福大学机器学习——交叉验证（Cross Validation）

原创斯坦福大学机器学习——误差理论（Error Theory）

From Data Mining to Knowledge Discovery in Databases

通信的数学原理

人工智能基础人工智能基础

人工智能 (尼尔逊)-------人工智能入门著作

WINDOWS核心编程(中文版)

Visual C++ 2008入门经典(英文版)

C++编程思想（英文原版）

数据库系统概论（第三版）

程序员考试历年真题（1991-2005）有答案

空空如也

原创 斯坦福大学机器学习——特征选择（Feature selection）

原创 斯坦福大学机器学习——交叉验证（Cross Validation）

原创 斯坦福大学机器学习——误差理论（Error Theory）

From Data Mining to Knowledge Discovery in Databases

通信的数学原理

人工智能基础 人工智能基础

人工智能 (尼尔逊)-------人工智能入门著作

WINDOWS核心编程(中文版)

Visual C++ 2008入门经典(英文版)

C++编程思想（英文原版）

数据库系统概论（第三版）

程序员考试历年真题（1991-2005）有答案

空空如也

原创斯坦福大学机器学习——特征选择（Feature selection）

原创斯坦福大学机器学习——交叉验证（Cross Validation）

原创斯坦福大学机器学习——误差理论（Error Theory）

人工智能基础人工智能基础