- 博客(5)
- 收藏
- 关注
原创 MySQL基本操作三:数据的插入、更新、删除
介绍MySQL中数据的插入,更新,删除操作前,我先建一个表。方便后面举例子。这是一个学生信息表:CREATE TABLE tab_student( Name CHAR(20), StuID VARCHAR(20), Rank INT);建好以后,长成这样: 1. 插入数据1.1 插入完整数据记录语法形式如下:INSERT INTO t...
2018-08-17 22:14:03 34362 3
原创 CART-分类和回归树
之前在博文 决策树归纳 中,我介绍了用决策树进行分类的算法,包括ID3和C4.5。然而决策树不仅可以用来做数据分类,也可用于做数据回归。1984年Breiman,Friedman,Olshen等人出版了著作《Classification and Regression Trees》(简称CART)介绍了二叉决策树的产生。他们给出了用二叉决策进行树数据分类和回归的方法。在阅读本文之前,我假设读者已...
2018-08-15 20:28:19 3424 3
原创 概率检索模型
概率检索模型是当前信息检索领域效果最好的模型之一,它基于对已有反馈结果的分析,根据贝叶斯原理为当前查询排序。我在之前的博客 SVM解释:二、SVM的数学基础 中介绍了如何用朴素贝叶斯算法对数据进行分类,其实概率检索模型的基本原理与朴素贝叶斯分类是一样的。先回忆一下朴素贝叶斯算法的原理:对于测试元组XXX,最终目的是要计算对于不同的类CiCiC_i,计算后验概率p(Ci|X)p(Ci|X)p(C...
2018-08-13 21:30:26 8598 1
原创 海量数据处理技巧
数据时代来临,数据量的爆炸式增长是最为显著的特征。当高性能硬件的普及还跟不上这样的数据大潮时,如何在有限的时空资源内处理海量数据成为了计算机科学以及数理统计等领域最大的挑战。所谓“数据处理”,在本文中特指通过计算机技术,对海量数据进行存储、统计、查询等操作。我将在下面介绍一些基本的海量数据处理的方法,供大家参考。需要明确的一点是,现实情况复杂多变,所以对于海量数据处理这样大的主题,是不可能用一...
2018-08-02 20:07:18 16298
原创 逻辑回归(logistic regression)原理详解
机器学习解决的问题,大体上就是两种:数值预测和分类。前者一般采用的是回归模型,比如最常用的线性回归;后者的方法则五花八门,决策树,kNN,支持向量机,朴素贝叶斯等等模型都是用来解决分类问题的。其实,两种问题从本质上讲是一样的:都是通过对已有数据的学习,构建模型,然后对未知的数据进行预测,若是连续的数值预测就是回归问题,若是离散的类标号预测,就是分类问题。这里面有一类比较特殊的算法,就是逻辑回归...
2018-08-01 12:34:18 101159 5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人