关闭

Spring Aspect简单实例

首先是在maven的pom中配置需要安装的jar,在原有的spring配置中添加 org.aspectj aspectjweaver 1.8.9 添加需要被代理的...
阅读(191) 评论(0)

logistic regression

logistic regression就是逻辑回归。感觉上就是把数据进行分类,然后对输入样本进行预测。 为了区分许多邮件中存在的垃圾邮件, 我们假设: y = 1 不是垃圾邮件 y = 0 是垃圾邮件 要是y只能去0或1,提出了sigmoid函数 定义: g(z) >= 0.5, y=1 g(z) < 0.5, y=...
阅读(102) 评论(0)

决策树(decision tree)

决策树就是像树结构一样的分类下去,最后来预测输入样本的属于那类标签。 本文是本人的学习笔记,所以有些地方也不是很清楚。 大概流程就是 1. 查看子类是否属于同一个类 2. 如果是,返回类标签,如果不是,找到最佳的分类子集的特征 3. 划分数据集 4. 创建分支节点 5. 对每一个节点重复上述步骤 6. 返回树首先我们要像一个办法,怎么来...
阅读(49) 评论(0)

K-近邻算法

K-近邻算法原理:在一组样本数据中,每一个数据都有标签,然后输入没有标签的数据,通过输入数据的各个特征和样本数据进行比较,用算法分析出最合适输入数据的标签。 一般选择样本中k个相似的数据,最后选择k个中出现次数最多的标签,作为新输入数据的标签。 一般做法: step.1—计算未知样本和每个训练样本的距离dist step.2—得到dist,对dist进行排序 step.3—选取与当前点距离...
阅读(38) 评论(0)

数据预处理

在数据预处理的问题上 1.数据清理 (1)缺失的值 插值法包括拉格朗日插值 牛顿插值 Hermite插值 分段插值 样条插值 也可以插均值,中位数等,还可以插入固定值,缺失值边上的值等 回归法,就是把所有数据拟合成一条线。 (2)错误的值 删除,当作缺失值来看 去噪   1.分箱,分箱方法通过考察数据的“近邻”(即周围的值)来光滑有序数据的值,有序值分布到一些“桶”或箱中。由于分...
阅读(91) 评论(0)
    个人资料
    • 访问:463次
    • 积分:52
    • 等级:
    • 排名:千里之外
    • 原创:4篇
    • 转载:0篇
    • 译文:0篇
    • 评论:0条
    文章分类
    文章存档