机器学习
文章平均质量分 68
chenlang_lbs
python,spark, R
展开
-
简述CART
一、什么是CARTCART是决策树的一种原创 2017-01-05 14:51:39 · 759 阅读 · 0 评论 -
K_means的改进:二分K_means算法
传统K_means算法存在的缺陷(1)算法的初始中心点选择与算法的运行效率密切相关,而随机选取中心点有可能导致迭代次数很大或者限于某个局部最优状态;通常 k (2)K均值的最大问题是要求用户必须事先给出 k 的值,k 的选择一般都基于一些经验值和多次试验结果,对于不同的数据集,k 的取值没有可借鉴性。(3)对异常偏离的数据敏感——离群点;K均值对 “ 噪声 ” 和孤立点数据都是敏感的,翻译 2017-01-06 11:04:07 · 920 阅读 · 0 评论 -
朴素贝叶斯
#!/usr/bin/env python3# -*- coding:utf-8 -*-__author__ = 'lbs'import numpy as npfrom collections import Counter'''说明: 这里只是对于X是离散型变量做的,对于连续型变量需要计算其相应的概率,对于既有连续型变量又有离散型变量需要分开计算...'''class Na原创 2018-01-05 16:30:40 · 175 阅读 · 0 评论