自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 数据挖掘方法比较

一、可解释性和应用广泛性1、决策树:简单直观,逻辑性强,易于理解和应用,广泛使用。2、神经网络:可解释性差,远没有决策树和回归应用广泛。3、Logistic回归:更为成熟、应用更为广泛,具有强大的活力和最广泛的业务应用基础。二、缺失值和异常值敏感情况1、决策树:对缺失值几乎不做处理即可应用,不易受到异常值影响。2、神经网络:对缺失值敏感,需要对缺失值处理(赋值、替换或删除)

2016-05-31 17:35:35 1035

原创 数据挖掘中的集成方法——通过集成预测来提升精度(读书笔记)

第1章    集成发现将诸模型集成往往比单一模型得到的效果更显著。集成方式包括:平均法、投票法和顾问感知器。在从回声定位信号中提取蝙蝠分类的试验中,每种蝙蝠有3-8种信号。模型建立和交叉验证的结果显示:基准精度(选择相对多的数量):27%。决策树的精度:46%多项式网络的精度:64%剪枝后的神经网络的精度:69%八维变量的最近邻的精度:69%以上各种方法在不同的数据

2016-05-25 19:39:17 1571

原创 Python中文编码问题

想必使用Python的朋友都遇到过字符串乱码的问题,记一下吧。字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。

2016-05-19 23:03:34 261

原创 排序算法总结

先说结论:随机情况时:快速排序=堆排序=归并排序>希尔排序>插入排序>选择排序>冒泡排序部分有序时:希尔排序=插入排序>快速排序>堆排序=归并排序>选择排序=冒泡排序全部逆序时:快速排序=堆排序=归并排序>希尔排序>选择排序>插入排序>冒泡排序1、选择排序每次从未排序元素中寻找最(小)大元素进行交换,放在已排好序列的最后。(实际上将从未排序中找到的最大(小)值与

2016-05-19 21:37:03 295

原创 大数据初探

一、什么是大数据5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。应用:发现隐藏事物、商品相似性推荐、数据可视化、精准营销、指导决策、图像识别、股票预测、音乐推荐、辅助医疗、票房预测、商品营销、兴趣发现、异常检测、智能消费、木马检测、最优化决策、数据分析、重复性检测、电子商务、家庭生活、游戏娱乐、

2016-05-18 19:00:19 1420

原创 http状态码小结

HTTP状态码(HTTP Status Code)是用以表示网页服务器HTTP响应状态的3位数字代码。1字头:消息,服务器收到请求,需要请求者继续执行操作        2字头:成功,操作被成功接收并处理    3字头:重定向,需要进一步的操作以完成请求        4字头:客户端错误,请求包含语法错误或无法完成请求       5、6字头:服务器错误,服务器在处理请求的

2016-05-16 13:27:00 335

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除