- 博客(2)
- 收藏
- 关注
原创 数据挖掘常用术语(转)
“算法”指的是用于实现某一数据挖掘技术-如分类树、辨识分析等等的特定程序。“属性”也被称为“特性”、“变量”、或者从数据库的观点,是一个“域” 。“个体”是关于一个单元的测量值的集合――例如一个人的身高、体重、年龄等等;它也被称作“记录”、 或 者“行”(每一行通常代表一个记录,每一列代表一个变量)。“置信度”在形如“如果买了A和B,就要买C”的关联法则里有特定的含义。置信...
2011-07-25 13:49:03
692
原创 数据挖掘九律(转)
第一,目标律。数据挖掘是一个业务过程,必须得有业务目标。无目的,无过程。第二,知识律。业务知识贯穿在挖掘这个业务过程的各环节。第三,准备律。数据获取、数据准备等数据处理耗时占整个挖掘过程的一半。第四,NFL律。NFL,没有免费的午餐。没有一个固定的算法适用所有的业务问题,特定应用适合的模型只能通过经验发现。第五,大卫律。要相信,数中必有业务规律。大卫?沃尔金斯最早提出的,故此名。...
2011-07-25 13:45:37
124
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人