数据挖掘综述
yunfeizhong
这个作者很懒,什么都没留下…
展开
-
商用数据挖掘的两个关键环节
我一直认为数据挖掘是分为两类的,一类是学术用的数据挖掘,一类是商用的数据挖掘。 学术的数据挖掘注重算法,往往是对算法效率或者效果的不断改进,然后从理论上证明算法有多优秀,如果理论证明很难,则退而求其次,使用一些经典的数据集去验证算法确实有效。 商用的数据挖掘注重结果和业务解释,他不会管你使用的是神经网络还是决策树,不管黑猫白猫,能搞准确并帮助业务提升的就是好猫。在商用数据挖掘中,有原创 2008-08-25 22:27:00 · 844 阅读 · 0 评论 -
论数据挖掘模型的有用性
“没有哪个模型是对的,但是有些模型是可用的”。 这句话可以说是对数据挖掘模型最精辟的概括。 任何模型都是对现实世界的理论抽象,这种抽样会忽略很多影响因素,正如牛顿发现亚里士多德的理论错误,爱因斯坦发现牛顿理论体系的缺陷,而霍金又发现爱因斯坦理论的局限性一样,看似每个模型都是不对的。但是这些模型都帮助我们有效的理解了这个世界。 所以在建立和使用数据挖掘模型时,一定注意:1原创 2008-09-04 22:03:00 · 706 阅读 · 1 评论 -
模型调整若干手段的框架性思路
辛辛苦苦建立起来的数据挖掘模型,往往有效性不能令我们满意,这时就涉及到模型调整的问题。那么调整模型有哪些思路呢?这些思路对模型结果又有多大影响呢?以下是我的一些经验,仅供参考。影响程度数值只是为了大家理解方便和比较,给出了数量级,不具有任何精确性的含义。 1、对商业问题的重新考察与界定,需要我们重新考虑我们定义的商业问题是否合理,目标变量定义是否科学,模型运用思路和模型的选择是否还有调整的原创 2008-09-04 22:36:00 · 796 阅读 · 1 评论