数据分析与数据挖掘
文章平均质量分 71
jelek
这个作者很懒,什么都没留下…
展开
-
SPSS Modeler 建模示例---细胞样本分类(SVM)学习
一.背景&目标:一位医学研究人员获得了一个包含大量人体细胞样本特征的数据集,这些样本是从极有可能患上癌症的患者身上提取的。通过对原始数据进行分析,发现良性样本与恶性样本之间的许多特征显著不同。该研究人员希望开发一个 SVM 模型,使该模型可以使用其他患者样本中的这些细胞特征值尽早发现他们的样本是良性还是恶性。二.实例数据位置:[安装目录]\IBM\SPSS\Modeler\14\Dem原创 2013-03-04 17:58:54 · 11068 阅读 · 4 评论 -
NULL:缺失数据本身也可能是有价值的
在统计学中,数据值存在丢失通常可以被划分为两种情况:值随机缺失和值非随机缺失。在本文中,我们重点考虑第二种情况。有时候可以用一个新的变量来标识某一变量值存在丢失,该新的变量同样具有预测或分析的价值。若丢失不是随机的,通常会有一种潜在的解释,而这种解释很大程度上依赖于你需要分析预测的类型。不过如果能够了解到为何存在丢失,就能够在分析潜在母体(population)特征时,避免理解上的偏见。翻译 2014-01-15 19:04:53 · 766 阅读 · 0 评论 -
Python 数据分析(一)[MAC]
数据:bit.ly 的 1.usa.gov数据读取:### read dataimport jsonpath = 'pydata-book-master/ch02/usagov_bitly_data2012-03-16-1331923249.txt'records = [json.loads(line) for line in open(path)]任务:原创 2015-04-02 16:04:46 · 3193 阅读 · 2 评论