数据挖掘
文章平均质量分 77
daxiaofan
这个作者很懒,什么都没留下…
展开
-
预处理 (补充) ---特征选择(sklearn实现)
参考文献 机器学习(周志华)翻译 2016-11-10 17:50:21 · 4079 阅读 · 0 评论 -
数据预处理(3) ——数据归约 使用python(sklearn,pandas,numpy)实现
数据预处理的主要任务有:一、数据预处理1.数据清洗2.数据集成3.数据转换4.数据归约4.数据归约(1)数据立方体聚集:聚集操作用于数据立方体结构中的数据。(2)属性子集选择:通过删除不相关或冗余的属性(或维)减小数据集。属性子集选择的目标是找出最小属性集,使得数据类的概率分布尽可能地接近使用所有属转载 2016-11-09 17:46:45 · 5850 阅读 · 0 评论 -
数据预处理(2) ——数据变换与数据离散化 使用python(sklearn,pandas,numpy)实现
数据预处理的主要任务有:一、数据预处理1.数据清洗2.数据集成3.数据转换4.数据归约3.数据变换数据变换是指将数据转换或统一成适合于挖掘的形式。(1)数据泛化:使用概念分层,用高层概念替换低层或“原始”数据。例如,分类的属性,如街道,可以泛化为较高层的概念,如城市或国家。类似地,数值属性如年龄,可以映射到较高层概念如青年转载 2016-11-09 17:37:50 · 13045 阅读 · 1 评论 -
数据预处理(1) ——数据清洗 使用python(sklearn,pandas,numpy)实现
数据预处理的主要任务有:一、数据预处理1.数据清洗2.数据集成3.数据转换4.数据归约1.数据清洗现实世界的数据一般是不完整的、有噪声的和不一致的。数据清理例程试图填充缺失的值,光滑噪声并识别离群点,纠正数据中的不一致。(以上为使用的数据)①忽略元组:当缺少类标号时通常这样做。除非元组有多个属性缺少值,否则该方法不是很有效。impor转载 2016-11-06 18:55:30 · 19068 阅读 · 3 评论 -
sklearn,keras,tensorflow 模型本地保存与导入
sklearn,keras,tensorflow模型本地保存与导入sklearn的模型保存与导入keras的模型保存与导入 模型的网络结构与权重的保存 模型的网络结构保存 模型的权重的保存 模型的导入tensorflow的模型保存与导入 模型的保存与导入 计算图pb的保存与导入数据集训练集原创 2017-05-04 21:21:28 · 4649 阅读 · 1 评论