第六章 数据挖掘建模过程

数据预处理

数据读写

  • JSON 数据结构
    import json导入json包。json.loads(josn格式的对象) 返回一个字典 ,json.load(文件名)读取文件.json.dumps(josn格式的对象)写成字符串,json.dump(josn格式的对象,文件名)写入文件
  • pickle 序列化
    a = pickle .dumps(josn格式的对象)写成字符串,pickle .loads(a) 读取

  • h5
    f=h5py.File(“info.h5”)创建文件。f.create_dataset(“data”,shape=(10,20))创建内容

  • 正则表达式
    \d=[0~9],+表示更多
    collections

  • collections.Counter()统计数组例每个元素出现的次数
  • collections.defaultdict()
    数据预处理
  • sklearn
  • 零均值:preprocessing.scale(data)
    数据挖掘

  • 分类和回归:支持向量机,朴素贝叶斯,k近邻,决策树,神经网络,线性回归,多项式回归

  • 聚类:k均值聚类 层级聚类
  • 评价指标:损失函数 AUC指标 F1分数
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值