排序:
默认
按更新时间
按访问量

Lending Club贷款数据集下载(2016-2018)

数据集可用于信用风险、欺诈风险建模使用。 网盘地址:https://pan.baidu.com/s/1ONrS1JbgL9ZrmMEvio49PA 密码:let1

2018-08-14 16:37:13

阅读数:155

评论数:2

Win10下spark-shell报错处理

安装原文:https://blog.csdn.net/w417950004/article/details/77203501 按照上面的安装教程碰到了一些问题,在这里总结一下: 1、下面的文件要装齐,scala、Hadoop、spark、jdk要注意对应版本。上面教程里百度云失效,我打包在了这...

2018-07-29 21:27:14

阅读数:155

评论数:0

基于sklearn中文文本聚类

实习期间老大给了一个任务,给运维历史数据分类,需要先做聚类,然后把每一类总结出来。目前只是实现了文本聚类。 # -*- coding: utf-8 -*- """ Created on Wed Jul 18 15:53:56 2018 @...

2018-07-25 16:35:42

阅读数:143

评论数:0

2018华为优招笔试题

今年华为优招笔试总共三道编程题 一   、歌唱打分     青年歌手大赛评委打分,打分规则是去掉一个最高分和一个最低分,然后计算平均分。 输入描述:输入数据有多组,每组占一行,每行第一个数n表示评委人数,然后是n个评委的打分 输出描述:输出保留两位小数,每组输出一行 示例: 输入: ...

2018-07-19 10:12:39

阅读数:1361

评论数:0

2018美团codeM资格赛题一(Python)

第一题的思路很简单,分为两步:1、根据0/1判断是否为打折的商品,然后打折与不打折总和2、使用优惠券的情况下,应该考虑m种,然后比较大小最后两个方案得出最小价格。有点坑的地方是,不能使用库,不能使用库,不能使用库!题主开始用numpy一直出错,语法错误或越界访问。n,m = (int(x) for...

2018-06-01 17:12:42

阅读数:346

评论数:0

kaggle练习——手写体识别

# -*- coding: utf-8 -*- """ Created on Sun Apr 22 10:25:14 2018 @author: zhangsh """ import ...

2018-05-16 16:42:40

阅读数:66

评论数:0

机器学习实战笔记三——Logistic回归

# -*- coding: utf-8 -*- """ Created on Wed Apr 18 09:41:09 2018 @author: zhangsh """ ''' Logi...

2018-04-18 22:52:56

阅读数:14

评论数:0

机器学习实战笔记二——决策树

''' 决策树实例,决策树优点: 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 缺点:可能会产生过度匹配问题 适用数据类型:数值型和标称型 ''' ''' 决策树一般流程: 1、收集数据 2、准备数据 3、分析数据 4、训练数据 5、测试数据 6、使用算法...

2018-04-06 20:21:02

阅读数:19

评论数:0

机器学习实战笔记一—— K-近邻算法

''' KNN 算法流程: 1、计算已知类别数据集中的点与当前点之间的距离 2、按照距离从小到大顺序排序 3、选取与当前点距离最小的k个点 4、统计前k个点所在类别的出现次数 5、出现次数最高的类别作为当前点的类别 ''' from numpy import * from os import l...

2018-03-17 17:22:07

阅读数:114

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭