大数据竞赛
ykycode
安徽大学计算机学硕。
两次获得大学生数学竞赛省一等奖,且排名前列。
蓝桥杯C++组省一、国三。
毕业曾被国家电网录用,热爱代码的心让我选择了一家上市公司的C++开发岗。
后来又转行Java开发。
展开
-
大数据入门——使用决策树模型预测泰坦尼克号乘客的生还情况
【代码】大数据入门——使用决策树模型预测泰坦尼克号乘客的生还情况。原创 2017-10-12 11:05:33 · 3583 阅读 · 2 评论 -
大数据竞赛入门——线性分类模型模板
# 预处理# 导入pandas与numpy工具包。import pandas as pdimport numpy as np# 创建特征列表。column_names = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape', 'Marginal原创 2017-10-08 18:24:40 · 607 阅读 · 0 评论 -
大数据入门——手写体数据识别(支持向量机)
#手写体数据读取from sklearn.datasets import load_digitsdigits=load_digits()print(digits.data.shape)#手写体数据分割from sklearn.cross_validation import train_test_splitX_train, X_test, y_train, y_test=trai原创 2017-10-09 09:50:47 · 1144 阅读 · 2 评论 -
大数据入门——新闻文本数据类别预测(朴素贝叶斯分类器)
#读取数据细节from sklearn.datasets import fetch_20newsgroupsnews=fetch_20newsgroups(subset='all')print(len(news.data))print(news.data[0])#数据分割from sklearn.cross_validation import train_test_split原创 2017-10-10 14:20:09 · 1046 阅读 · 2 评论 -
大数据入门——Iris数据集类别预测(K近邻分类器:KNN)
#读取数据集细节资料from sklearn.datasets import load_irisiris=load_iris()print(iris.data.shape)print(iris.DESCR)#对数据集进行随机分割from sklearn.cross_validation import train_test_splitX_train, X_test, y_tra原创 2017-10-11 12:48:15 · 2955 阅读 · 2 评论