kaggle:泰坦尼克生存预测( R语言机器学习分类算法)

    本文在基本的多元统计分析技术理论基础上,结合机器学习基本模型,选择Kaggle(数据建模竞赛网站)的入门赛——Titanic生存预测作为实战演练,较为完整地呈现了数据建模的基本流程和思路。采用的模型有逻辑回归,决策树,SVM支持向量机以及进阶的集成学习方法——Boosting和Rando...

2018-06-14 00:05:15

阅读数:525

评论数:0

聚类分析(银行客户画像)

# CDA 11 聚类分析(客户画像) # 导入数据 customer<- read.csv("D:\\桃子的数据\\CDA\\11 聚类分析\\课件&代码-11.客户画像\\Data\\Age_Income3.csv&qu...

2018-06-05 20:37:29

阅读数:953

评论数:2

Python爬虫歌词及词频统计--(谢春花)

我从崖边跌落 落入星空辽阔 银河不清不浊 不知何以摆脱——谢春花《我从崖边跌落》作为一名春花粉,决定用python,分析下春花歌词里的高频词语,以期找到有趣的规律。1. 数据爬取歌词来源:网易云谢春花热门26首爬取完之后以txt格式存储# 第一部分:爬取数据 import requests imp...

2018-06-04 21:12:49

阅读数:500

评论数:0

python爬取歌词并生成词云图

第一部分:爬取数据# 第一部分:爬取数据 import requests import re import os import json from bs4 import BeautifulSoup #发起响应 def get_html(url): headers = {'User-Age...

2018-06-04 20:56:30

阅读数:575

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭