python数据分析
文章平均质量分 82
6丁一的猫
为时未晚
展开
-
客户流失预警(Predicting customer churn with scikit-learn)
数据集可从这里下载:https://raw.githubusercontent.com/EricChiang/churn/master/data/churn.csv这里的数据已经结构化了,所以处理起来比较方便。 后序文章会研究非结构化数据处理。使用pandas方便直接读取.csv里数据import pandas as pdimport numpy as npchurn_df = pd.read_翻译 2016-11-03 14:39:13 · 3576 阅读 · 2 评论 -
用 sklearn 库决策树分类器进行收入水平分类(一)
分类和预测是两种常用数据分析方式,可以用于提取数据类模型、预测未来的数据趋势,被广泛用于信用评价、医疗诊断、性能预测和购物选择分析等。本篇文章采用决策树分类模型,利用 sklearn 库提供的决策树分类器对收入数据集进行收入水平分类、预测。看了本篇博客可以了解:Dataframe 结构数据描述性统计分析方法sklearn 库决策树分类器构建方法了解分类器性能评价指标及模型调整本文数据集可以从原创 2016-11-03 16:59:31 · 4798 阅读 · 8 评论 -
numpy-100例子
学完这篇numpy就入门了。 这个计算库很多地方都用到,从sklearn机器学习库,nlp,到deep learning。GitHub - rougier/numpy-100: 100 numpy exercises (100% complete) 去做题吧,100个numpy练习题,包你2小时熟悉numpy操作原创 2016-11-07 10:08:13 · 800 阅读 · 0 评论 -
python异常值检测与相关系数
异常值检测与概念此博客讲得不错:http://blog.csdn.net/zpdreamer/article/details/54095828下面对不同年月的销售量进行异常值检测。部分数据如下: 代码如下:#-*- coding: utf-8 -*-import pandas as pdcatering_sale = 'catering_sale.xls' #餐饮数据data = pd.rea原创 2017-03-17 14:55:46 · 5154 阅读 · 0 评论 -
keras使用神经网络预测销量
keras非常方便。 不解释,直接上实例。 数据格式如下:序号 天气 是否周末 是否有促销 销量1 坏 是 是 高2 坏 是 是 高3 坏 是 是 高4 坏 否 是 高5 坏 是 是 高6 坏 否 是 高7 坏 是 否 高8 好 是 是 高原创 2017-03-21 16:04:49 · 6066 阅读 · 0 评论 -
可视化基础
plt.plot(first_twelve['DATE'],first_twelve['VALUE'])plt.xticks(rotation = 90)plt.xlabel('Month')plt.ylabel('Unemployment Rate')plt.title('Monthly Unemployment Trends, 1948')plt.show()plt.plot(wom...原创 2018-03-22 14:26:13 · 225 阅读 · 0 评论 -
pandas基本操作
import pandasfood_info = pandas.read_csv("food_info.csv")print(type(food_info))print(food_info.columns)print(food_info.head(2))col_names = food_info.columns.tolist()gram_columns = []for c in co...原创 2018-03-21 09:21:28 · 212 阅读 · 0 评论 -
数据分析基础(一)
# coding: utf-8# In[1]:import pandas as pd# In[4]:data = pd.read_csv('pokemon.csv')# In[6]:data.head()# In[12]:import numpy as np # linear algebraimport pandas as pd # data pro...原创 2018-05-09 17:15:20 · 473 阅读 · 0 评论 -
nlp基础
from sklearn.feature_extraction.text import CountVectorizerIn [2]:vect = CountVectorizer()vectOut[2]:CountVectorizer(analyzer='word', binary=False, decode_error='strict', dtype=<class ...原创 2018-05-10 08:41:52 · 366 阅读 · 0 评论