排序:
默认
按更新时间
按访问量

基于numpy的多项式拟合预测人口数值

代码如下:#-*- encoding:utf-8 -*- import sys reload(sys) sys.setdefaultencoding from sklearn import linear_model import numpy as np import pandas as pd ...

2018-04-25 14:40:10

阅读数:133

评论数:0

基于FPGrowth挖掘算法的乳腺癌中医症型关联规则挖掘

挖掘的总体思路: 首先癌症有不同的发展期 不同发展期的癌症有不同的症型 这些症型都处于不同的严重程度。 因此收集病人样本930条,最终挖掘目标是: 找出这些严重程度不同的症型和癌症发展阶段(我们知道癌症有初期,中期,晚期等)之间的关系(也就是找到症状与疾病之间的关联规...

2018-01-14 23:03:58

阅读数:262

评论数:0

电商产品评论数据情感分析代码详解

本章代码建议在linux下面运行 下面代码的意思是从评论数据中抽取品牌是美的的数据(15-1) #-*- coding: utf-8 -*- import pandas as pd inputfile = '../data/huizong.csv' #评论汇总文件 outputfile...

2017-06-16 17:49:32

阅读数:3803

评论数:0

基于基站定位数据的商圈分析代码详细解释

这一章的代码注意,作者只在windows下面运行过,没有在linux下面运行过 第一个代码是为了看下数据的稳定程度,代码中主要关注点是那个离差标准化 #-*- coding: utf-8 -*- #数据标准化到[0,1] import pandas as pd #参数初始化 filename...

2017-06-13 17:32:10

阅读数:1835

评论数:0

家用电器用户行为分析与事件识别代码详解+修改后运行无误的代码

运行环境: ubuntu16.04 64位 pycharm python3.5.2 相关软件列表: cycler (0.10.0) graphviz (0.7.1) h5py (2.7.0) Keras (2.0.4) matplotlib (2.0.2) numpy (1.12.1) panda...

2017-05-22 11:20:22

阅读数:1087

评论数:0

基于水色图像的水质评价

需要安装mkl版本的numpy ,不然会报错 from . import _iterative  ImportError: DLL load failed:  #-*- coding: utf-8 -*- import pandas as pd inputfile = '../data/m...

2017-05-20 21:15:01

阅读数:839

评论数:0

电影推荐系统代码详细解释

# -*- coding: utf8 -*- ''' Created on 2015-06-22 @author: Lockvictor ''' import sys, random, math import os from operator import itemgetter random.se...

2017-05-18 13:17:26

阅读数:3881

评论数:4

ValueError: No engine for filetype: 'csv'解决与书本7-2代码改写

经过人指点,解决了一个问题 使用数据集air_data.csv 为了程序运行需要,仅给出一部分数据集 MEMBER_NO FFP_DATE FIRST_FLIGHT_DATE GENDER FFP_TIE...

2017-05-10 00:17:14

阅读数:1708

评论数:0

mammary cancer关联规则挖掘详解

代码来自书上,进行了一定修改,确保运行没有error 挖掘的总体思路: 首先癌症有不同的发展期 不同发展期的癌症有不同的症型 这些症状都处于不同的严重程度。 因此收集病人样本930条。 数据挖掘流程: 一(对应代码1)、 每人的6种症型(症状名字的代号是A~F,分别对应下面data.xls中的各种...

2017-05-08 21:18:36

阅读数:932

评论数:0

5-5 用TSNE进行数据降维并展示聚类结果

Python3.5下 Pycharm中使用Ipython运行 #-*- coding: utf-8 -*- #使用K-Means算法聚类消费行为特征数据 import pandas as pd #参数初始化 if __name__ == '__main__': inputfile = '...

2017-05-04 22:27:06

阅读数:4337

评论数:7

5-1 逻辑回归代码(含warning解释)

#-*- coding: utf-8 -*- #逻辑回归 自动建模 import pandas as pd #参数初始化 filename = '../data/bankloan.xls' data = pd.read_excel(filename) x = data.iloc...

2017-05-03 23:01:11

阅读数:1396

评论数:8

4-3 数据离散化(无error版本)

#-*- coding: utf-8 -*- #数据规范化 import pandas as pd if __name__=="__main__": datafile = '../data/discretization_data.xls' #参数初始化 data = p...

2017-05-03 22:29:32

阅读数:601

评论数:2

5-8 离散点检测(改进版无error)

#-*- coding: utf-8 -*- #使用K-Means算法聚类消费行为特征数据 import numpy as np import pandas as pd if __name__=='__main__': #参数初始化 inputfile = '../data/consump...

2017-05-03 21:44:47

阅读数:604

评论数:1

5-3 神经网络算法预测销量高低(改进版,消除了一些warning)

#-*- coding: utf-8 -*- import pandas as pd import os os.environ['TF_CPP_MIN_LOG_LEVEL']='2' inputfile = '../data/sales_data.xls' data = pd.read_e...

2017-05-01 17:38:53

阅读数:1091

评论数:1

5-2 决策树算法预测销量高低代码

#-*- coding: utf-8 -*- import pandas as pd inputfile = '../data/sales_data.xls' data = pd.read_excel(inputfile, index_col = u'序号') data[data == u'好...

2017-04-30 14:48:59

阅读数:984

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭