数据挖掘
zhangyingchengqi
学无止境。
展开
-
数据挖掘-商品购买记录-商品推荐_亲和度分析
# coding: utf-8 import numpy as npdataset_filename="affinity_dataset.txt"#加载数据文件dataset=np.loadtxt(dataset_filename)'''数据结果:array([[ 0., 0., 1., 1., 1.], [ 1., 1., 0., 1., 0.]原创 2017-02-05 17:13:12 · 2972 阅读 · 1 评论 -
pyecharts地图显示不全
自从 0.3.2 开始,为了缩减项目本身的体积以及维持 pyecharts 项目的轻量化运行,pyecharts 将不再自带地图 js 文件。python中pip命令行安装: pip install echarts-countries-pypkgpip install echarts-china-provinces-pypkgpip install echarts-c...原创 2018-11-30 11:40:54 · 1108 阅读 · 0 评论 -
数据挖掘-diabetes数据集分析-糖尿病病情预测_线性回归_最小平方回归
# coding: utf-8 # 利用 diabetes数据集来学习线性回归# diabetes 是一个关于糖尿病的数据集, 该数据集包括442个病人的生理数据及一年以后的病情发展情况。 # 数据集中的特征值总共10项, 如下: # 年龄 # 性别 #体质指数 #血压 #s1,s2,s3,s4,s4,s6 (六种血清的化验数据) #但请注原创 2017-02-01 16:35:36 · 20579 阅读 · 2 评论 -
数据挖掘-Iris数据集分析-决策边界_根据花瓣数据绘制(七)
# coding: utf-8 # 使用花瓣测量数据绘制 2D散点图,并绘出决策边界import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn import datasetsfrom sklearn.neighbors import原创 2017-02-01 14:06:17 · 3076 阅读 · 0 评论 -
数据挖掘-Iris数据集分析-决策边界(六)
# coding: utf-8 # 使用萼片测量数据绘制 2D散点图,并绘出决策边界import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn import datasetsfrom sklearn.neighbors import原创 2017-02-01 13:58:30 · 2717 阅读 · 0 评论 -
数据挖掘-K-近邻分类器-Iris数据集分析-使用K-近邻分类器进行分类预测(四)
K-近邻分类器完成分类原创 2017-01-30 19:06:55 · 2767 阅读 · 0 评论 -
数据挖掘-oneR算法-Iris数据集分析-使用oneR算法进行分类预测(五)
接上一篇,使用 oneR算法来实现iris分类. # coding: utf-8 #使用oneR算法来实现iris分类#参考: http://www.cnblogs.com/htynkn/archive/2012/04/14/2446905.html#算法思路: 根据已有数据中,具有相同特征值的个体最可能属于哪个类别进行分类.#oneR是one rule(一条规则)的简写, 表示原创 2017-01-30 22:26:59 · 2561 阅读 · 0 评论 -
数据挖掘-K-近邻分类器-Iris数据集分析-PCA降维处理后显示分类情况(三)
# coding: utf-8#使用PCA(principal component analysis主成分分析法)减少系统的维数( 因为以上四个测量数据减少到三个后,就可以使用3D散点图更好的描述)#PCA可以保留足以描述各数据点特征的信息,其中新生成的各维叫主成分.#scikit-learn库中的fit_transform()函数就是用来降维处理的. #PCA对象简介 : http:原创 2017-01-30 17:42:56 · 2630 阅读 · 0 评论 -
数据挖掘-K-近邻分类器-Iris数据集分析-根据花瓣长宽分类-以散点图显示(二)
# %load python_8_2.py 此命令以加载本脚本到到ipython中 # coding: utf-8from sklearn import datasetsiris=datasets.load_iris()#数据集描述信息iris.DESCR#iris数据集的数据iris.data#以上总共150组数据,对应以下150个结果iris.target#0原创 2017-01-29 22:37:55 · 2395 阅读 · 0 评论 -
数据挖掘-K-近邻分类器-Iris数据集分析-根据花萼长宽分类-以散点图显示(一)
# %load python_8_1.py 此命令以加载本脚本到到ipython中 # coding: utf-8from sklearn import datasetsiris=datasets.load_iris()#数据集描述信息iris.DESCR#iris数据集的数据iris.data#以上总共150组数据,对应以下150个结果iris.target#0原创 2017-01-29 22:29:54 · 2232 阅读 · 0 评论 -
数据挖掘-MovieLens数据集_电影推荐_亲和性分析_Aprioro算法
#!/usr/bin/env python2# -*- coding: utf-8 -*-"""Created on Tue Feb 7 14:38:33 2017电影推荐分析: 使用 亲和性分析方法 基于 Apriori算法 推荐电影@author: yingzhang"""#读取数据集: http://grouplens.org/datasets/movielen原创 2017-02-08 10:48:43 · 11090 阅读 · 3 评论 -
数据挖掘-ionosphere数据集-k近邻算法-分类预测
#!/usr/bin/env python2# -*- coding: utf-8 -*-#检测系统用户路径import oshome_folder=os.path.expanduser("~")print("user's path {0}".format(home_folder))#拼接数据集位置data_folder=os.path.join(home_folder,"Dat原创 2017-02-05 22:02:06 · 3481 阅读 · 0 评论 -
省市的json格式数据
{"provinces": [ { "citys": [ { "citysName": "石家庄市" }, { "citysName": "邯郸市"原创 2018-11-30 11:52:14 · 1308 阅读 · 0 评论