大数据
ch1762
https://orcid.org/0000-0002-3021-5040
展开
-
电力窃漏电用户识别
数据集链接: https://pan.baidu.com/s/167OzcIWj82O37Hku6tIpDA 提取码: sq27由于missing_data.xls数据中有部分缺失值,故需要对数据进行补全这里采用拉格朗日插值法补全代码如下#拉格朗日插值法处理数据缺失值import pandas as pdfrom scipy.interpolate import lagrange#导...原创 2019-06-28 15:33:46 · 412 阅读 · 0 评论 -
基于基站定位数据的商圈分析
数据集链接: https://pan.baidu.com/s/1lYtcc2zlk07Cv9fnto99DA 提取码: sy92去除冗余属性以及数据离差标准化#-*- coding: utf-8 -*-#数据标准化到[0,1]import pandas as pd#参数初始化filename = 'D:/下载/data/input/business_circle.xls' #原始数据...原创 2019-06-29 14:49:46 · 1091 阅读 · 2 评论 -
财政收入影响因素分析及预测模型
数据集链接: https://pan.baidu.com/s/1_-8F0DAyHyZSS2M7u-2NYQ 提取码: ex6y原始数据概括性度量#-*- coding: utf-8 -*-import numpy as npimport pandas as pdinputfile = 'D:\下载\data\inputdata1.csv' #输入的数据文件data = pd.read...原创 2019-06-29 14:35:28 · 3419 阅读 · 0 评论 -
电子商务网站用户行为分析及服务推荐
数据集链接: https://pan.baidu.com/s/1Au2SNDcYW_2brbQNB2Kvtw 提取码: vr9d通过python访问数据库并进行分块统计import pandas as pdfrom sqlalchemy import create_engineengine = create_engine('mysql+pymysql://root:123456@127....原创 2019-06-29 14:00:42 · 1743 阅读 · 0 评论 -
应用系统负载分析与磁盘容量预测
数据集链接: https://pan.baidu.com/s/1B5GjzaAgg4wbggXzzsERew 提取码: ggac数据预处理对属性进行变换#-*- coding: utf-8 -*-#属性变换import pandas as pd#参数初始化discfile = 'D:\下载\data\input\discdata.xls' #磁盘原始数据transformedda...原创 2019-06-29 13:49:52 · 512 阅读 · 0 评论 -
家用电器用户行为分析与事件识别
数据集链接: https://pan.baidu.com/s/1THBs7ZaG-qwySGhd3czq9Q 提取码: iar2将原始数据的冗余属性去除对阈值寻优#-*- coding: utf-8 -*-#阈值寻优import numpy as npimport pandas as pdinputfile = 'D:\下载\data\input\water_heater.xls'...原创 2019-06-29 13:30:44 · 1424 阅读 · 0 评论 -
基于水色图像的水质评价
数据集链接: https://pan.baidu.com/s/1iL_SSVS3acNSUZ5dJVSDwQ 提取码: wvpy#-*- coding: utf-8 -*-import pandas as pdfrom sklearn import metrics#导入输出相关的库from sklearn import svm#导入模型相关的函数from numpy.random imp...原创 2019-06-29 12:56:19 · 522 阅读 · 0 评论 -
中医证型关联规则挖掘
数据集链接: https://pan.baidu.com/s/1K_YWnrCHDjl7wXmo29xwwQ 提取码: vv78为更好反映中医证素分布的特征,采用证型系数代替单证型的证素得分证型相关系数计算公式:证型系数=该证型得分/该证型总分由于Apriori关联规则算法无法处理连续型数值变量,故需要对数据进行离散化进行离散化处理并将每个属性聚成4类#-*- coding: utf-8...原创 2019-06-29 12:19:38 · 950 阅读 · 0 评论 -
航空公司客户价值分析
数据集链接: https://pan.baidu.com/s/15O85x6pga2yQwRaoKiQo9w 提取码: 19da首先查看数据集中有无空值或异常值#-*- coding: utf-8 -*-#对数据进行基本的探索#返回缺失值个数以及最大最小值import pandas as pddatafile= 'D:/下载/data/input/air_data.csv' #航...原创 2019-06-29 11:55:32 · 521 阅读 · 0 评论 -
电商产品评论数据情感分析
数据集链接: https://pan.baidu.com/s/19EGElx2Ylb-DpQRrJ0F7og 提取码: tg7c将原始数据的‘评论’一列抽取抽取代码#-*- coding: utf-8 -*-import pandas as pdinputfile = 'D:\下载\data\input\huizong.csv' #评论汇总文件outputfile = 'D:\下载\...原创 2019-07-29 21:11:22 · 8834 阅读 · 17 评论