![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析与挖掘
文章平均质量分 95
逆夏11111
这个作者很懒,什么都没留下…
展开
-
HMM所解决的三个方面问题
1.介绍隐马尔可夫比马尔可夫多一个隐状态,隐状态可以已知也可以未知,未知隐状态可以通过观测序列获得最可能的隐状态。隐马尔可夫的两个假设:1.对于状态来说(隐状态)当前状态只与前一时刻状态有关2.当前时刻的观测值只与当前状态(隐状态)有关隐马尔可夫可以解决的三个方面的问题:1.求概率问题,已知模型参数(A,B, π)和观测序列O,可以计算当前模型下的观测序列概率。即在已知模型的基础下,出现这样的观测序列可能性有多大。2.训练学习问题,学习HMM模型,已知观测序列O,计算使该观测序列出现最大可原创 2021-05-12 17:00:38 · 1539 阅读 · 0 评论 -
《数据分析与挖掘 第十五章 电商产品评论数据感情分析》
电商产品评论数据感情分析抽取数据我们这里先抽取出美的品牌的评论信息:import pandas as pdinputfile = 'huizong.csv' #评论汇总文件outputfile = 'meidi_jd.txt' #评论提取后保存路径data = pd.read_csv(inputfile,encoding = 'gb18030')#python3上面导入中文经常会出错...原创 2019-03-28 20:29:58 · 2636 阅读 · 3 评论 -
《数据分析与挖掘 第十四章 基于基站定位数据的商圈分析》
基于基站定位数据的商圈分析数据抽取以2014-1-1开始到2014-6-30结束时间作为分析窗口数据分析以55555这个人为例,判断其活动位置,基站号改变,说明其进入下一个区域,分析出2014-1-1下午零时53分进入36902基站,直到二时13分才进入36907基站,说明他在36902基站呆了80分钟数据预处理首先,去掉无用的属性,例如什么信令类型,LOC编号这些的,只留下日期,时间...原创 2019-03-27 11:45:32 · 1449 阅读 · 1 评论 -
《数据分析与挖掘 第十三章 财政因素影响分析及预测模型》
财政因素影响分析及预测模型原创 2019-03-26 14:29:29 · 3933 阅读 · 5 评论 -
《数据分析与挖掘 第四章 数据预处理》
1.拿到数据,进行数据清洗,数据有缺失值利用拉格朗日插值法补缺失值import numpyimport pandas as pd # 导入数据分析库Pandasfrom scipy.interpolate import lagrange # 导入拉格朗日插值函数 inputfile = 'catering_sale.xls' # 销量数据路径outputfile = 'sale...原创 2019-03-13 20:50:42 · 805 阅读 · 0 评论 -
《数据分析与挖掘 第十章 家用电器用户行为分析与事件识别》
家用电器用户行为分析与事件识别数据抽取原创 2019-03-22 11:53:44 · 2500 阅读 · 3 评论 -
《数据分析与挖掘 第六章 电力窃漏电用户自动识别系统》
电力窃漏电用户自动识别系统数据预处理有一张含有若干缺失值的表格,需要用拉格朗日插值法,将缺失值补齐:这是三个用户的用电情况import pandas as pdfrom scipy.interpolate import lagrangeinputfile = 'missing_data.xls'data = pd.read_excel(inputfile,header = No...原创 2019-03-18 19:21:13 · 1168 阅读 · 1 评论 -
《数据分析与挖掘 第十一章 应用系统负载分析与磁盘管理》
应用系统负载分析与磁盘管理原创 2019-03-25 12:42:22 · 782 阅读 · 2 评论 -
《数据分析与挖掘 第三章 数据探索》
拿到餐饮日销额数据的excel表1.首先进行异常值分析:import pandas as pdcatering_sale = 'catering_sale.xls' #餐饮数据data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列#print(data)import matplotlib.py...原创 2019-03-12 21:04:48 · 2154 阅读 · 1 评论 -
《数据分析与挖掘 第九章 基于水色图像的水质评价》
基于水色图像的水质评价数据预处理拿到拍摄的水样图片若干,对图像进行切割,得到仅有水色图像的图片,以图片中心点左右,上下50像素切分特征提取提取R,G,B,的一阶,二阶,三阶矩,九种属性模型输入这里观察表格数据没有缺失值,所以不用进行插值什么的,直接将数据二八分,百分之八十用于训练,百分之二十用于测试:import pandas as pdinputfile = 'moment.c...原创 2019-03-21 10:36:48 · 2254 阅读 · 8 评论 -
《数据分析与挖掘 第八章 中医症型关联规则挖掘》
中医症型关联规则挖掘加粗样式原创 2019-03-20 12:38:16 · 1217 阅读 · 3 评论 -
《数据分析与挖掘 第五章 挖掘建模》
1.分类与预测逻辑回归 自动建模#逻辑回归 自动建模import pandas as pdfilename = 'bankloan.xls'data = pd.read_excel(filename)x = data.iloc[:,:8].valuesy = data.iloc[:,8].valuesfrom sklearn.linear_model import Logis...原创 2019-03-15 19:50:44 · 1188 阅读 · 0 评论 -
《数据分析与挖掘 第七章 航空公司客户价值分析》
航空公司客户价值分析加粗样式原创 2019-03-19 20:13:32 · 2259 阅读 · 0 评论