![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据挖掘
阿阿哼
这个作者很懒,什么都没留下…
展开
-
python入门与实践(四)--亲和性分析(Apriori算法)
关联分析步骤 1、发现频繁项集,即计算所有可能组合数的支持度,找出不少于人为设定的最小支持度的集合。 2、发现关联规则,即计算不小于人为设定的最小支持度的集合的置信度,找到不小于认为设定的最小置信度规则。 关联分析的两种关系:简单关联关系和序列关联关系 简单关联关系: 简单关联关系可以从经典的购物中进行分析,购买面包的顾客80%都会购买牛奶,由于面包和牛奶是早餐搭配的必需品,二者搭配构成了早餐的组...原创 2019-03-05 19:24:38 · 701 阅读 · 0 评论 -
python数据挖掘入门与实践(二)
用scikit-learn估计器分类 大多数scikit-learn估计器接收和输出的数据格式均为numpy数组或类似格式。 1、读取csv数据文件的方式: x = np.zeros((a,b),dtype='float') y = np.zeros((a,),dtype='bool') with open(path,'r') as f: reader = csv.reader(f) fo...原创 2019-03-03 18:41:26 · 855 阅读 · 0 评论 -
python数据挖掘入门与实践(一)
第一章 开启数据挖掘之旅 打开jupyter notebook的方式: 在命令提示符(cmd)中输入:jupyter notebook就可以打开Web浏览器创建新的实例。 关闭:在cmd中输入Ctrl+C,确认关闭即可。 1.3 亲和性分析 应用场景:超市商品的摆放、向网站用户推送、电影推荐等。 找出规则。对于找出的规则需要判断其优劣,通过支持度(support)和置信度(confidence)。...原创 2019-03-03 17:20:16 · 1611 阅读 · 0 评论