数据挖掘
mse0520
这个作者很懒,什么都没留下…
展开
-
Pandas-DataFrame基础知识点总结
1、DataFrame的创建DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值。DataFrame既有行索引,也有列索引,它可以看作是由Series组成的字典,不过这些Series公用一个索引。DataFrame的创建有多种方式,不过最重要的还是根据dict进行创建,以及读取csv或者txt文件来创建。这里主要介绍这两种方式。根据字典创建import pandas as pdfrom pandas import DataFramedata = { '原创 2020-05-16 22:05:35 · 244 阅读 · 0 评论 -
python中defaultdict用法详解
认识defaultdict:当我使用普通的字典时,用法一般是dict={},添加元素的只需要dict[element] =value即,调用的时候也是如此,dict[element] = xxx,但前提是element字典里,如果不在字典里就会报错,如:1.png这时defaultdict就能排上用场了,defaultdict的作用是在于,当字典里的key不存在但被查找时,返回的不...原创 2019-12-17 22:55:09 · 153 阅读 · 0 评论 -
数据挖掘的关联分析中几个概念-支持度、置信度和提升度
数据挖掘中常用的评价概念二元表示:每一行对应一个事务,每列对应一个项,项用二元变量表示项在事务中出现比不出现更重要,因此项是非对称的的二元变量。项集(Itemset):包含0个或多个项的集合,如果包含k个项,则称为k-项集。事务的宽度:事务中出现的项的个数一般我们使用三个指标来度量一个关联规则,这三个指标分别是:支持度、置信度和提升度。Support(支持度):...原创 2019-12-17 22:37:11 · 2294 阅读 · 0 评论