python 数据挖掘常用函数

import numpy as np # 多维数组对象和用于处理数组的例程集合组成的库 导入文件中的数据

files = 'path'    path/xxx/xxx/xxx   路径写法
f =files    #你所要打开的特定目录的特定文件

with open(f,'r') as file:
   l1 = file.readlines()             #把文件中的每一行作为一个元素添加到列表l1print(l1[3])                          #假设你要读取第三行打印输出

X = np.loadtxt(f)
n_samples, n_features = X.shape
print("This dataset has {0} samples and {1} features".format(n_samples, n_features))
print(X[0:5])
---------------------------------------------------------------------------------

from collections import defaultdict    #好处是如果查找的键不存在,返回一个默认值。
 
valid_rules = defaultdict(int)   #defaultdict(int、list)
 
 

s = [('yellow',1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]

d =defaultdict(list)

for k,v in s:

       d[k].append(v)

print(d.items()

  从上面的结果可以看出,这种初始化功能非常适合用于统计几个key出现过那几个value。

而第二种初始化为int的方式则与此不同,它适合实现的不是统计key的所有value,

而是统计一个key出现过多少次。示范代码如下:

from collectionsimport defaultdict

 

s = 'mississippi'

d =defaultdict(int)

for k in s:

       d[k] += 1

print(d.items())

[('i', 4), ('p',2), ('s', 4), ('m', 1)]

-----------------------------------------------------------------------------------------

from pprint import pprint
--------------------------------------------------------------------------
from operator import itemgetter
operator.itemgetter函数获取的不是值,而是定义了一个函数,通过该函数作用到对象上才能获取值。
a = [1,2,3] >>> b=operator.itemgetter(1)      //定义函数b,获取对象的第1个域的值>>> b(a)   2

sorted_support = sorted(support.items(), key=itemgetter(1), reverse=True)
sorted可以对list或者iterator进行排序
函数原型sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list
 

iterable:是可迭代类型;
cmp:用于比较的函数,比较什么由key决定,有默认值,迭代集合中的一项;
key:用列表元素的某个属性和函数进行作为关键字,有默认值,迭代集合中的一项;
reverse:排序规则. reverse = True(升序)
或者 reverse = False(降序),有默认值。

返回值:是一个经过排序的可迭代类型,与iterable一样。

--------------------------------------------------------------------------
CSV Comma-Separated Values ,用逗号分隔数据项)

with open(data_filename, 'r') as input_file:
reader = csv.reader(input_file)





 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值