目录
将counter 的结果转换为字典
直接 dict() 就行
统计list中各个元素出现的次数
直接赋值、浅拷贝和深度拷贝解析
如果想要不改变原来的元素还是需要深拷贝
List列表删除元素(4种方法)
根据目标元素所在位置的索引进行删除,可以使用 del 关键字或者 pop() 方法;
根据元素本身的值进行删除,可使用列表(list类型)提供的 remove() 方法;
将列表中所有元素全部删除,可使用列表(list类型)提供的 clear() 方法。
删除字典元素的4种方法
del 全局方法(能删单一的元素也能清空字典,清空只需一项操作)
pop()方法(删除字典给定键 key 所对应的值,返回值为被删除的值)
items()
clear()方法(删除字典内所有元素)
字典创建的几种方法及适用场景
{k:[] for k in range(1,49)} # {1: [], 2: [], 3: [],...}
字典中的键必须是不可变类型
大多数Python对象可以作为键,但它们必须是可哈希的对象。 像列表和字典这样的可变类型,由于它们不是可哈希的,所以不能作为键。
List sort() 方法
sort() 函数用于对原列表进行排序,如果指定参数,则使用比较函数指定的比较函数。
注意:是直接对原列表进行排序,原列表会被改变的!没有返回值
python数据挖掘
(1)使用NumPy和SciPy进行数值分析
(2)使用Matplotlib进行图分析
(3) 总结
matplotlib.pyplot.hist()功能
用法: matplotlib.pyplot.hist(x, bins=None, range=None, density=False, weights=None, cumulative=False, bottom=None, histtype=’bar’, align=’mid’, orientation=’vertical’, rwidth=None, log=False, color=None, label=None, stacked=False, \*, data=None, \*\*kwargs)
参数:此方法接受以下描述的参数:
- x:此参数是数据序列。
- bins:此参数是可选参数,它包含整数,序列或字符串。
- range:此参数是可选参数,它是箱子的上下限。
- density:此参数是可选参数,它包含布尔值。
- weights:此参数是可选参数,并且是一个权重数组,与x的形状相同。
- bottom:此参数是每个容器底部基线的位置。 histtype:此参数是可选参数,用于绘制直方图的类型。 {‘bar’,‘barstacked’,‘step’,‘stepfilled’}
- align:此参数是可选参数,它控制如何绘制直方图。 {‘left’,‘mid’,‘right’}
- rwidth:此参数是可选参数,它是条形图的相对宽度,是箱宽度的一部分
- log:此参数是可选参数,用于将直方图轴设置为对数刻度
- color:此参数是一个可选参数,它是一个颜色规格或一系列颜色规格,每个数据集一个。
- label:此参数是可选参数,它是一个字符串或匹配多个数据集的字符串序列。
- normed:此参数是可选参数,包含布尔值,而是使用density关键字参数。
返回值:这将返回以下内容:
- n:这将返回直方图箱的值。
- 垃圾桶:这将返回箱子的边。
- 补丁:这将返回用于创建直方图的单个补丁的列表。
import matplotlib.pyplot as plt
import numpy as np
import matplotlib
# 设置matplotlib正常显示中文和负号
matplotlib.rcParams['font.sans-serif']=['SimHei'] # 用黑体显示中文
matplotlib.rcParams['axes.unicode_minus']=False # 正常显示负号
# 随机生成(10000,)服从正态分布的数据
data = np.random.randn(10000)
"""
绘制直方图
data:必选参数,绘图数据
bins:直方图的长条形数目,可选项,默认为10
normed:是否将得到的直方图向量归一化,可选项,默认为0,代表不归一化,显示频数。normed=1,表示归一化,显示频率。
facecolor:长条形的颜色
edgecolor:长条形边框的颜色
alpha:透明度
"""
plt.hist(data, bins=40, normed=0, facecolor="blue", edgecolor="black", alpha=0.7)
# 显示横轴标签
plt.xlabel("区间")
# 显示纵轴标签
plt.ylabel("频数/频率")
# 显示图标题
plt.title("频数/频率分布直方图")
plt.show()
pycharm不同目录引入模块
切分路径名 os.path.split()函数
语法:os.path.split(‘PATH’)
参数说明:
- PATH指一个文件的全路径作为参数:
- 如果给出的是一个目录和文件名,则输出路径和文件名
- 如果给出的是一个目录名,则输出路径和为空文件名
实际上,该函数的分割并不智能,它仅仅是以 “PATH” 中最后一个 ‘/’ 作为分隔符,分隔后,将索引为0的视为目录(路径),将索引为1的视为文件名
>>> import os
>>> os.path.split('C:/soft/python/test.py')
('C:/soft/python', 'test.py')
>>> os.path.split('C:/soft/python/test')
('C:/soft/python', 'test')
>>> os.path.split('C:/soft/python/')
('C:/soft/python', '')