当分类问题样本不均衡时使用什么评价指标
精确率
我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本
非常的严格,不容易筛选过去精确率更高表示限制性越大,越严格
召回率
召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能广泛,要求说明不太严格,容易达成
L1和L2的区别
L1是模型各个参数的绝对值之和。
L2是模型各个参数的平方和的开方值。
L1会趋向于产生少量的特征,而其他的特征都是0.因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0 ,产生稀疏权重矩阵
L2会选择更多的特征,这些特征都会接近于0最优的参数值很小概率出现在坐标轴上,因此每一维的参数都不会是0。当最小化||w||时,就会使每一项趋近于0
归一化的好处
方便迭代
三目运算
python可变对象与不可变对象
1.可变:列表,字典
2.不可变:字符串,数字,元组
pandas 一般用那些函数
Read_excel、drop_duplicates、apply、sort_values、value_counts、fillna
re函数
Extract
re.compile(): 将字符串编译为Pattern对象
re.match():从0位置匹配
re.search():搜索任意位置,相同字符串只是返回一个
re.findall(): 搜索任意位置,返回所有搜到的相同的字符串
深拷贝和浅拷贝
装饰器怎么用