- 博客(7)
- 资源 (3)
- 问答 (1)
- 收藏
- 关注
原创 MYSQL添加字段
mysql添加字段的语句:ALTER TABLE tbl_tpl ADD title bigint(20) DEFAULT '' COMMENT '测试' AFTER id;但是当mysql表中数据量特别大的时候,mysql5.6之前的执行上述操作就会进行锁表,甚至影响服务不可用,针对这种情况,对于数据量较大的mysql需要执行alter操作,如下操作:1.创建一张新的临时表create table new_table like old_table;2.给新表加上新增的字段3.将
2021-10-25 10:59:15 6368
原创 L1、L2正则化
过拟合:对于训练集拟合效果非常好,但是对于训练集以外的数据集拟合效果不好。通常发生在变量(特征)较多的情况,也就是说曲线尽可能的满足训练数据集,导致无法泛化(泛化是指模型能够应用到新样本的能力)到新数据集中。解决办法:减少样本特征、正则化(通常添加L2正则化)欠拟合:模型没有没有很好的捕捉到数据特征,不能够很好的拟合数据。与过拟合是相反的。其解决办法:添加其他特征项、添加多项式特征、减少正则化
2017-06-23 20:35:15 480
原创 排序算法
排序算法有:内部排序算法和外部排序算法,通常来说,我们一般说排序算法说的是内部排序算法。稳定性是指,假如Ai=Aj,经过排序算法后,Ai、Aj排序位置不变,我们则称算法是稳定的。1.冒泡排序 冒泡排序是将最小的元素往前调,大的元素往后调,两相邻元素两两比较。(稳定)2.插入排序 插入排序就是在一个有序的排序上一次插入一个排序。(稳定)3.选择排序
2017-06-16 15:09:49 169
原创 python中list删除方法比较
1.remove 删除指定字符串,而不是字符串的索引位置 n =[1,2,2,3,4,5] remove n(2) print n 结果为1,3,4,52.pop 删除指定字符串的索引位置,并且其删除的字符串可以赋值给其他变量 n =[1,2,2,3,4,5] a=pop n(2) print a,n 返回结果其中a=2
2017-06-15 23:53:04 1128
原创 mysql表的操作
1.查询交集 select a.*, b.* from tablea a inner join tableb b on a.id=b.id2.更新表中字段数据 update 表名 set 字段名 =replace(字段名,当前值,替换值)
2017-06-10 20:54:17 151
原创 数据挖掘中数据分类不平衡处理
处理方式1.数据层面 在数据方面可通过采样达到数据的平衡,有上采样和下采样,上采样就是复制少数样本,达到平衡,缺点:存在重复样本,容易发生过拟合;下采样就是去掉部分多数样本,缺点:导致数据缺失。 数据合成:SMOTE方法,利用小样本之间的相似性生成新样本。缺点:可能生成无益的信息,令一方面可能导致样本的重合。2.加权 针对不平衡数据特点,对分错类的样
2017-06-10 20:12:55 941
INTEL Parallel Studio XE 2016 With Updates License
2018-10-17
python 连接presto报错超时怎么办
2021-07-16
TA创建的收藏夹 TA关注的收藏夹
TA关注的人