机器学习
文章平均质量分 83
_TongJie
我是一名编程爱好者
展开
-
2020首届数字四川创新大赛_诈骗电话识别数据统计分析(一)
1.竞赛背景近年来,通过拨打电话、群发短信实施诈骗的违法行为一直困扰着手机用户,给移动手机用户造成了困扰甚至金钱的损失,如何有效防护诈骗电话对用户隐私、财产造成的威胁,成为公安急需解决的问题,也是四川移动提升用户满意度、保护用户权益需要高度关注的问题。 通过诈骗电话号码的通信行为,识别诈骗电话,及时关停诈骗号码,成为运营商与公安部门合作的持续的工作,虽取得一定成绩,但诈骗方式的不断翻新,给诈骗电话的准确识别带来了持续算法挑战。2.任务基于用户通信行为数据的诈骗电话识别,将针对诈...原创 2020-06-09 15:28:06 · 6287 阅读 · 15 评论 -
随机森林的优缺点
网上有很多关于随机森林优缺点的总结,但是都只是抄来抄去,并没有对这些优缺点作说明,导致有些看不懂。本人根据自己的理解,对某些优缺点做一下说明,如果理解有不对的地方,欢迎大家指正。随机森林是一个用随机方式建立的,包含多个决策树的分类器。其输出的类别是由各个树输出的类别的众数而定。随机性主要体现在两个方面:(1)训练每棵树时,从全部训练样本(样本数为N)中选取一个可能有重复的大小同样为N的原创 2018-02-02 08:09:28 · 21526 阅读 · 3 评论 -
数据挖掘常见面试题
机器学习方面:SVM1、支撑平面-和支持向量交互的平面,分割平面---支持平面中间面也就是最优分类平面2、SVM不是定义损失,而是定义支持向量之间的距离目标函数3、正则化参数对支持向量数的影响LR1、LR的形式:h(x)=g(f(x)) 其中x为原数据,f(x)为线性/非线性回归得到的值,也叫判定边界 g()为Sigmod函数,最终h(x)输出的范围为(0,1)原创 2018-02-02 09:27:48 · 18904 阅读 · 1 评论 -
机器学习算法整理(内含代码)
一般来说,机器学习有三种算法:1.监督式学习 监督式学习算法包括一个目标变量(也就是因变量)和用来预测目标变量的预测变量(相当于自变量).通过这些变量,我们可以搭建一个模型,从而对于一个自变量,我们可以得到对应的因变量.重复训练这个模型,直到它能在训练数据集上达到理想的准确率属于监督式学习的算法有:回归模型,决策树,随机森林,K近邻算法,逻辑回归等算法2.无监督式算法无监督式学原创 2018-01-26 20:36:31 · 39025 阅读 · 6 评论