为诈骗电话识别做一个简单的构思笔记
马上毕业了,对于论文毫无头绪,在这里做一个小小的笔记,关于识别电信诈骗信息的一个分析
数据获取
数据没办法爬取,想借用一下别人的数据
数据清洗、数据异常处理
对获取到的数据进行一个简单的清洗和数据异常处理,删除掉不需要的数据、将难以识别的字段名替换成容易看懂的。将有缺失值的数据进行一个替换或者删除。得到相对干净的数据。
做分析
对数据做一个相关性分析、特征重要性分析。
模型训练
定义模型函数,暂时不知道用哪个函数,慢慢摸索
对模型进行验证
使用模型验证结果
或许可以进行一个可视化
利用可视化分析结果,研究诈骗形式的特点。
emmm
暂时只能想到这么多,毕竟我很菜,慢慢研究。