诈骗电话识别

博主参与了数字四川创新大赛的诈骗电话识别项目,分享了数据来源和处理过程。整理了用户基础资料、通话、短信和上网数据,创建了训练集。在VOC中统计通话频率,短信和上网数据,整合所有信息。训练时添加新特征,归一化数据,使用神经网络模型,通过调整参数优化结果。提供完整代码,欢迎讨论。
摘要由CSDN通过智能技术生成

这几天偶然参加了这个比赛项目,分享一下个人的想法,能力有限欢迎大家来讨论学习!
数据来源“数字四川创新大赛-诈骗电话识别”
有同学说进入复赛阶段没法获取数据集了,这是我保存的数据集,仅供大家学习使用![百度网盘]提取码:9asc
数据训练集由如下4个部分组成:
user:用户的一些基础资料

voc:8个月内的通话数据

SMS和APP:8个月的短信和上网数据

测试集和训练集组成类似,但手机话费消费的月份只有一个月
针对以上的数据首先从user中统计了用户的phone_no_m,再根据phone_no_m依次整理通话、短信和上网的数据特征
首先整理VOC中每个phone_no_m通话的频率次数分别把呼入呼出次数、通话总时长进行统计

user=pd.read_csv('./train_user.csv')
print(user.info())
sms=pd.read_csv('./train/train_sms.csv')
print(sms.info())
print(sms.head())
user_m = user['phone_no_m'].values
print(user_m)
sms_up=[]
sms_down=[]
for name in tqdm(user_m):
    sms_up.append(sms[(sms['phone_no_m'] == name) & (sms['calltype_id']==1)]['phone_no_m'].count())
    sms_down.append(sms[(sms['phone_no_m'] == name) & (sms['calltype_id'] == 2)]['phone_no_m'].count())
user_m=np.array(user_m)
sms_up=np.array(sms_up)
sms_down=np
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值