python案例
文章平均质量分 96
Daryl_Li
数据分析,机器学习爱好者。
展开
-
「二分类算法」提供银行精准营销解决方案(样本不平衡问题)
项目背景项目来源于Kesci平台:提供银行精准营销解决方案项目简介本练习赛的数据,选自UCI机器学习库中的「银行营销数据集(Bank Marketing Data Set)」这些数据与葡萄牙银行机构的营销活动相关。这些营销活动以电话为基础,一般,银行的客服人员需要联系客户至少一次,以此确认客户是否将认购该银行的产品(定期存款)。因此,与该数据集对应的任务是「分类任务」,「分类目标」是预测客户是(’ 1 ‘)或者否(’ 0 ')购买该银行的产品。数据字段说明本次测评算法为: AUC(Area原创 2020-05-30 22:50:02 · 5482 阅读 · 1 评论 -
电商用户行为分析案例--天池数据集User Behavior Data from Taobao(python环境MySQL操作+Pyecharts可视化)
项目的背景及数据预处理过程,本文不再进行介绍。可以参考上一篇博文:电商用户行为分析案例–天池数据集User Behavior Data from Taobao本文基于上文已经预处理并导入MySQL的数据,在Python环境下,连接数据库进行取数。Python环境下,MySQL数据库的操作,可以参考博文:Python环境下MySQL数据库的操作分析的思路及角度,也可以参见上篇博文,本文不再赘述。本文重点介绍两个方面:1.Python环境下,连接MySQL并进行取数操作;2.运用python强原创 2020-05-17 01:42:06 · 7097 阅读 · 2 评论 -
天池o2o优惠券使用预测-第一名思路及代码解读
赛题回顾本赛题提供用户在2016年1月1日至2016年6月30日之间真实线上线下消费行为,预测用户在2016年7月领取优惠券后15天以内是否核销。评测指标采用AUC,先对每个优惠券单独计算核销预测的AUC值,再对所有优惠券的AUC值求平均作为最终的评价标准。大赛地址解决方案概述本赛题提供了用户线下消费和优惠券领取核销行为的纪录表,用户线上点击/消费和优惠券领取核销行为的纪录表,记录的时间区...原创 2020-04-23 23:12:00 · 6691 阅读 · 1 评论 -
逻辑回归制作金融申请评分卡
本文以个人消费类贷款数据,来简单介绍金融申请评分卡的建模和制作流程。1.1导库,获取数据#导库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.linear_model import LogisticRegression as LR#...原创 2020-04-12 00:10:47 · 515 阅读 · 10 评论 -
Kaggle - Home Depot Product Search Relevance关键词搜索
背景介绍Home Depot 产品相关性预测 kaggle竞赛:https://www.kaggle.com/c/home-depot-product-search-relevance HomeDepot是美国一家家具建材商品网站,用户通过在搜索框中输入关键词,得到相关商品和服务,如输入floor,得到不同材料的地板商品、地板清洗商品、地板安装服务等。kaggle竞赛目的是通过设计一种模型,能够...原创 2019-11-17 10:35:17 · 471 阅读 · 0 评论 -
文本挖掘(Word2Vec)小案例《每日新闻预测金融市场变化》
数据简介本案例用到的原始数据是一个简单的数据集,其中包括从国外某网站捞取的每日新闻排序(25条),然后以当日的股票市场涨跌作为Label。从而根据对新闻的挖掘,来判断当日股票涨跌。数据集大致长这样(部分截图):Date:日期数据,本案例文本分析就不用这个数据了。Label:当日股票市场情况,1代表上涨,0代表下跌。Top*:共25列,表示当日的相关新闻。下面利用Word2Vec简单的...原创 2019-11-16 11:45:29 · 1144 阅读 · 0 评论 -
文本挖掘(TF-IDF)小案例《每日新闻预测金融市场变化》
数据简介本案例用到的原始数据是一个简单的数据集,其中包括从国外某网站捞取的每日新闻排序(25条),然后以当日的股票市场涨跌作为Label。从而根据对新闻的挖掘,来判断当日股票涨跌。数据集大致长这样(部分截图):Date:日期数据,本案例文本分析就不用这个数据了。Label:当日股票市场情况,1代表上涨,0代表下跌。Top*:共25列,表示当日的相关新闻。下面利用TF-IDF简单的跑一...原创 2019-11-13 21:35:52 · 863 阅读 · 0 评论 -
Kaggle 便利店销量预测(xgboost附完整详细代码)
项目背景介绍Forecast sales using store, promotion, and competitor dataRossmann operates over 3,000 drug stores in 7 European countries. Currently,Rossmann store managers are tasked with predicting their ...原创 2019-10-29 23:32:37 · 21290 阅读 · 20 评论 -
Kaggle_Titanic生存预测
泰坦尼克号数据介绍与分析数据介绍作为当前机器学习最出名的几个入门kaggle项目,背景就无需多做介绍了。数据出处如下:https://www.kaggle.com/c/titanic/data数据中相关数据标签含义如下:从这里,我们大致了解了关于这份数据的存在形式,于是我们便可以进行python的使用与分析了,在此之前,导入基本我们需要使用的第三方库与数据:import numpy ...原创 2019-10-27 18:47:28 · 431 阅读 · 0 评论 -
Kaggle Event Recommendation Engine Challenge活动推荐(协同过滤推荐系统)
这里写自定义目录标题赛题介绍数据集一 处理user和event基础数据二 构建用户相似度矩阵三 用户社交关系挖掘四 event相似度矩阵五 event热度数据六 特征构建七 模型构建赛题介绍根据用户信息与活动(event)信息,预测用户将对哪些活动感兴趣。数据集共有六个文件:train.csv,test.csv, users.csv,user_friends.csv,events.csv和...原创 2019-10-19 20:13:36 · 838 阅读 · 2 评论