自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 信用卡欺诈检测

信用卡欺诈检测信用卡欺诈检测是kaggle上一个项目,数据来源是2013年欧洲持有信用卡的交易数据,详细内容见https://www.kaggle.com/mlg-ulb/creditcardfraud这个项目所要实现的目标是对一个交易预测它是否存在信用卡欺诈,和大部分机器学习项目的区别在于正负样本的不均衡,而且是极不均衡的,所以这是特征工程需要处理的第一个问题。除此之外,在数据预处理上减轻的负担是缺失值的处理,并且大多数特征是经过了均值化处理的。 项目背景与数据初探# 导入基础的库,其他的模型库

2021-08-18 17:29:18 2423 2

原创 航空公司客户画像和客户价值分析

2021-08-17 09:34:32 1136

原创 使用python将excel数据导入MySQL

本文是介绍自己如何将excel数据导入到Mysql中,以及中间有一个报错的解决方法,记录下自己的改正过程,嘻嘻嘻。首先安装工具包,我用的jupyter notebook:!pip install mysqlclient# 导入需要的包import pandas as pdfrom sqlalchemy import create_engine# 创建引擎engine = create_engine('mysql://username:password@localhost/databasena

2021-08-15 10:56:38 2929

原创 airbnb 数据分析报告

airbnb数据分析报告数据集来源:https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data一、airbnb背景与分析1.1 airbnb背景介绍Airbnb(AirBed and Breakfast),爱彼迎,是一家联系旅游人士和家有空房出租房主的服务性网站,它可以为用户提供多样的住宿信息.Airbnb成立于2008年8月,总部在美国加州旧金山市,airbnb是一个旅行房屋租赁社区,用户可以通过网络或手机应用程序发布、搜索度

2021-07-19 21:17:07 2243 1

原创 Kaggle exercise 1: Titanic Disaster

Kaggle exercise 1: Titanic DisasterThe competition is simple: use machine learning to create a model that predicts which passengers survived the Titanic shipwreck.While there was some element of luck involved in surviving, it seems some groups of people

2021-07-16 19:28:57 262

原创 分类算法:Logistic regression详解与Matlab代码实现

机器学习的第一个算法也是最简单的算法是线性回归,对于输入x,模型输出的y是连续的,这也是回归问题(预测)和分类问题的区别,分类问题,二分类问题都是离散值,而回归问题。而对于为什么明明是分类算法却称作Logistic regression,个人理解是因为Logistic Function的输出是之间的实数,这与回归问题是如出一辙的。下面进行Logistic regression模型的详解,Logistic regression不仅能解决二分类问题,也能处理多分类问题,以二分类问题为例,多分类问题会在后面讲

2020-07-16 10:53:39 3596

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除