自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

[B1]用Python抠图并修改底色

我是莫小白,刚学python一个月,现在开始每天写一篇小博客记录一个小项目,项目资源来自网上各位大神,我只是用来练手而已。

  • 博客(11)
  • 收藏
  • 关注

原创 [B11]数据挖掘实战:客户流失预警系统

*这是一个数据挖掘的小项目, 将从以下几个方面来分析: 数据清洗与格式转换 探索性数据分析 特征筛选 特征工程 建立多种基础模型,尝试多种算法 模型调参/提升模型 评估测试/结论汇报 分析与准备数据 数据简介 State:州名 Account Length:账户长度 Area Code:区号 Phone:电话号码 ‘Int'l Plan:国际漫游需求与否 VMail Plan:参与活动 VMa...

2020-07-02 10:53:43 1321 1

原创 [B10]爬虫课程02

数据解析 1.Xpath语法和lxml模块 #使用方式:使用//获取整个页面当中的元素,然后写标签名,然后再写谓词进行提取。 //div[@clas='abc'] 需要注意的知识点: 1./和//的区别:/只获取直接子节点,//可以获取子孙节点 2.contains:有时候某个属性包含多个值,可以使用cntains //div[contains(@class,'job_detail')] 3....

2020-02-22 13:15:07 164

原创 [B9]爬虫课程01

url详解 1. urlopen函数—打开一个网页 from urllib import request r=request.urlopen('http://www.baidu.com') print(r.read(2000).decode("utf-8")) 2.urlretrieve函数—保存网页文 request.urlretrieve('http://www.baidu.com',...

2020-02-22 11:37:14 266

原创 [B8]信用评分卡建模

在家不能太颓废,跟着视频里的老师练习了一个风控建模案例,算用来练练手吧。中间出了一点小bug耽误了大半天的时间。 第一步:导入数据 #导入科学计算包 import numpy as np import matplotlib as mlt import matplotlib.pyplot as plt plt.rc('font', family='Microsoft YaHei') %matpl...

2020-02-01 21:04:52 689

原创 [B7]社群粉丝数据分析

最近在做社交电商,涉及到社群运营,刚做不久,群成员才200多人,但也积累了不少经验和教训。为了进一步了解粉丝的偏好,现决定对部分粉丝做一个简单的数据分析。 一、数据获取 由于群里只有一半人是我认识的,对其基本信息有所了解,故仅选取了前100名成员进行分析。 1.导入数据 import pandas as pd import numpy as np import matplotlib.pyplo...

2020-01-27 19:43:21 1776 1

原创 [B6]多因子数据的处理方式

多因子数据的处理:主要包括三种方式-----------去极值;标准化;中性化 1.去极值 去极值不是删除而是拉回正常值 (1)分位数去极值 (2)3倍中位数去极值(3mad) (3)正太分布去极值(3sigma) 首先安装以下需要的工具包 from scipy.stats.mstats import winsorize from sklearn.preprocessing import S...

2019-12-16 23:23:21 1001

原创 [B5]我的第一个量化策略

最近在学量化,刚学了一点点基础,这篇博客只作为一篇学习笔记,我想通过这种方式应该可以更好的激励自己去学习。 需求: 选股:获得市盈率大于50且小于65,营业总收入前10的股票 调仓:每日调仓,将所有资金平摊到10个股票的购买策略,卖出一次性卖出所有不符合条件的股票。 第1步:选股 不在init()处调用 def init(context): # 在context中保存全局变量 ...

2019-12-16 12:03:58 280

原创 [B4]链家二手房价格预测

“这篇博客主要分享一个数据分析初级项目,基本概括了一个完整项目的各个分析阶段,但是数据获取是直接在链家官网爬取的,这部分先不分享了。过程中还有很多不足的地方,希望各位大佬多多指点。” 1.数据预处理 首先导入科学计算包 import pandas as pd import numpy as np import seaborn as sns import matplotlib import matp...

2019-12-14 18:59:53 948

原创 [B3]泰坦尼克号数据分析

这是我做的第一个半完整的数据分析项目,里面包含数据获取,数据清洗,描述性统计,数据可视化,机器学习建模等内容。花了我两天时间,中间出了很多bug,而且原始数据也有问题,因此存在较多缺陷,还请各位大佬多多指教!

2019-11-20 00:32:50 688

原创 [B2]Python机器学习案例--Iris数据集

今天我们来练习一个小项目,是《Python机器学习及实践–从零开始通往kaggle竞赛之路》里面的小栗子。 首先总结一下机器学习的几个步骤:1.数据的加载;2.选择模型;3.模型的训练;4.模型的预测;5.模型的测评;6.模型的保存 第一步: 先加载数据,sklearn模块是Python自带的所以无需安装了,iris数据集也是sklearn里面有的,所以可以直接导入 #从sklearn.dat...

2019-11-15 21:35:13 1012

原创 [B1]用python抠图并添加背景色

第一步:首先安装RemoveBg库 pip install removebg Removebg是利用人工智能算法实现的自动识别出前景主体与背景图,处理速度极快。需要注册获取API接口,一个接口一个月只能处理50张图片。 第二步:导入RemoveBg,输入API接口 #处理单张图片 from removebg import RemoveBg rmbg = RemoveBg("RKxxxxx","er...

2019-11-15 21:05:45 395

1_金融风控课程代码-20221120.py

1_金融风控课程代码-20221120.py

2022-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除