自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

原创 TA-Lib金融量化库指标总结笔记

一、TA-Lib介绍1.简介下载地址及原文:https://mrjbq7.github.io/ta-lib/TA-Lib,全称“Technical Analysis Library”, 即技术分析库,是Python金融量化的高级库。包含了150多个指标,包括:ADX, MACD, RSI, Stochastic, Bollinger Bands, 等。K线形态识别完全开源,支持 C/C++, Java, Perl, Python and 100% Managed .NET2.安装使用p

2022-02-25 17:12:36 3804

原创 数据分析笔试练习题

题目1:数据集Retail_Data_Transactions.csv记录了客户ID,交易时间和交易金额三个字段,需求是对客户ID进行汇总统计,计算每一个客户的如下特征变量,并把结果输出为csv文件。• Last_date: 最后一次交易时间 • Recency: 最后一次交易时间距离今天的间隔天数 • Frequnece: 累计交易次数• Amount: 累计交易金额• Intereval: 平均两次交易之间的间隔天数(如果客户只有一次交易字段为空值)导入包import pandas a

2022-02-25 15:21:21 944

原创 时间序列预测(ARIMA、VAR、回归树)原理

typora-root-url: …\图时间序列预测(不包含深度学习)文章目录时间序列预测(不包含深度学习)一、单变量预测ARIMA1.基本步骤(1)自回归模型AR(2)移动平均模型MA(3)自回归移动平均模型(ARMA)(4)选择ppp和qqq的方法2.参数(以Merlion包下ARIMA模型为例)二、多变量预测1.VAR(1)基本步骤(2)参数2.回归树(1)基本步骤(2)示例一、单变量预测ARIMAARIMA(p,d,q)模型全称为差分自回归移动平均模型,其中AR是自回归,p是自回归项;.

2022-01-12 14:56:43 3432

原创 Merlion包中单变量多变量预测对比

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom merlion.utils import TimeSeriesfrom merlion.models.factory import ModelFactoryfrom merlion.models.forecast.arima import Arima, ArimaConfigfrom merlion.mod

2022-01-12 14:48:31 764

原创 GitHub上传

1.在文件夹中打开Git Bash命令窗口;2.把文件夹变成Git可管理的仓库git init3.把文件添加到缓存区git add .4.把文件提交的本地仓库git commit -m "注释"5.与git 仓库关联git remote add origin git@github.com:用户名/仓库名.git6.把本地库的所有内容推送到远程仓库git push -u origin master...

2022-01-10 16:35:51 204

原创 【论文】CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image Segmentation

CoTr原理1. 简 介CNNs:3D医学图像分割中的标准,局限性:卷积网络局部性和权重共享的归纳偏差,带来长距离依赖的局限性。Transformer:sequence-to-sequence的预测框架,其中的自注意力机制可以动态调整接受域,使transformer具备长距离依赖建模的能力。局限性:处理高分辨率 3D 特征图时遇到了极端的计算和空间复杂度。本文工作:有效连接CNN和Transformer(CoTr),并且CoTr具备编码器-解码器结构。在编码器中:​ (1)利用CNN用来提取特征

2021-12-24 11:18:05 1440

原创 Merlion—ARIMA时间序列预测金融数据

数据样式import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom merlion.utils import TimeSeriesfrom merlion.models.forecast.arima import Arima, ArimaConfigfrom merlion.transform.base import Identityfrom merlion.evaluate.forecast import

2021-12-22 16:04:05 812

原创 LSTM预测外汇涨跌平

参考论文《Forecasting directional movementof Forex data using LSTM with technicaland macroeconomic indicators》数据样式:其中label为预测标签,根据论文中的阈值法确定import numpy as npimport pandas as pdfrom sklearn.preprocessing import MinMaxScalerimport torchfrom torch import

2021-12-22 15:51:16 351

原创 Merlion应用:2. Models(forecast)

1. 导入包导入 models & configs所有模型初始化时,都需要使用模型的配置对象ModelClass(config)以及预处理模块transformsfrom merlion.models.forecast.arima import Arima, ArimaConfigfrom merlion.models.forecast.prophet import Prophet, ProphetConfigfrom merlion.models.forecast.smoother im

2021-12-22 15:40:50 759

原创 Merlion应用1. Data Layer

导入包from merlion.utils import TimeSeries格式转换pd.DataFrame(将时间列设置为index) 和 TimeSeries之间的互相转换转换成TimeSeries:time_series = TimeSeries.from_pd(df)转换成DataFrame:recovered_df = time_series.to_pd()功能获取变量名:time_series.names获取变量:time_series.univariates[name]迭

2021-12-22 15:40:07 221

原创 【论文】Merlion: A Machine Learning Library for Time Series

Merlion原理1 简 介Merlion,一个用于时间序列智能分析的Python包,来源于2021年9月发表的论文《Merlion: A Machine Learning Library for Time Series》。它提供一个端到端的机器学习框架,包括:1)加载和转换数据2)构造及训练模型3)后处理模型结果4)评价模型性能它支持不同的时间序列学习任务,包括单变量和多变量时序的预测和异常检测。Merlion的主要特征:1)标准化和易于扩展:用于时间序列预测和异常检测任务的数据加载、预

2021-12-22 15:37:04 528

翻译 A graph-based semi-supervised reject inference framework阅读笔记

文章标题:A graph-based semi-supervised reject inference framework considering imbalanced data distribution for consumer credit scoring摘要一、引言二、文献综述三、准备工作3.1 标签扩散(label spreading)3.2 Borderline-SMOTE3.3 基本分类器3.3.1 随机森林3.3.2 梯度上升决策树3.3.3 XGBoost3.3.4 LightGBM4 构建

2021-05-16 19:00:54 251

原创 信用卡欺诈预测(下采样)

import pandas as pdimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import roc_auc_scorefrom sklearn.model_selection import GridSearchCVfrom sklearn.metrics import confusion_matr

2021-03-24 09:58:44 165

原创 概率游戏

游戏:有3个门,门后分别是car,sheep,只有一个门是car。一个猜想着随即选取一个门,如果这个门后面是车就可以获得车,否则获得羊。很显然这样猜对车的概率是1/3。但是现在的条件是有个主持人,她知道每个门后面是什么。当你选择一个门之后,她打开一个有羊的门。问你是否改变你原来的选择?坚持原来的选择的话获得车的概率是多少,改变原来的选择的话概率又为多少。请给出解释。答案是1/3变成2/3。change=0unchange=0n=10000for i in range(n): nums=l

2021-03-24 09:43:46 750

原创 中国特色小镇网爬取文章分词

import pandas as pdimport jiebajieba.load_userdict('D:/jiebaDict.txt')df = pd.read_table('D:/特色小镇.txt',names=['content'],encoding='gb18030')df.tail()# 将内容存入列表content = df.content.values.tolist()print(content[1])# jieba分词content_S = []for line

2021-03-24 09:21:49 102

原创 中国特色小镇网文章爬取

import osos.chdir('C:/Users/wenwen/Desktop')import requestsfrom bs4 import BeautifulSoup as bsfrom selenium import webdriverimport timeimport pandas as pdurl = 'http://www.chntsxz.cn/forum.php?mod=viewthread&tid=1425'driver = webdriver.Chrome

2021-03-24 09:15:32 90

原创 天池贷款违约预测

# 读取数据data_row = pd.read_csv('D:/天池/贷款违约预测/train.csv')data_row.head(5)# 查看分类情况data_row.isDefault.value_counts()# 提取类别cols_row = data_row.columns.to_list()# 提取文本列并替换为数字cat_ = data_row.select_dtypes(include='object').columnsIndex([‘grade’, ‘subG

2021-03-24 09:12:41 765

原创 数据库相连的消费者分析(二)

3.用户消费行为用户第一次消费(首购)用户最后一次消费新老客消费比多少用户仅消费一次?每月新客占比用户分层RFM新、老、活跃、回流、流失用户购买周期(按订单)用户消费周期描述用户消费周期分布用户生命周期(按第一次&最后一次消费)用户生命周期描述用户生命周期分布# grouped_user.min().reset_index().order_dt.value_counts().plot()grouped_user.max().order_

2021-03-24 09:05:54 245

原创 数据库相连的消费者分析(一)

与数据库相连的消费者分析(一)1.进行用户消费趋势的分析(按月)2.用户个体消费分析import pandas as pdimport numpy as npfrom sqlalchemy import create_enginedef reader(query,db='data'): sql = query engine = create_engine('mysql+pymysql://root:messi123@localhost:3306/{0}?charset=utf8'.

2021-03-19 18:34:09 249

2021年美国数学建模大赛F题.pdf

2021年美国数学建模大赛F题.pdf

2021-04-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除