自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 2021-10-12

药监局爬取import requestsfrom lxml import etreeimport osimport jsonimport timedef get_page(url, params): headers = { 'User-Agent' : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/

2021-10-12 11:35:08 104

原创 2021-10-11

爬取笔趣阁小说——三寸人间import requestsfrom lxml import etreeimport osimport timedef get_page(url): headers = { 'User-Agent' : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"

2021-10-11 17:13:34 64

原创 动手学深度学习--task1

1. softmax的基本概念直接使用输出层的两个问题:a. 一方面,由于输出层的输出值的范围不确定,我们难以直观上判断这些值的意义。例如,刚才举的例子中的输出值10表示“很置信”图像类别为猫,因为该输出值是其他两类的输出值的100倍。但如果o1=o3=103,那么输出值10却又表示图像类别为猫的概率很低。b. 由于真实标签是离散值,这些离散值与不确定范围的输出值之间的误差难以衡量。so...

2020-02-14 16:35:41 169

原创 Single Variable Analysis

IEEE-CIS Fraud Dection链接:https://www.kaggle.com/kabure/extensive-eda-and-modeling-xgb-hyperopt代码理解数据融合: train = pd.merge(train_transaction, train_identity, on='TransactionID', how='left') tes...

2019-09-21 09:10:26 268

原创 Introduction to Emsembling/Stacking in Python

泰坦尼克号https://www.kaggle.com/arthurtok/introduction-to-ensembling-stacking-in-python代码理解1. Preprocessing1.库加载import plotly.offline as pypy.init_notebook_mode(connected=True)import plotly.graph_o...

2019-09-19 18:17:53 297

原创 Pytorch_Task_7

用Pytorch实现手写数字识别1. 定义一个CNN网络from torch import nn class CNN(nn.Module): def __init__(self): super(CNN, self).__init__() self.layer1 = nn.Sequential( nn.Conv2d(1, 25,...

2019-04-17 16:05:05 141

原创 Pytorc_Task6

1. 优化方法1. Momentum(冲量)在普通的梯度下降法x += v中,每次x的更新量v为v = - dx * lr,其中dx为目标函数func(x)对x的一阶导数。当使用冲量时,则把每次x的更新量v考虑为本次的梯度下降量- dx * lr与上次x的更新量v乘上一个介于[0, 1]的因子momentum的和,即v = - dx * lr + v * momemtum。从公式上可看出...

2019-04-15 23:04:46 134

原创 Pytorch_Task5

Dropout原理dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。注意是暂时,对于随机梯度下降来说,由于是随机丢弃,故而每一个mini-batch都在训练不同的网络。dropout可以在CNN中防止过拟合pytorch实现Dropoutdim_in = 28*28dim_hid = 158dim_out = 10cla...

2019-04-14 17:22:40 198

原创 pytorch_test4

import torchvisionimport torchvision.datasets as datasetsimport torchimport torch.nn.functional as Fimport numpy as np import randomrandom.seed(1)np.random.seed(1)torch.manual_seed(1)train...

2019-04-11 22:38:52 154

原创 用pytorch实现逻辑回归

用pytorch实现逻辑回归import torchfrom torch.autograd import Variabletorch.manual_seed(2)x_data = Variable(torch.Tensor([[1.0], [2.0], [3.0], [4.0]]))y_data = Variable(torch.Tensor([[0.0], [0.0], [1.0],...

2019-04-09 16:13:06 1407 2

原创 PytorchTask_2

numpy实现线性回归import numpy as np x_data = np.array([1, 2, 3])y_data = np.array([2, 4, 6])epochs = 10lr = 0.01w = 0cost = []for epoch in range(epochs): yhat = x_data * w loss = np.average((yha...

2019-04-07 20:10:55 188

原创 Pytorch的基本概念

1. 什么是Pytorch,为什么选择Pytorch近年来随着深度学习的火热,越来越多的人开始研究深度学习。作为一个小白,所只能简单的介绍下。Pytorch作为深度学习的一个框架,是FaceBook出品的,并且他是支持Python的,重点是pytorch是动态图,可以随时打印出中间计算结果,方便调试。2.配置python环境因为我以前就安装过python,所以这里就不重新再叙述了3. 通过...

2019-04-06 13:20:54 330

原创 泰坦尼克

1. 加载数据import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snstrain_df = pd.read_csv("tatannic/train.csv")test_df = pd.read_csv("tatannic/test.csv")2. 特征类型分析...

2019-03-15 18:23:56 516

原创 金融数据6

模型融合这里我用了Stacking进行融合模型from mlxtend.classifier import StackingCVClassifier, StackingClassifier # 构建 Stacking 模型,因为 dt 评分太低了,所以抛弃掉,使用 lr 作为最后的融合模型s_clf = StackingClassifier(classifiers=[rfc, xgb, ...

2019-03-11 22:01:03 399

原创 金融数据5

模型调参网格搜索from sklearn.model_selection import GridSearchCVn_fold = 5 #5折交叉验证scoring = 'accuracy' #评价标准为准确率逻辑回归ltc_param = {'penalty':['l1', 'l2'], 'C':[0.0001, 0.001, 0.01, ...

2019-03-10 20:27:37 284

原创 金融数据4

模型的评价from sklearn.metrics import accuracy_score, recall_score, f1_score, roc_auc_score, roc_curvefrom matplotlib import pyplot as plt# 定义评估函数def model_metrics(clf, X_train, X_test, y_train, y_test...

2019-03-08 17:46:59 371

原创 金融数据3

构建模型并评估这里采用逻辑回归、svm和决策树;随机森林和XGBoost进行模型构建,采取的评价方式是accuracy首先导入我们需要用的库from sklearn.linear_model import LogisticRegressionfrom sklearn.svm import SVCfrom sklearn.tree import DecisionTreeClas...

2019-03-06 13:47:58 366

原创 金融数据2

数据特征筛选通过相关性corrmat = X.corr()f,ax = plt.subplots(figsize=(12, 9))sns.heatmap(corrmat, square=True)从这里可以发现每个特征彼此之间的相关性。k = 10f, ax = plt.subplots(figsize=(12, 9))cols = corrmat.nlargest(k, 's...

2019-03-04 20:05:33 394

原创 金融数据1

自己分析的第一个数据挖掘项目首先导入数据导入相应的库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.preprocessing import LabelEncoder导入数据data = pd.read_csv("...

2019-03-01 20:57:58 687

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除