Tersai-CSDN博客

原创 Kaggle--桑坦德客户交易预测比赛总结（克里斯大佬版本，0.9４0）

桑坦德客户交易预测总体思想：１．ｔｅｓｔ中存在合成数据．如何判别合成数据，若一条样本中，有那个特征的取值，在其他样本中出现过，则判定这条数据是合成数据换句话说，真是样本中，每一个特征的取值都是独一无二的．２．找到合成数据，首先剔除合成数据，仅保留真是数据３．将真实的ｔｅｓｔ数据与ｔｒａｉｎ数据进行拼接，计算出每一个特征中每一个取值在所有样本中出现的次数４．将ｔｅｓｔ中的虚假数据的次数用...

2019-09-03 18:17:34 757 1

原创基于Python数据科学挖掘精华实战课程(二）

1. 网络爬虫基础基于Python数据科学挖掘精华实战课程(一）2.爬宠步骤

2019-05-16 21:01:09 278

原创《python深度学习》总结与感想

总结关键网络架构及用法1.密集型连接网络二分类问题：层堆叠的最后一层是使用sigmoid的激活并且只有一个单元。使用“binary_crossentropy”作为损失函数单标签多分类问题：（每个样本只有一个类别）层堆叠的最后一层是Dense层，使用softmax激活，单元个数等于类别个数。如果目标是one-hot编码，使用“categorical-crossentropy”作为损失函数。如...

2019-05-14 23:21:52 3546 1

原创《python深度学习》学习笔记与代码实现（第八章：8.4，8.5，生成模型）

《python深度学习》第八章8.4 用变分自编码器(VAE)生成图像变分自动编码器也是一个生成模型,与GAN是一样的VAE的工作原理如下1.一个编码器模块将输入样本转换为表示潜在空间中的两个参数,均值和方差2.假设潜在正态分布能够生成输入图像,并从这个分布中随机采样一个点,z = z_mean + exp(z_log_variance) * epsilon, epsilon是取值很小...

2019-05-14 22:40:32 1057 3

原创《python深度学习》学习笔记与代码实现（第八章：8.1，8.2，8.3）

《python深度学习》第八章：生成式深度学习8.1 使用LSTM生成文本给定一个序列，预测下一个或多个标记的概率，从而生成之后的序列给定前面的标记，能够对下一个标记的概率进行建模的任何网络都叫做语言模型8.1.1 生成式循环网络简史8.1.2 如何生成序列数据8.1.3 采样策略的重要性（以上几小节都不太重要，了解即可）8.1.4 实现字符级别的LSTM文本生成# 准备下载语料...

2019-05-14 22:33:58 1322

原创 Kaggle--桑坦德客户交易预测比赛总结（初始版本，0.900）

桑坦德客户交易预测赛题描述：给定200000个训练样本和200000个测试样本，总共200个特征，进行二元分类，需要输出的时属于1（正类）的概率，评价指标是ROC曲线下的面积roc解释可以参考本篇博文数据集下载连接首先，进行初始化，对数据进行探索性分析from sklearn.model_selection import train_test_splitfrom sklearn.mod...

2019-05-05 12:23:08 2105 2

原创《python深度学习》学习笔记与代码实现（第七章：7.2 7.3）

python深度学习7.2----使用keras的回调函数和TensorBoard来检查并监控深度学习模型7.2.1 训练过程中将回调函数作用于模型回调函数的一些用法示例如下所示：1.模型检查点：在训练过程中的不同时间点保存模型的当前权重2.提前终止：如果验证损失不在改善，则中断训练3.在训练过程中动态的调节某些参数值4.在训练过程中记录训练指标和验证指标，或将模型学到的表示可视化#...

2019-05-05 11:40:08 679

原创《python深度学习》学习笔记与代码实现（第七章：7.1：不用Sequential模型的解决方案）

python深度学习第七章----高级的深度学习最佳实践7.1 不用Sequential模型的解决方案Sequential模型的特点：1.只有一种输入例如，我们要同时处理文本数据（全连接层），图片数据（2D卷积层），就不能使用Sequential模型，我们就需要多模态输入，例如，我们的输入数据为元数据，文本描述，图片，来预测一个一个商品的价格，我们就可以将Dense模块，RNN模块，卷积神...

2019-05-05 11:35:20 730

原创《python深度学习》学习笔记与代码实现（第六章，6.4用卷积神经网络处理序列）

6.4 用卷积神经网络处理序列1.实现一维卷积神经网络,用imdb情感分类任务举例from keras.datasets import imdbfrom keras.preprocessing import sequencemax_features = 10000max_len = 500print('loading dataset ......')(x_train,y_trai...

2019-04-27 11:39:39 707 1

原创《python深度学习》学习笔记与代码实现（第六章，6.3 循环神经网络的高级用法）

6.3循环神经网络的高级用法在这一节中，我们将回顾三种先进技术来提高递归神经网络的性能和泛化能力。在本节结束时，您将了解关于使用Keras的递归网络所知道的大部分内容。我们将展示一个天气预报问题的所有三个概念，在那里我们可以访问来自安装在建筑物屋顶上的传感器的数据点的时间，例如温度、气压和湿度，我们用来预测在收集最后一个数据点后24小时的温度。这是一个相当具有挑战性的问题，举例说明了在使用时间序...

2019-04-27 11:33:55 1272

原创《python深度学习》学习笔记与代码实现（第六章，6.2理解循环神经网络）

《python深度学习》第六章6.2 理解循环神经网络首先，用numpy自己写一个简单的神经网络来认识神经网络import numpy as np timesteps = 10input_features = 32output_features = 64# 输入数据，随机噪声，仅作示例inputs = np.random.random((timesteps,inpu...

2019-04-27 11:15:15 546

原创《python深度学习》学习笔记与代码实现（第六章，6.1处理文本数据）

《python深度学习》第六章深度学习用于文本和序列6.1 处理文本数据自然语言处理的应用：文档分类，情感分析，作者识别甚至问答处理文本数据，就是将其转换成数值张量，即文本向量化# one_hot编码# 独热编码，是处理文本最常用的编码方式# one-hot编码简单示例# 单词级别的one-hot编码import numpy as np samples = ['the cat...

2019-04-27 11:00:05 1040

原创《python深度学习》学习笔记与代码实现（第五章）

python深度学习第五章-深度学习用于计算机视觉5.1 卷积神经网络简介首先，让我们来实际看看一个非常简单的convnet示例。我们将使用我们的convnet对mnist数字进行分类，这是您在第2章中已经完成的一项任务，使用了一个紧密连接的网络（当时我们的测试精度为97.8%）。即使我们的convnet非常基础，它的准确性会超过第二章密集型连接网络下面的6行代码向您展示了一个基本的conv...

2019-03-19 17:13:54 2774

原创《python深度学习》学习笔记与代码实现（第四章）

第四章：机器学习基础本章涵盖了1.分类和回归以外的机器学习形式2.机器学习模型的正式评估过程3.为深度学习准备数据4.特征工程5.解决过拟合6.解决机器学习问题的通用工作流程在第三章的三个实际例子之后，您应该开始熟悉如何使用神经网络来处理分类和回归问题，并且您已经看到了机器学习的核心问题：过拟合。这一章将把你的一些新直觉形式化到一个坚固的概念框架中，用来解决深度学习的问题。我们将...

2019-03-01 16:47:32 719 1

原创《python深度学习》学习笔记与代码实现（第三章）

第三章神经网络入门1.神经网络剖析1.1 层：深度学习的基础部件5层神经网络，8层神经网络，等等1.2 模型：层构成的网络深度学习的模型时层构成的有向无环图。最常见的例子就是层的线性堆叠，将单一输入映射为单一输出1.3 损失函数与优化器：配置学习过程的关键损失函数：在训练过程中需要将其最小化，它能够衡量当前任务是否已经完成优化器：决定如何基于损失函数对网络进行更新，它执行的是随机...

2019-02-28 16:09:07 6905 2

原创《python深度学习》学习笔记与代码实现（第一，二章）

《python深度学习》学习笔记（一）记录学习笔记，希望和大家一起交流学习，包括知识点的记录，自己的理解和相关代码。如有错误，欢迎指出书本中代码均在jupyter notebook编辑，由于我不习惯用，所以我写的代码在ide中。第一章:深度学习基础介绍机器学习与深度学习相关背景知识，不过多赘述。第二章：神经网络数据表示1.初始神经网络–手写数字分类用一个简单事例来初步了解神经网络#...

2019-02-21 20:13:51 1473

高光谱解混数据集（Cuprite，矿区图）

Cuprite（矿区图）是高光谱解混研究的最基准数据集，涵盖美国内华达州拉斯维加斯的Cuprite矿区，原始数据有224个波段，从370nm至2480nm。在移除有噪声的通道（1--2和221-224）和吸水通道（104-113和148-167）后，仍然有188个通道。250×190个像素的区域被认为存在14种矿物。由于类似矿物的变体之间存在细微差别，最终确定为12名成员，总结如下"#1 Alunite", "#2 Andradite", "#3 Buddingtonite", "#4 Dumortierite", "#5 Kaolinite1", "#6 Kaolinite2", "#7 Muscovite", "#8 Montmorillonite", "#9 Nontronite", "#10 Pyrope", "#11 Sphene", "#12 Chalcedony".

2019-04-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

qq_41718518的博客