2020年04月_口袋里的小小哥

11月 10月 09月 08月 06月 05月 04月 03月 01月

原创细究 tensorflow 常用函数+ 常用参数

import numpyimport tensorflow as tf# 创建全为0的张量# tf.zeros(维度) 1维直接写个数 2维[行，列] ，多维[n,m,j]# tf.zeros([2,4])# tf.ones(4)# tf.fill([2,2],9)# tf.random.uniform(维度，minval=最小值，maxval=最大值)# tf.rand...

2020-04-10 16:22:50 133

原创找遍全网最简单的使用git

2、进行基础配置，作为 git 的基础配置，作用是告诉 git 你是谁，你输入的信息将出现在你创建的提交中，使用下面两条命令：　　git config --global user.name"你的名字或昵称"　　git config --global user.email"你的邮箱"3.、在你自己人员文件夹中执行下面命令，完成初始化 git init ...

2020-04-10 10:33:16 134

原创调参优化

import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt(train_image, train_lable), (test_image, test_label) = tf.keras.datasets.fashion_mnist.load_data()trai...

2020-04-09 16:05:44 162

原创 tensorflow简单小结

# 连续的值直接输出结果# 二分类输出层做一个sigmoid运算# 多分类　输出做一个 softmax 得到概率分布# 学习速率（超参数） learning rate（lr）：对梯度进行缩放的参数被称为学习速率# 常见的优化函数# 优化器 optimizer 是编译模型所需的俩个参数之一# model.complie() 来调用# SGD：随机梯度下降优化器# RMS...

2020-04-09 16:05:14 98

原创 softmax 独热编码

import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt# fashion_mnist = tf.keras.datasets.fashion_mnist.load_data()(train_image, train_lable), (test_image, ...

2020-04-09 16:04:40 302

原创分类问题的时候用交叉熵损失函数会更有效

# 分类问题的时候用交叉熵损失函数会更有效# binary_crossentropy 来计算二元交叉熵import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('credit-a.csv', header=None)# ...

2020-04-09 16:03:56 336

原创 tensorflow 激活函数，多层感知器

# 激活函数# 1.relu 屏蔽掉为0的# 2.sigmoid 输出范围 x轴靠近0，梯度变化大，，远离0的时候，就变化很小# 3.tanh 范围-1 到 +1# 4.leak reluimport tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltda...

2020-04-09 16:02:37 109

原创初探 TensorFlow

import tensorflow as tfimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('TensorFlow学历与收入预测.csv')# print(data)plt.scatter(data.Education, data.Income)# plt.show()# 单变量线性回归...

2020-04-08 14:23:34 120

原创 day 9.2 逻辑回归-案例-评分卡制作

import numpy as npimport pandas as pdpd.set_option('display.max_columns', None)from sklearn.linear_model import LogisticRegression as LRdata = pd.read_csv('评分卡模型数据.csv')# print(data.head())# ...

2020-04-07 16:53:33 347

原创 day 9.1 逻辑回归-二元回归与多元回归

# todo 重要参数 solver & multi_class# multi_class 输入告知模型，我们要处理分类问题的模型# 1. 输入 'ovr' 处理二分类，或者让模型使用‘一对多’的形式来处理多分类问题# 2.'multinomial' 处理多分类，这种输入在参数solverwe是linlinear时不可用# 3.'auto' ...

2020-04-07 16:52:43 1818

原创 day 9.0 逻辑回归- 梯度下降

# max_iter 控制步长# max_iter越大，步长越小，迭代次数大，模型时间长，反之from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport matplotlib.pyplot ...

2020-04-07 16:51:37 135

原创万能　随机森林回归　补缺函数

＃＃＃＃＃ｔｏｄｏ　　只对一列数据含有缺失，另外的数据都不含缺失值的数据有效def fill_missing_rf(X, Y, to_fill): """ 使用随机森林填补一个特征的缺失值的函数 :param X: 要填补的特征矩阵 :param Y: 完整的，没有缺失值的标签 :param to_fill: 字符串，要填补的那一列的名称 :r...

2020-04-07 16:49:55 319

原创 day 8.6 逻辑回归-特征过程

# 方法1.自己分析# ＰＣＡ　和　ＳＶＤ　一般用不上# 方法2. 统计方法可以使用，但没必要# todo: 高效的嵌入法from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport...

2020-04-07 09:05:48 158

原创 day 8.5 逻辑回归-正则化参数

# linear_model.LogisticRegression 逻辑回归回归分类器（又叫logit回归，最大熵分类器）# linear_model.LogisticRegressionCV 带交叉验证的逻辑回归分类器# linear_model.logistic_regression_path 计算Logistic回归模型以获得正则化参数的列表# linear_model....

2020-04-07 09:04:42 973

原创 day 8.3 PCA 降噪

from sklearn.datasets import load_digits # 一个蛮好的系统自带手写数据集from sklearn.decomposition import PCAimport matplotlib.pyplot as pltimport numpy as npdigits = load_digits()# print(digits.data)# pri...

2020-04-02 15:06:43 184

原创 day 8.2 PCA重要接口 inverse_transform

from sklearn.datasets import fetch_lfw_peoplefrom sklearn.decomposition import PCAimport matplotlib.pyplot as pltimport numpy as np# 导数据faces = fetch_lfw_people(min_faces_per_person=60) # 每个人取...

2020-04-02 15:04:43 1005 1

原创 day 8.1 PCA人脸识别重要属性components_

from sklearn.datasets import fetch_lfw_peoplefrom sklearn.decomposition import PCAimport matplotlib.pyplot as pltimport numpy as npfaces = fetch_lfw_people(min_faces_per_person=60) # 每个人取出60张图...

2020-04-02 15:03:38 1630

原创 day 8.0 降维算法 PCA

# PCA和SVDfrom sklearn.decomposition import PCA# PCA(n_components=None# , copy=True# , whiten=False# , svd_solver='auto'# , tol=0.0# , iterated_power='auto'# , random_s...

2020-04-02 15:02:28 133

原创 day 7 特征选择

import pandas as pdimport numpy as npdata = pd.read_csv("digit recognizor.csv")# print(data.head())x = data.iloc[:, 1:]y = data.iloc[:, 0]# print(x.shape) ##(42000, 784)"""数据量相对夸张，如果使用支持向量机...

2020-04-01 14:38:11 185

mysql+mongodb+可视化界面 .msi可执行包

数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。数据库是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合，可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据进行新增、查询、更新、删除等操作，一键安装，省事省心

2020-08-04

python-3.5.4-amd64.exe

可直接执行的安装包，省去繁琐操作，直接下载安装 Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell)，随着版本的不断更新和语言新功能的添加，越多被用于独立的、大型项目的开发

2020-08-04

kaggle房价预测数据集.rar

比赛概述影响房价的因素有很多，在本题的数据集中有79个变量几乎描述了爱荷华州艾姆斯（爱荷华州艾姆斯）住宅的方方面面，要求预测最终的房价。技术栈特征工程（创意要素工程）回归模型（高级回归技术，例如随机森林和梯度增强）最终目标预测出每间房屋的价格，对于测试集中的每一个Id，指定SalePrice变量相应的值。学无止尽

2020-04-29

TensorFlow预测学历收入数据.csv

对已经发生过的事实的影响因素当作输入，事件结果当作输出以此来发现事物之间的规律，来预测短暂未来中是否会发生某件事情的概率，或者收入估值实际上任何的预测回归问题，都可以通过 tensorflow的深度学习来实现预测分析

2020-04-08

因为教程中涉及一些数据用于建模的，这些数据是整理好的，供大家下载 (150000, 11)行，列，数据内容是银行的制作评分卡数据，用评分本质上是模式识别中的一类分类问题，将企业或者个体消费者划分为能够按期还本付息（即“好”客户）和违约（即“坏”）两类。具体做法是根据历史数据中的样本，从已知的数据中找出违约及不违约客户的特征，从而总结出分类的规则，建立数学模型，用于测量价款人的违约风险（或者违约概率），为消费信贷决策提供依据。

2020-04-07

digit recognizor.rar

Kaggle是一个大数据的众包平台，也是一个很好的项目实践场所。Kaggle的项目分为练习项目和奖励项目。今天写的Digit Recognizer属于练习项目，最后的结果只按照测试集的正确率计算排名，没有奖励。解决方案的python代码在Github开源平台上。 Digit Recognizer任务此任务是在MNIST（一个带Label的数字像素集合）上训练一个数字分类器，训练集的大小为42000个training example，每个example是28*28=784个灰度像素值和一个0~9的label。最后的排名以在测试集合上的分类正确率为依据排名

2020-04-02

缺失预处理数据22222.csv

缺失预处理数据22222.csv，用于学习缺失值处理的数据 impute.SimpleImputer 这个类是专门用来填补缺失值的。它包括四个重要参数 missing_values 告诉SimpleImputer，数据中的缺失值长什么样，默认空值np.nan strategy 我们填补缺失值的策略，默认均值。输入“mean”使用均值填补（仅对数值型特征可用）输入“median"用中值填补（仅对数值型特征可用）输入"most_frequent”用众数填补（对数值型和字符型特征都可用）输入“constant"表示请参考参数“fill_value"中的值（对数值型和字符型特征都可用） fill_value 当参数startegy为”constant"的时候可用，可输入字符串或数字表示要填充的值，常用0 copy 默认为True，将创建特征矩阵的副本，反之则会将缺失值填补到原本的特征矩阵中去。

2020-03-31

泰坦尼克号数据用于机器学习.rar

泰坦尼克号生存者预测数据，用于机器学习各方面，数据预测，建模等等，生存与否与性别，年龄，阶层等因素是有关系的，如果把这些因素作为特征，生存的结果作为预测目标，就可以建立一个典型的二分类机器学习模型。在这个项目中提供了部分的乘客名单，包括各种维度的特征以及是否幸存的标签，存在train.csv文件中，这是我们训练需要的数据；另一个test.csv文件是我们需要预测的乘客名单，只有相应的特征。我们要做的工作就是通过对训练数据的特征与生存关系进行探索，构建合适的机器学习的模型，再用这个模型预测测试文件中乘客的幸存情况，并将结果保存提交给kaggle。

2020-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

口袋里的小小哥的博客

原创细究 tensorflow 常用函数+ 常用参数

原创找遍全网最简单的使用git

原创调参优化

原创 tensorflow简单小结

原创 softmax 独热编码

原创分类问题的时候用交叉熵损失函数会更有效

原创 tensorflow 激活函数，多层感知器

原创初探 TensorFlow

原创 day 9.2 逻辑回归-案例-评分卡制作

原创 day 9.1 逻辑回归-二元回归与多元回归

原创 day 9.0 逻辑回归- 梯度下降

原创万能　随机森林回归　补缺函数

原创逻辑回归求解器简介

原创 day 8.6 逻辑回归-特征过程

原创 day 8.5 逻辑回归-正则化参数

原创 day 8.3 PCA 降噪

原创 day 8.2 PCA重要接口 inverse_transform

原创 day 8.1 PCA人脸识别重要属性components_

原创 day 8.0 降维算法 PCA

原创 day 7 特征选择

测试数据测试数据测试数据

基于孪生神经网络实现的点选识别

mysql+mongodb+可视化界面 .msi可执行包

python-3.5.4-amd64.exe

kaggle房价预测数据集.rar

TensorFlow预测学历收入数据.csv

逻辑回归用于制作评分卡数据csv源.rar

digit recognizor.rar

缺失预处理数据22222.csv

泰坦尼克号数据用于机器学习.rar

空空如也

测试数据 测试数据测试数据

基于孪生神经网络实现的点选识别

mysql+mongodb+可视化界面 .msi可执行包

python-3.5.4-amd64.exe

kaggle房价预测数据集.rar

TensorFlow预测学历收入数据.csv

逻辑回归用于制作评分卡数据csv源.rar

digit recognizor.rar

缺失预处理数据22222.csv

泰坦尼克号数据用于机器学习.rar

空空如也

测试数据测试数据测试数据