自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (8)
  • 收藏
  • 关注

原创 细究 tensorflow 常用函数+ 常用参数

import numpyimport tensorflow as tf# 创建全为0的张量# tf.zeros(维度) 1维直接写个数 2维[行,列] ,多维[n,m,j]# tf.zeros([2,4])# tf.ones(4)# tf.fill([2,2],9)# tf.random.uniform(维度,minval=最小值,maxval=最大值)# tf.rand...

2020-04-10 16:22:50 133

原创 找遍全网最简单的使用git

2、进行基础配置,作为 git 的基础配置,作用是告诉 git 你是谁,你输入的信息将出现在你创建的提交中,使用下面两条命令:  git config --global user.name"你的名字或昵称"  git config --global user.email"你的邮箱"3.、在你自己人员文件夹中执行下面命令,完成初始化 git init ...

2020-04-10 10:33:16 134

原创 调参优化

import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt(train_image, train_lable), (test_image, test_label) = tf.keras.datasets.fashion_mnist.load_data()trai...

2020-04-09 16:05:44 162

原创 tensorflow简单小结

# 连续的值 直接输出结果# 二分类 输出层 做一个sigmoid运算# 多分类 输出做一个 softmax 得到概率分布# 学习速率(超参数) learning rate(lr): 对梯度进行缩放的参数被称为学习速率# 常见的优化函数# 优化器 optimizer 是编译模型所需的俩个参数之一# model.complie() 来调用# SGD:随机梯度下降优化器# RMS...

2020-04-09 16:05:14 98

原创 softmax 独热编码

import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt# fashion_mnist = tf.keras.datasets.fashion_mnist.load_data()(train_image, train_lable), (test_image, ...

2020-04-09 16:04:40 302

原创 分类问题的时候用交叉熵损失函数会更有效

# 分类问题的时候用交叉熵损失函数会更有效# binary_crossentropy 来计算二元交叉熵import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('credit-a.csv', header=None)# ...

2020-04-09 16:03:56 336

原创 tensorflow 激活函数,多层感知器

# 激活函数# 1.relu 屏蔽掉 为0的# 2.sigmoid 输出范围 x轴靠近0,梯度变化大,,远离0的时候,就变化很小# 3.tanh 范围-1 到 +1# 4.leak reluimport tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltda...

2020-04-09 16:02:37 109

原创 初探 TensorFlow

import tensorflow as tfimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('TensorFlow学历与收入预测.csv')# print(data)plt.scatter(data.Education, data.Income)# plt.show()# 单变量线性回归...

2020-04-08 14:23:34 120

原创 day 9.2 逻辑回归-案例-评分卡制作

import numpy as npimport pandas as pdpd.set_option('display.max_columns', None)from sklearn.linear_model import LogisticRegression as LRdata = pd.read_csv('评分卡模型数据.csv')# print(data.head())# ...

2020-04-07 16:53:33 347

原创 day 9.1 逻辑回归-二元回归与多元回归

# todo 重要参数 solver & multi_class# multi_class 输入告知模型,我们要处理分类问题的模型# 1. 输入 'ovr' 处理二分类,或者让模型使用‘一对多’的形式来处理多分类问题# 2.'multinomial' 处理多分类,这种输入在参数solverwe是linlinear时不可用# 3.'auto' ...

2020-04-07 16:52:43 1818

原创 day 9.0 逻辑回归- 梯度下降

# max_iter 控制步长# max_iter越大,步长越小,迭代次数大,模型时间长,反之from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport matplotlib.pyplot ...

2020-04-07 16:51:37 135

原创 万能  随机森林回归 补缺函数

#####todo  只对一列数据含有缺失,另外的数据都不含缺失值的数据有效def fill_missing_rf(X, Y, to_fill): """ 使用随机森林填补一个特征的缺失值的函数 :param X: 要填补的特征矩阵 :param Y: 完整的,没有缺失值的标签 :param to_fill: 字符串,要填补的那一列的名称 :r...

2020-04-07 16:49:55 319

原创 逻辑回归 求解器简介

2020-04-07 13:42:26 250

原创 day 8.6 逻辑回归-特征过程

# 方法1.自己分析# PCA 和 SVD 一般用不上# 方法2. 统计方法可以使用,但没必要# todo: 高效的嵌入法from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport...

2020-04-07 09:05:48 158

原创 day 8.5 逻辑回归-正则化参数

# linear_model.LogisticRegression 逻辑回归回归分类器(又叫logit回归,最大熵分类器)# linear_model.LogisticRegressionCV 带交叉验证的逻辑回归分类器# linear_model.logistic_regression_path 计算Logistic回归模型以获得正则化参数的列表# linear_model....

2020-04-07 09:04:42 973

原创 day 8.3 PCA 降噪

from sklearn.datasets import load_digits # 一个蛮好的系统自带手写数据集from sklearn.decomposition import PCAimport matplotlib.pyplot as pltimport numpy as npdigits = load_digits()# print(digits.data)# pri...

2020-04-02 15:06:43 184

原创 day 8.2 PCA重要接口 inverse_transform

from sklearn.datasets import fetch_lfw_peoplefrom sklearn.decomposition import PCAimport matplotlib.pyplot as pltimport numpy as np# 导数据faces = fetch_lfw_people(min_faces_per_person=60) # 每个人取...

2020-04-02 15:04:43 1005 1

原创 day 8.1 PCA人脸识别 重要属性components_

from sklearn.datasets import fetch_lfw_peoplefrom sklearn.decomposition import PCAimport matplotlib.pyplot as pltimport numpy as npfaces = fetch_lfw_people(min_faces_per_person=60) # 每个人取出60张图...

2020-04-02 15:03:38 1630

原创 day 8.0 降维算法 PCA

# PCA和SVDfrom sklearn.decomposition import PCA# PCA(n_components=None# , copy=True# , whiten=False# , svd_solver='auto'# , tol=0.0# , iterated_power='auto'# , random_s...

2020-04-02 15:02:28 133

原创 day 7 特征选择

import pandas as pdimport numpy as npdata = pd.read_csv("digit recognizor.csv")# print(data.head())x = data.iloc[:, 1:]y = data.iloc[:, 0]# print(x.shape) ##(42000, 784)"""数据量相对夸张,如果使用支持向量机...

2020-04-01 14:38:11 185

测试数据 测试数据测试数据

测试用

2023-08-18

基于孪生神经网络实现的点选识别

基于孪生神经网络实现的点选识别

2023-08-18

mysql+mongodb+可视化界面 .msi可执行包

数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。 数据库是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合,可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、查询、更新、删除等操作,一键安装,省事省心

2020-08-04

python-3.5.4-amd64.exe

可直接执行的安装包,省去繁琐操作,直接下载安装 Python是一种跨平台的计算机程序设计语言。 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发

2020-08-04

kaggle房价预测数据集.rar

比赛概述 影响房价的因素有很多,在本题的数据集中有79个变量几乎描述了爱荷华州艾姆斯(爱荷华州艾姆斯)住宅的方方面面,要求预测最终的房价。 技术栈 特征工程(创意要素工程) 回归模型(高级回归技术,例如随机森林和 梯度增强) 最终目标 预测出每间房屋的价格,对于测试集中的每一个Id,指定SalePrice变量相应的值。 学无止尽

2020-04-29

TensorFlow预测学历收入数据.csv

对已经发生过的事实的影响因素当作输入, 事件结果当作输出 以此来发现事物之间的规律,来预测 短暂未来中是否会发生某件事情的概率,或者收入估值 实际上 任何 的预测回归问题,都可以通过 tensorflow的深度学习来实现 预测分析

2020-04-08

逻辑回归用于制作评分卡数据csv源.rar

因为教程中涉及一些数据用于建模的,这些数据是整理好的,供大家下载 (150000, 11)行,列,数据内容是银行的制作评分卡数据,用评分本质上是模式识别中的一类分类问题,将企业或者个体消费者划分为能够按期还本付息(即“好”客户)和违约(即“坏”)两类。 具体做法是根据历史数据中的样本,从已知的数据中找出违约及不违约客户的特征,从而总结出分类的规则,建立数学模型,用于测量价款人的违约风险(或者违约概率),为消费信贷决策提供依据。

2020-04-07

digit recognizor.rar

Kaggle是一个大数据的众包平台,也是一个很好的项目实践场所。Kaggle的项目分为练习项目和奖励项目。今天写的Digit Recognizer属于练习项目,最后的结果只按照测试集的正确率计算排名,没有奖励。解决方案的python代码在Github开源平台上。 Digit Recognizer任务 此任务是在MNIST(一个带Label的数字像素集合)上训练一个数字分类器,训练集的大小为42000个training example,每个example是28*28=784个灰度像素值和一个0~9的label。最后的排名以在测试集合上的分类正确率为依据排名

2020-04-02

缺失预处理数据22222.csv

缺失预处理数据22222.csv,用于学习缺失值处理的数据 impute.SimpleImputer 这个类是专门用来填补缺失值的。它包括四个重要参数 missing_values 告诉SimpleImputer,数据中的缺失值长什么样,默认空值np.nan strategy 我们填补缺失值的策略,默认均值。 输入“mean”使用均值填补(仅对数值型特征可用) 输入“median"用中值填补(仅对数值型特征可用) 输入"most_frequent”用众数填补(对数值型和字符型特征都可用) 输入“constant"表示请参考参数“fill_value"中的值(对数值型和字符型特征都可用) fill_value 当参数startegy为”constant"的时候可用,可输入字符串或数字表示要填充的值,常用0 copy 默认为True,将创建特征矩阵的副本,反之则会将缺失值填补到原本的特征矩阵中去。

2020-03-31

泰坦尼克号数据用于机器学习.rar

泰坦尼克号生存者预测数据,用于 机器学习各方面,数据预测,建模等等,生存与否与性别,年龄,阶层等因素是有关系的,如果把这些因素作为特征,生存的结果作为预测目标,就可以建立一个典型的二分类机器学习模型。在这个项目中提供了部分的乘客名单,包括各种维度的特征以及是否幸存的标签,存在train.csv文件中,这是我们训练需要的数据;另一个test.csv文件是我们需要预测的乘客名单,只有相应的特征。我们要做的工作就是通过对训练数据的特征与生存关系进行探索,构建合适的机器学习的模型,再用这个模型预测测试文件中乘客的幸存情况,并将结果保存提交给kaggle。

2020-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除