机器学习
文章平均质量分 73
赛博行者
这个作者很懒,什么都没留下…
展开
-
相似性度量总结
cosineJaccard系数(杰卡德系数)cosine更适合稠密空间,Jaccard和tfidf都适合稀疏空间.狭义Jaccard相似度,计算两个集合之间的相似程度,元素的“取值”为0或1对集合A和B,Jaccard相似度计算如下:Jaccard(A, B)= |A intersectB| / |A union B|相似度数值在[0, 1]之间,当A==B的时候,为1. 优缺点,...原创 2020-02-06 19:37:51 · 1201 阅读 · 0 评论 -
randomforest&GradientBoosting
!/usr/bin/env python3-- coding: utf-8 --“”” Created on Tue Mar 14 14:39:19 2017@author: dreamer “”” import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets im原创 2017-03-14 15:49:09 · 1325 阅读 · 0 评论 -
train_test_split(X, y, stratify=y)
from sklearn.model_selecting import train_test_spilt() 参数stratify: 依据标签y,按原数据y中各类比例,分配给train和test,使得train和test中各类数据的比例与原数据集一样。 A:B:C=1:2:3 split后,train和test中,都是A:B:C=1:2:3 将stratify=X就是按照X中的比例分配 将原创 2017-03-14 14:26:09 · 35888 阅读 · 1 评论 -
sklearn.preprocessing
转载自:http://2hwp.com/2016/02/03/data-preprocessing/常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Variance Scaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去转载 2017-03-28 16:13:09 · 914 阅读 · 0 评论 -
grid_search_error
I’m trying to get to grips with sci-kit learn for some simple machine learning projects but I’m coming unstuck with Pipelines and wonder what I’ve done wrong…I’m trying to work through a tutorial on Ka翻译 2017-03-28 00:54:30 · 642 阅读 · 0 评论 -
Tensorflow 网站host
1.最近Tensorflow1.0发布,但是官网上不去,科学上网也上不去,在github上有人提供修改hosts文件的方法(64.233.188.121 www.tensorflow.org )2.Linuxhosts文件在/ext/hosts内 ,需要root权限修改。vim /ext/hosts3.win7 hosts文件位置C:\W原创 2017-03-03 19:57:20 · 1692 阅读 · 0 评论 -
跟着TensorFlow的进阶级教程实现MNIST库的训练
背景介绍代码实现及结果小问题 ResourceExhaustedError的原因及解决方式Saver()进行模型存储及恢复再说一下DL的运行时间吧小结优质资源分享背景介绍做这件事的初衷有二: ①做完入门级的,自然要进阶一下。 ②之前做到的准确率只有92%,据说进阶版可以把准确率做到99.2% 步骤还是参考TensorFlow的中文教程,自然没有上次那么简单,有些坑掉进去了,好歹转载 2017-03-06 21:35:48 · 527 阅读 · 0 评论 -
Tensorflow学习笔记
Tensorflow学习笔记(3) (2016-02-22 15:39:01)转载▼ var tag=″;vartag='';转载 2017-03-06 00:13:24 · 455 阅读 · 0 评论 -
Tensorboard学习
对官网Deep MNIST for Experts的例程做了可视化修改from tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets('MNIST_data', one_hot=True)import numpy as npimport tensorflo原创 2017-03-06 21:38:33 · 413 阅读 · 0 评论 -
pandas.DataFrame.to_csv
pandas.DataFrame.to_csvDataFrame.to_csv(path_or_buf=None, sep=’, ’, na_rep=”, float_format=None, columns=None, header=True, index=True, index_label=None, mode=’w’, encoding=None, compression=None, quot转载 2017-03-19 19:25:59 · 11226 阅读 · 0 评论 -
KNN:Strengths, weaknesses, and parameters
Strengths, weaknesses, and parameters In principle, there are two important parameters to the KNeighbors classifier: the number of neighbors and how you measure distance between data points. In pract翻译 2017-03-09 11:07:10 · 868 阅读 · 0 评论 -
四种激活函数(Relu Linear Sigmoid Tanh)
整流器(神经网络)https://en.wikipedia.org/wiki/Rectifier_(neural_networks)Rectifier (neural networks)维基百科,自由的百科全书整流器(蓝色)和softplus(绿色)的曲线在x = 0附近起作用在人工神经网络的上下文中,整流器是定义转载 2017-03-05 21:51:56 · 21593 阅读 · 0 评论 -
train_test_split(random_state) [sklearn]
X_train,X_test,y_train,y_test = train_test_split( iris_dataset[‘data’],iris_dataset[‘target’],random_state=0)在SKILEARN中,train_test_split方法有一个参数叫random_state,它的用途是在随机划分训练集和测试集时候,划分的结果并不是那么随机,也即转载 2017-03-08 15:51:49 · 9240 阅读 · 1 评论