自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 资源 (1)
  • 收藏
  • 关注

原创 python操作ES的增、删、改、查(单条数据、批量加载、根据id更新、根据id删除)

废话不多说直接上干货!# ES相关包from elasticsearch import Elasticsearchfrom elasticsearch.helpers import bulk class ElasticSearchClient(object): # 启动ES @staticmethod def get_es_servers(): ...

2019-10-17 17:00:14 3548

原创 ES及Head插件安装

1、 下载EShttps://www.elastic.co/cn/downloads/past-releases#elasticsearch选择版本6.2.42、 启动双击bin目录下双击elasticsearch.bat即可,输入地址在浏览器中输入“http://127.0.0.1:9200/”,出现一下界面,表示启动成功。3、 安装ElasticSearch管理插件安装He...

2019-10-16 15:29:26 378

转载 决策树可视化代码

import osimport timeimport pydotplusimport numpy as npfrom sklearn import treefrom sklearn.externals.six import StringIOfrom sklearn.model_selection import train_test_splitprint('Step 1.Loadi...

2019-01-18 17:11:13 805

转载 决策树模型参数释义

转自https://blog.csdn.net/qq_16000815/article/details/80954039'''scikit-learn中有两类决策树,它们均采用优化的CART决策树算法。'''from sklearn.tree import DecisionTreeRegressor'''回归决策树'''DecisionTreeRegressor(criterio...

2019-01-18 17:04:07 4687

转载 流行的机器学习数据集

机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。本文作为学习研究数据系列博文的开篇,列举了4个最流行的机器学习数据集。IrisIris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,V...

2019-01-18 17:00:29 292

原创 pytorch搭建神经网络(回归)

import torchimport torch.nn.functional as F # 激励函数都在这x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) # x data (tensor), shape=(100, 1)y = x.pow(2) + 0.2*torch.rand(x.size()) ...

2018-06-26 20:11:02 917

原创 pytorch搭建神经网络(回归)

import torchimport torch.nn.functional as F # 激励函数都在这x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) # x data (tensor), shape=(100, 1)y = x.pow(2) + 0.2*torch.rand(x.size()) ...

2018-06-26 20:08:37 2993

原创 sklearn实战:对文档进行聚类分析(KMeans算法)

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom time import timefrom sklearn.datasets import load_filesprint("loading documents ...")t = time()docs = load_files('dat...

2018-06-10 14:54:22 3144 1

原创 sklearn实战:KMeans算法

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import make_blobsX, y = make_blobs(n_samples=200, n_features=2, cen...

2018-06-10 14:51:10 1137

原创 sklearn实战:文档分类预测(朴素贝叶斯算法)

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom time import timefrom sklearn.datasets import load_filesprint("loading train dataset ...")t = time()news_train = load_...

2018-06-09 21:56:11 1541

原创 sklearn实战:SVM(线性核函数,多项式核函数,高斯核函数比较)

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npdef plot_hyperplane(clf, X, y, h=0.02, draw_sv=True, title='hype...

2018-06-08 14:25:55 23209

原创 kaggle:预测泰坦尼克号幸存者(决策树算法,网格搜索模型参数调优)

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport pandas as pddef read_dataset(fname): # 指定第一列作为行索引 data = pd.read_csv(fname, index_col=0) #列索引为csv文件第一行 ...

2018-06-07 22:13:53 3367

原创 bagging,random forest,boosting(adaboost、GBDT),XGBoost小结

Bagging从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping(有放回)的方法抽取n个训练样本(在训练集中,有些样本可能被多次抽取到,而有些样本可能一次都没有被抽中)。共进行k轮抽取,得到k个训练集。(我们这里假设k个训练集之间是相互独立的,事实上不是完全独立)每次使用一个训练集得到一个模型,k个训练集共得到k个模型。但是是同种模型。(注:k个训练集虽然有重合不完全...

2018-06-07 20:34:02 726

转载 Kaggle:Predicting a Biological Response

地址戳我 # 基本CSV读写操作 # 我们需要读取给定的训练数据,再进行后续的数据(特征等)处理 def read_data(file_name): f = open(file_name) #ignore header f.readline() samples = [] target =...

2018-06-07 15:58:20 618

转载 Kaggle:San Francisco Crime Classification

比赛地址https://www.kaggle.com/c/sf-crime 这里用logistic regression来完成这个预测问题。 # 基本CSV读写操作 # 我们需要读取给定的训练数据,再进行后续的数据(特征等)处理def read_data(file_name): f = open(file_name) #ignore header ...

2018-06-07 15:54:12 855

原创 sklearn实战:乳腺癌检测(逻辑回归算法)

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np# 载入数据from sklearn.datasets import load_breast_cancercancer = load_breast_cancer()X = cancer.datay = cancer.targetprint('...

2018-06-07 15:35:31 8292 1

原创 sklearn实战:房价预测(线性回归)

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import load_bostonboston = load_boston()X = boston.datay = boston.targetX.shape(506, 13)X[0]...

2018-06-07 10:15:55 2139

原创 sklearn实战:使用线性回归算法拟合正弦函数

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npn_dots = 200X = np.linspace(-2 * np.pi, 2 * np.pi, n_dots)Y = np.sin(X) + 0.2 * np.random.rand(n_dots) - 0.1X = X.reshape(-...

2018-06-07 10:14:20 5118

原创 sklearn实战:使用knn进行回归拟合

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np# 生成训练样本n_dots = 40X = 5 * np.random.rand(n_dots, 1)y = np.cos(X).ravel()# 添加一些噪声y += 0.2 * np.random.rand(n_dots) - 0.1...

2018-06-06 20:21:22 4810

原创 sklearn实战:糖尿病预测(knn算法)

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport pandas as pd# 加载数据data = pd.read_csv('datasets/pima-indians-diabetes/diabetes.csv')print('dataset shape {}'.for...

2018-06-06 20:19:10 7337 4

原创 sklearn实战:使用knn算法进行分类及可视化

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets.samples_generator import make_blobs# 生成数据centers = [[-2, 2], [2, 2], [0, 4]]X, y = make_blobs(n_sample...

2018-06-06 18:10:54 8857

原创 sklearn实战:Kaggle自行车租赁预测(岭回归,支持向量回归,随机森林回归)

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsdf_train=pd.read_csv('kaggle_bike_competition_train.csv',header = 0)df_train.head(10)...

2018-06-05 20:11:05 2745 1

原创 自行车租赁数据分析与可视化案例

import pandas as pd # 读取数据到DataFrameimport urllib.request # 获取网络数据import shutil # 文件操作import zipfile # 压缩解压import os# 建立临时目录try: os.system('mkdir bike_data')except: os.system('rm -rf b...

2018-06-04 20:04:16 3488 1

原创 Python pandas 入门

数据结构Series构造和初始化Seriesimport pandas as pdimport numpy as npSeries是一个一维的数据结构s = pd.Series([7, 'Beijing', 2.17, -1232, 'Happy birthday!'])s0 71 Beijing2...

2018-06-03 22:20:42 366

原创 用Numpy写一个Softmax

softmax计算exponential按行求和每一行都要除以计算的和m = np.random.rand(10,10) * 10 + 1000print(m)[[ 1008.64304012 1001.25079229 1006.81896868 1005.89015258 1008.8915297 1001.84923866 1005.53509734 ...

2018-06-03 15:41:54 4292 1

原创 Python Numpy 入门

import numpy as npArrays/数组看你数组的维度啦,我自己的话比较简单粗暴,一般直接把1维数组就看做向量/vector,2维数组看做2维矩阵,3维数组看做3维矩阵…可以调用np.array去从list初始化一个数组:a = np.array([1, 2, 3])print(a)[1 2 3]print(type(a))<clas...

2018-06-03 15:35:22 286

原创 本地yum仓库的安装配置

两种方式: a、每一台机器都配一个本地文件系统上的yum仓库 file:///packege/path/ b、在局域网内部配置一台节点(server-base)的本地文件系统yum仓库,然后将其发布到web服务器中,其他节点就可以通过http://server-base/pagekege/path/(一台虚拟机机器上有,其他机器通过http下载)制作流程:  先挑选一台机器mini4,挂载一个系统...

2018-03-09 21:21:40 302

原创 801机械设计2017题签

2017题签@(作者:张赫)[801机械设计, 真题详解, Markdown]参考教材为《机械设计濮良贵第九版》非官方标准答案 2017题签填空题1脉动循环应力2残余预紧力3防松4挤压5轴上键槽较深对轴的强度削弱较大6高7弯曲应力过大8质数9上10温升过高胶合1145钢12较高13大14小15提高16大端17蜗轮18角接触球19热平衡计算20深沟球轴承

2017-11-06 23:22:23 829

原创 《笨方法学python》习题43分析

一、涉及函数1、Python 字典(Dictionary) get()方法描述Python 字典(Dictionary) get() 函数返回指定键的值,如果值不在字典中返回默认值。语法get()方法语法:dict.get(key, default=None)参数key -- 字典中要查找的键。default -- 如果指定键的值不存在时,返回该默认值值返回值返回指定键的值,如果值不在字典中返回默...

2017-10-10 19:41:31 3704 1

笨方法学python习题41学习笔记

笨方法学python习题41学习笔记

2017-10-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除