Douhh_sisy-CSDN博客

原创 python操作ES的增、删、改、查（单条数据、批量加载、根据id更新、根据id删除）

废话不多说直接上干货！# ES相关包from elasticsearch import Elasticsearchfrom elasticsearch.helpers import bulk class ElasticSearchClient(object): # 启动ES @staticmethod def get_es_servers(): ...

2019-10-17 17:00:14 3589

原创 ES及Head插件安装

1、下载EShttps://www.elastic.co/cn/downloads/past-releases#elasticsearch选择版本6.2.42、启动双击bin目录下双击elasticsearch.bat即可，输入地址在浏览器中输入“http://127.0.0.1:9200/”，出现一下界面，表示启动成功。3、安装ElasticSearch管理插件安装He...

2019-10-16 15:29:26 419

转载决策树可视化代码

import osimport timeimport pydotplusimport numpy as npfrom sklearn import treefrom sklearn.externals.six import StringIOfrom sklearn.model_selection import train_test_splitprint('Step 1.Loadi...

2019-01-18 17:11:13 819

转载决策树模型参数释义

转自https://blog.csdn.net/qq_16000815/article/details/80954039'''scikit-learn中有两类决策树，它们均采用优化的CART决策树算法。'''from sklearn.tree import DecisionTreeRegressor'''回归决策树'''DecisionTreeRegressor(criterio...

2019-01-18 17:04:07 4723

转载流行的机器学习数据集

机器学习算法需要作用于数据，而数据的本质则决定了应用的机器学习算法是否合适，而数据的质量也会决定算法表现的好坏程度。所以会研究数据，会分析数据很重要。本文作为学习研究数据系列博文的开篇，列举了4个最流行的机器学习数据集。IrisIris也称鸢尾花卉数据集，是一类多重变量分析的数据集。通过花萼长度，花萼宽度，花瓣长度，花瓣宽度4个属性预测鸢尾花卉属于（Setosa，Versicolour，V...

2019-01-18 17:00:29 319

原创 pytorch搭建神经网络（回归）

import torchimport torch.nn.functional as F # 激励函数都在这x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) # x data (tensor), shape=(100, 1)y = x.pow(2) + 0.2*torch.rand(x.size()) ...

2018-06-26 20:11:02 939

原创 pytorch搭建神经网络（回归）

import torchimport torch.nn.functional as F # 激励函数都在这x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) # x data (tensor), shape=(100, 1)y = x.pow(2) + 0.2*torch.rand(x.size()) ...

2018-06-26 20:08:37 3038

原创 sklearn实战：对文档进行聚类分析（KMeans算法）

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom time import timefrom sklearn.datasets import load_filesprint(&amp;amp;amp;quot;loading documents ...&amp;amp;amp;quot;)t = time()docs = load_files('dat...

2018-06-10 14:54:22 3210 1

原创 sklearn实战：KMeans算法

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import make_blobsX, y = make_blobs(n_samples=200, n_features=2, cen...

2018-06-10 14:51:10 1171

原创 sklearn实战：文档分类预测（朴素贝叶斯算法）

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom time import timefrom sklearn.datasets import load_filesprint("loading train dataset ...")t = time()news_train = load_...

2018-06-09 21:56:11 1577

原创 sklearn实战：SVM（线性核函数，多项式核函数，高斯核函数比较）

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npdef plot_hyperplane(clf, X, y, h=0.02, draw_sv=True, title='hype...

2018-06-08 14:25:55 23273

原创 kaggle：预测泰坦尼克号幸存者（决策树算法，网格搜索模型参数调优）

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport pandas as pddef read_dataset(fname): # 指定第一列作为行索引 data = pd.read_csv(fname, index_col=0) #列索引为csv文件第一行 ...

2018-06-07 22:13:53 3414

原创 bagging，random forest，boosting（adaboost、GBDT），XGBoost小结

Bagging从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping（有放回）的方法抽取n个训练样本（在训练集中，有些样本可能被多次抽取到，而有些样本可能一次都没有被抽中）。共进行k轮抽取，得到k个训练集。（我们这里假设k个训练集之间是相互独立的，事实上不是完全独立）每次使用一个训练集得到一个模型，k个训练集共得到k个模型。但是是同种模型。（注：k个训练集虽然有重合不完全...

2018-06-07 20:34:02 756

转载 Kaggle：Predicting a Biological Response

地址戳我 # 基本CSV读写操作 # 我们需要读取给定的训练数据，再进行后续的数据(特征等)处理 def read_data(file_name): f = open(file_name) #ignore header f.readline() samples = [] target =...

2018-06-07 15:58:20 636

转载 Kaggle：San Francisco Crime Classification

比赛地址https://www.kaggle.com/c/sf-crime 这里用logistic regression来完成这个预测问题。 # 基本CSV读写操作 # 我们需要读取给定的训练数据，再进行后续的数据(特征等)处理def read_data(file_name): f = open(file_name) #ignore header ...

2018-06-07 15:54:12 883

原创 sklearn实战：乳腺癌检测（逻辑回归算法）

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np# 载入数据from sklearn.datasets import load_breast_cancercancer = load_breast_cancer()X = cancer.datay = cancer.targetprint('...

2018-06-07 15:35:31 8349 1

原创 sklearn实战：房价预测（线性回归）

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import load_bostonboston = load_boston()X = boston.datay = boston.targetX.shape(506, 13)X[0]...

2018-06-07 10:15:55 2177

原创 sklearn实战：使用线性回归算法拟合正弦函数

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npn_dots = 200X = np.linspace(-2 * np.pi, 2 * np.pi, n_dots)Y = np.sin(X) + 0.2 * np.random.rand(n_dots) - 0.1X = X.reshape(-...

2018-06-07 10:14:20 5146

原创 sklearn实战：使用knn进行回归拟合

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np# 生成训练样本n_dots = 40X = 5 * np.random.rand(n_dots, 1)y = np.cos(X).ravel()# 添加一些噪声y += 0.2 * np.random.rand(n_dots) - 0.1...

2018-06-06 20:21:22 4857

原创 sklearn实战：糖尿病预测（knn算法）

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport pandas as pd# 加载数据data = pd.read_csv('datasets/pima-indians-diabetes/diabetes.csv')print('dataset shape {}'.for...

2018-06-06 20:19:10 7404 4

原创 sklearn实战:使用knn算法进行分类及可视化

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets.samples_generator import make_blobs# 生成数据centers = [[-2, 2], [2, 2], [0, 4]]X, y = make_blobs(n_sample...

2018-06-06 18:10:54 8910

原创 sklearn实战：Kaggle自行车租赁预测（岭回归，支持向量回归，随机森林回归）

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsdf_train=pd.read_csv('kaggle_bike_competition_train.csv',header = 0)df_train.head(10)...

2018-06-05 20:11:05 2794 1

原创自行车租赁数据分析与可视化案例

import pandas as pd # 读取数据到DataFrameimport urllib.request # 获取网络数据import shutil # 文件操作import zipfile # 压缩解压import os# 建立临时目录try: os.system('mkdir bike_data')except: os.system('rm -rf b...

2018-06-04 20:04:16 3557 1

原创 Python pandas 入门

数据结构Series构造和初始化Seriesimport pandas as pdimport numpy as npSeries是一个一维的数据结构s = pd.Series([7, 'Beijing', 2.17, -1232, 'Happy birthday!'])s0 71 Beijing2...

2018-06-03 22:20:42 387

原创用Numpy写一个Softmax

softmax计算exponential按行求和每一行都要除以计算的和m = np.random.rand(10,10) * 10 + 1000print(m)[[ 1008.64304012 1001.25079229 1006.81896868 1005.89015258 1008.8915297 1001.84923866 1005.53509734 ...

2018-06-03 15:41:54 4329 1

原创 Python Numpy 入门

import numpy as npArrays/数组看你数组的维度啦，我自己的话比较简单粗暴，一般直接把1维数组就看做向量/vector，2维数组看做2维矩阵，3维数组看做3维矩阵…可以调用np.array去从list初始化一个数组:a = np.array([1, 2, 3])print(a)[1 2 3]print(type(a))&amp;amp;lt;clas...

2018-06-03 15:35:22 299

原创本地yum仓库的安装配置

两种方式： a、每一台机器都配一个本地文件系统上的yum仓库 file:///packege/path/ b、在局域网内部配置一台节点(server-base)的本地文件系统yum仓库，然后将其发布到web服务器中，其他节点就可以通过http://server-base/pagekege/path/(一台虚拟机机器上有，其他机器通过http下载)制作流程：先挑选一台机器mini4，挂载一个系统...

2018-03-09 21:21:40 316

原创 801机械设计2017题签

2017题签@(作者：张赫)[801机械设计, 真题详解, Markdown]参考教材为《机械设计濮良贵第九版》非官方标准答案 2017题签填空题1脉动循环应力2残余预紧力3防松4挤压5轴上键槽较深对轴的强度削弱较大6高7弯曲应力过大8质数9上10温升过高胶合1145钢12较高13大14小15提高16大端17蜗轮18角接触球19热平衡计算20深沟球轴承

2017-11-06 23:22:23 859

原创《笨方法学python》习题43分析

一、涉及函数1、Python 字典(Dictionary) get()方法描述Python 字典(Dictionary) get() 函数返回指定键的值，如果值不在字典中返回默认值。语法get()方法语法：dict.get(key, default=None)参数key -- 字典中要查找的键。default -- 如果指定键的值不存在时，返回该默认值值返回值返回指定键的值，如果值不在字典中返回默...

2017-10-10 19:41:31 3752 1

Douhh_sisy的博客

原创 python操作ES的增、删、改、查（单条数据、批量加载、根据id更新、根据id删除）

原创 ES及Head插件安装

转载决策树可视化代码

转载决策树模型参数释义

转载流行的机器学习数据集

原创 pytorch搭建神经网络（回归）

原创 pytorch搭建神经网络（回归）

原创 sklearn实战：对文档进行聚类分析（KMeans算法）

原创 sklearn实战：KMeans算法

原创 sklearn实战：文档分类预测（朴素贝叶斯算法）

原创 sklearn实战：SVM（线性核函数，多项式核函数，高斯核函数比较）

原创 kaggle：预测泰坦尼克号幸存者（决策树算法，网格搜索模型参数调优）

原创 bagging，random forest，boosting（adaboost、GBDT），XGBoost小结

转载 Kaggle：Predicting a Biological Response

转载 Kaggle：San Francisco Crime Classification

原创 sklearn实战：乳腺癌检测（逻辑回归算法）

原创 sklearn实战：房价预测（线性回归）

原创 sklearn实战：使用线性回归算法拟合正弦函数

原创 sklearn实战：使用knn进行回归拟合

原创 sklearn实战：糖尿病预测（knn算法）

原创 sklearn实战:使用knn算法进行分类及可视化

原创 sklearn实战：Kaggle自行车租赁预测（岭回归，支持向量回归，随机森林回归）

原创自行车租赁数据分析与可视化案例

原创 Python pandas 入门

原创用Numpy写一个Softmax

原创 Python Numpy 入门

原创本地yum仓库的安装配置

原创 801机械设计2017题签

原创《笨方法学python》习题43分析

笨方法学python习题41学习笔记

空空如也