机器学习
文章平均质量分 79
爱做梦真是太好了
开发工程师(java c) 算法工程师
展开
-
Google word2vec 环境搭建
Google word2vec 环境搭建分别在linux和windows下搭建,基本步骤包括g++环境搭建word2vec下载执行make命令执行./demo-word.sh命令输入单词具体步骤g++环境搭建它主要是为了word2vec执行 “make ” 命令有效,而且如果有可以省略这一步。判断是否有,在命令窗口输入命令 g++ -vword2vec...原创 2017-10-27 09:20:22 · 5607 阅读 · 41 评论 -
偏差(bias)与方差(variable)的区别,请记住一句话!
偏差大,机器学习模型欠拟合;方差大,机器学习模型过拟合。原创 2020-03-30 17:43:01 · 610 阅读 · 0 评论 -
sklearn的模型训练与预测
目录sklearn的模型训练与预测分类任务流程三步走xgboost算法分类随机森林算法分类sklearn的模型训练与预测sklearn是强大的python机器学习工具,支持丰富的机器学习算法和数据预处理,在学术界和企业中应用广泛,下面是sklearn的代码编写流程和各种算法使用示例(以分类为例)。分类任务流程三步走创建模型对象训练预测与性能评价xgboost算法分类''' *...原创 2020-03-26 10:30:51 · 3829 阅读 · 2 评论 -
scikit-learn下k-Nearest Neighbors、Linear SVM、RBF SVM、决策树、随机森林、Adaboost、Naive bayes、LDA、QDA算法示例代码(dem)
scikit-learn版本:0.21.3scikit-learn对机器学习相关的算法API支持很好,这里是简单的示例代码,可以为我们提高参考。代码如下:import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn.model_selec...原创 2019-09-02 17:39:50 · 444 阅读 · 0 评论 -
神经网络实现(一)(基于Java)
设计了三个类神经元package org.nn.component;/** * 神经元<hr> * 创建方式如:<br> * Neural neural = new Neural(1.2125);// 输入参数为神经元的输入值,类型了double * @author原创 2018-05-09 22:30:55 · 3663 阅读 · 0 评论 -
Python版本的tensorflow所遇到的问题
问题一:安装所遇到的问题 环境:windows 10 64位、Python36 主要问题在于Python与tensorflow不一致,应该保证它们都是64位的。还有就是命令要正确 cpu版的命令是:pip3 install --upgrade tensorflow如果不行的话,就看英文官方文档8,不容易出错。 注意:tensorflow在windows上不支持3...原创 2018-04-12 08:46:42 · 5627 阅读 · 0 评论 -
多标签分类算法技术细节笔记
一:多标签分类算法阈值函数(Threshold Calibration) 这里的阈值函数是指:对于每一个标签的预测值,当它达到多少时被判定为此标签存在,小于多少时被判定为词标签不存在。 主要有两种阈值函数:常数阈值函数和基于训练集的阈值函数。1. 常数阈值函数常见的选择为0或者0.5。比如取0.5,当给定标签预测值大于它时,被判定为存在,反之不存在。2. 基于训...原创 2018-04-11 16:18:04 · 3904 阅读 · 2 评论 -
中文分词之HMM模型详解
转载于:https://yanyiwu.com/work/2014/04/07/hmm-segment-xiangjie.html关于HMM模型的介绍,网上的资料已经烂大街,但是大部分都是在背书背公式,本文在此针对HMM模型在中文分词中的应用,讲讲实现原理。尽可能的撇开公式,撇开推导。结合实际开源代码作为例子,争取做到雅俗共赏,童叟无欺。没有公式,就没有伤害。模型介绍第一次听说HMM模型是从李开复...转载 2017-08-25 10:50:24 · 927 阅读 · 0 评论 -
机器学习初识
课程名称Neural Networks for Machine Learning机器学习分类有监督学习 预测或者分类的结果是事先知道的。如:对于预测问题,事先知道了具体预测值或者值的范围;分类问题,类别是事先知道的(其实分类问题都是有监督学习,因为分类问题隐含给出了分类结果)。 典型的有监督学习是分类问题、回归问题。 根据问题结果是连续值还是离散值,将其...原创 2018-03-11 11:14:43 · 350 阅读 · 0 评论 -
回归问题实战一
数据集每条数据的预测值只有一个,属于连续值。 数据为数值类型。实现代码import pandas as pdfrom keras.layers import Dense, Activationfrom keras.models import Sequential# 加载数据data_train = pd.read_csv("dat/d_train_20180102.cs原创 2018-01-29 14:52:53 · 453 阅读 · 0 评论