AI
谁用了尧哥这个昵称
大家好!!!
展开
-
Python神经网络
Keras里的模块介绍下面的这个网址讲的很好,可以用来系统学习。 Keras中文文档Optimizers Optimizers包含了一些优化的方法,比如最基本的随机梯度下降SGD,另外还有Adagrad、Adadelta、RMSprop、AdamObjectives 这是目标函数模块,定义了用什么形式来误差优化,keras提供了mean_squared_error/mse :平均方差 mea原创 2016-12-04 13:46:07 · 2845 阅读 · 1 评论 -
TensorFlow入门-MNIST
1、首先要将tensorflow、tensorboard、numpy等更新到最新版本2、需要先下载mnist数据集,可以在CSDN上找,官网比较慢。数据放在MNIST_data文件夹里面。from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tf# 用来自动下载数据的,mnist是个...原创 2018-11-08 23:37:53 · 298 阅读 · 1 评论 -
Python sklearn 中的SVM示例
Python sklearn 中的SVM示例# -*- coding: utf-8 -*-import pandas as pdfrom numpy.random import shufflefrom sklearn import svmimport joblibfrom sklearn import metricsinputfile = '../Data/moment.csv'...原创 2018-09-26 22:21:40 · 5868 阅读 · 6 评论 -
Spark 2.x 决策树 示例代码-IRIS数据集
数据集下载下载链接代码package Iris;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.ml.Pipeline;import org.apache.spark.ml.PipelineModel;...原创 2018-04-20 21:05:40 · 908 阅读 · 0 评论 -
深度学习-自学手册
人工智能机器学习 神经网络 前馈神经网络:没有回路的 反馈神经网络:有回路的 DNN 深度神经网络 CNN 卷积神经网络 RNN 循环神经网络 LSTM 是RNN的一种,长短期记忆网络 自然语言处理神经网络神经元-分类器 Hebb 学习方法,随机 –类似SGD一篇神经网络入门 BP反向传播,表示很复杂的函数/空间分布 从最后一层往前调整参数,反复循环该操作y=a(wx+b)原创 2017-12-23 21:18:38 · 938 阅读 · 0 评论 -
Python word2vector(含安装环境)
一、安装Anaconda Anaconda下载 因为镜像在国外,最好不要晚上下,一大早下比较好,如果是迅雷会员就无所谓了。 我下的是Anaconda3-5.0.1-Windows-x86_64.exe,给一个百度网盘的链接 百度网盘链接 密码:6jm4 安装在D:\PythonSoftware\Anaconda3下面,自己建立文件夹,路径不能有空格,不能有中文。 安装时一定要勾选 “添原创 2017-11-26 20:16:30 · 12222 阅读 · 5 评论 -
Mahout--最基本的推荐系统的JAVA代码
package mp05.com;import java.io.File;import java.io.IOException;import java.util.List;import org.apache.mahout.cf.taste.common.TasteException;import org.apache.mahout.cf.taste.eval.RecommenderBuild原创 2015-09-10 10:52:02 · 6181 阅读 · 0 评论 -
简单的解释一下查准率和召回率
查准率和召回率(查全率),这两个指标是搜索引擎中经典的度量方法。A:检索到的,相关的 (搜到的也想要的) B:未检索到的,但是相关的 (没搜到,然而实际上想要的) C:检索到的,但是不相关的 (搜到的但没用的) D:未检索到的,也不相关的 (没搜到也没用的)被检索到的越多越好,这是追求“查全率”,即A/(A+B),越大越好。 被检索到的,越相关的越多越好,不相关的越少越好,这是追求“查准率”原创 2015-11-29 20:17:16 · 2348 阅读 · 0 评论 -
python数据质量分析小例子
数据和代码下载地址: http://pan.baidu.com/s/1kVg3KuN#-*- coding: utf-8 -*-import pandas as pdcatering_sale = 'E:/PythonMaterial/chapter3/chapter3/demo/data/catering_sale.xls' #餐饮数据#因为是xls文件,所以用read_excel方法,返原创 2016-09-20 16:45:15 · 6344 阅读 · 2 评论 -
python贡献度分析以及相关性分析小例子
贡献度又称帕累托,80%的利润来自20%的最畅销的产品,而其他80%的产品只产生了20%的利润。#-*- coding: utf-8 -*-#菜品盈利数据 帕累托图from __future__ import print_functionimport pandas as pd#初始化参数dish_profit = 'E:/PythonMaterial/chapter3/chapter3/de原创 2016-09-21 14:48:23 · 18421 阅读 · 2 评论 -
python数据清洗
1.缺失值的处理对于数据中缺失的值,可以有3种方法处理: 1.删除。比如餐厅的营业额,有几天去装修了,确实没营业,可以删除 2.不处理:有一些模型可以将缺失值作为一种特殊的值,可以直接建模。 3.补上: 均值/中位数/众数:一般情况吧 固定值:比如工资啊,补贴啊 最近临插补:最近的值,相邻的,补上下面是拉格朗日插值法 原理可以参考下面的博客 http://blog.csdn.net/原创 2016-09-26 17:07:59 · 4204 阅读 · 0 评论 -
python数据变换
1.规范化将数据进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。 1.最小-最大规范化 线性变换,将数值映射到【0,1】之间。 2.零-均值规范化 均值为0,标准差为1,标准正太分布,目前用到最多的方法 3.小数定标规范化 映射到【-1,1】之间#-*- coding: utf-8 -*-#数据规范化import pandas as p原创 2016-09-30 10:52:02 · 3419 阅读 · 0 评论 -
python的PCA
PCA是主成分分析,用来降维,用少量的变量去解释大部分变量,使得原来相关的变成不相关的,独立的变量。sklearn.decomposition.PCA(n_components=None,copy=True,whiten=False)n_components保留下来的特征个数n,缺省是所有都保留。赋值为int就是要保留几个。赋值为‘mle’,自动选取,使得满足要求的方差满分比。 copy,True原创 2016-10-08 14:58:53 · 1238 阅读 · 0 评论 -
Python逻辑回归
介绍回归分析是确定预测属性(数值型)与其他变量间相互依赖的定量关系最常用的统计学方法。 逻辑回归是概率型非线性回归,有2分类和多分类。2分类就是y的取值为0,1 即是 或 否 。原创 2016-11-20 21:43:00 · 4244 阅读 · 0 评论 -
Python决策树
决策树有ID3 C4.5 CART比较经典的算法,不过现在用的比较少,一般用随机森林多。 这里简单学习一下ID3,它是基于信息熵的#-*- coding: utf-8 -*-#使用ID3决策树算法预测销量高低import pandas as pdimport numpy as npfrom sklearn.cross_validation import train_test_splitf原创 2016-11-26 15:42:02 · 1740 阅读 · 0 评论 -
机器学习秘籍
为什么深度到现在才流行起来?1、海量的数据2、计算规模足够大学习算法的表现如何?在小数据集情况下,传统算法是否会表现得更好,取决于人们如何进行特征选择工程。例如,假设你只有 20 个训练样本,那么使用逻辑回归还是神经网络可能无关紧要,此时人为的特征选择工程比起选择哪种算法将产生更大的影响。但如果你有 100 万个样本数据,推荐你使用神经网络。开发集与测试集1、训练集用于运行你的学习算...原创 2019-02-20 16:00:49 · 321 阅读 · 0 评论