自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 python获取mysql表头名称

import pymysql import pandas as pd import numpy as np import datetime def tp_data(): #获取数据 db=pymysql.connect(host=,port=3306,user=,password...

2020-05-27 14:48:07 159 0

原创 特征工程之时间处理

def order_timestamp(x): result=datetime.datetime.strptime(x, '%Y-%m-%d %H:%M:%S.0') return result def action_timestamp(timeNum): ...

2019-08-07 17:51:35 277 0

原创 特征工程之标准化

数据和特征决定了机器学习算法的上限,而模型和算法只是不断逼近这个上限而已 数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面: 数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,...

2019-08-07 17:25:24 167 0

原创 模型训练及调参

1.模型选择 根据二分类问题进行模型训练 from sklearn.linear_model import LogisticRegression import pandas as pd import numpy as np from sklearn.neighbors import KNeig...

2019-08-06 17:54:43 300 0

原创 Hadoop应用技术详解

下载地址 https://pan.baidu.com/s/1kTDWB6B 目录

2019-04-16 09:11:05 107 0

原创 pycharm连接oracle中jdbc配置

1.配置方式:jdbc:oracle:thin:@//:1521/netgrid 2.配置方式:jdbc:oracle:thin:@:1521:netgrid 1中当@后边有双斜杠,端口号后边有单斜杠时,用服务名和实例名都可以链接成功, 2中@后边没有双斜杠,端口号后边是冒号而不是斜杠的时候只能用...

2019-03-01 16:33:53 1218 0

转载 python画小猪佩奇

https://github.com/Monster12138/-/blob/master/小猪佩奇.py turtle import turtle as t t.pensize(4) t.hideturtle() t.colormode(255) t.color((255,155,192),&...

2019-01-19 14:08:58 222 0

原创 AlexNet对MNIST分类

一.Alexnet介绍 https://blog.csdn.net/MESSI_JAMES/article/details/81384534#t8 二.过程介绍 一次完整的训练模型和评估模型的过程一般分为 3 个步骤: 1.加载数据, 2.定义网络模型, 3. 训练模型和评估模型。 三.代码实...

2018-12-28 14:22:56 1226 2

原创 LSTM对MNIST数据集做分类

https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/5-08-RNN2/ 1.设置 RNN 的参数 RNN 从每张图片的第一行像素读到最后一行, 然后再进行分类判断. (1)导入 MNIST 数据并确定 RNN ...

2018-12-19 14:13:03 866 0

原创 求列表的全子集

def getRealSubSet(fromList,toList): if(len(fromList) <= 1): return for id in range(len(fromList)): print('id'...

2018-12-13 17:17:31 202 0

原创 路径优化搜素算法

一.深度优先搜索算法(DFS) 1.算法介绍 https://zh.wikipedia.org/wiki/深度优先搜索 DFS(Depth-First-Search)是一种用于遍历或搜索树或图的算法。沿着树的深度遍历树的节点,尽可能深的搜索树的分支。当节点v的所在边都己被探寻过,搜索将回...

2018-11-26 11:42:19 5898 3

原创 Tensorflow拟合函数:y=2x+3

本文代码在jupyter上实现 拟合一个一元一次函数:y=2x+3,具体要求如下: 1、使用Tensorflow框架 2、利用迭代方法,优化器不限 3、给出拟合的参数值 4、把拟合过程可视化 1.导入模块 import tensorflow as tf i...

2018-08-19 14:44:37 1074 0

原创 神经网路反向传播(BP)算法原理

一.BP算法简介 BP算法的学习过程由正(前)向传播过程和反向传播过程组成。 1.正向传播 将训练集数据输入到ANN的输入层,经过隐藏层,最后达到输出层并输出结果; 2.反向传播 由于ANN的输出结果与实际结果有误差,则计算估计值与实际值之间的误差,并将该误差从...

2018-08-16 21:50:49 498 0

原创 python基于神经网络实现人脸识别

一.项目简介 1.数据 需要数据QQ联系:1209028652 数据集:总共数据集由两部分组成:他人脸图片集及我自己的部分图片 自己图片目录:face_recog/my_faces 他人图片目录:face_recog/other_faces 我的测试图片目录:fa...

2018-08-15 14:52:48 4870 12

原创 深度神经网络优化策略汇总

接下来介绍卷积神经网络的各种改进措施,其中经典网络的改进措施已经在前面各个网络中介绍。针对卷积神经网络的改进措施主要在以下几个方面:卷积层,池化层,激活函数,损失函数,网络结构,正则化技术等方面。优化算法对网络的训练至关重要,在这里我们单独列出来了。 1.卷积层 卷积层的改进有以下几种:...

2018-08-10 16:46:57 1492 0

转载 多种类型RNN

1.RNN https://zhuanlan.zhihu.com/p/36101196?utm_source=qq&utm_medium=social&...

2018-08-09 18:28:07 1865 0

原创 线性回归

1.线性模型流程 2.模型假设 1、模型设置,选择何种回归方法、如何选变量、变量以何种形式放入模型(根据理论、看散点图); 2、解释变量和扰动项不能相关(根据理论或常识判断,无法检验); 1、2保证模型是正确的 3、解释变量之间不能强线性相关(膨胀系数...

2018-08-06 15:40:11 163 0

转载 Apriori算法与FP-Tree算法

1.Apriori https://www.cnblogs.com/pinard/p/6293298.html Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于我们做一些决策。比如在常见的超市购物数据集,或者电商的网购...

2018-08-05 17:45:48 589 0

原创 CNN

一.1X1X卷积核 3X3卷积核 1X1 卷积核 一般1×1的卷积核本质上并没有对图像做什么聚合操作,以为就是同一个w去乘以原图像上的每一个像素点,相当于做了一个缩放 (1)卷积核作用 1x1的卷积核可以进行降维或者升维,也就是通过控制卷积核...

2018-08-03 11:28:29 1154 0

原创 逻辑回归

1.逻辑回归 参考http://www.cnblogs.com/ModifyRong/p/7739955.html (1)介绍 在 线性回归模型中,输出一般是连续的,例如y=f(x)=ax+b,对于每一个输入的x,都有一个对应的y输出。模型的定义域和值域都可以是[-∞, +∞]。 ...

2018-08-02 20:26:51 185 0

原创 奇妙的数学证明!!!!

上学的时候怎么就没有想过这个问题。。。。

2018-07-31 22:59:34 310 0

原创 马尔科夫、条件随机场、激活函数

1.X8的马尔科夫毯 ! (1)有向图转换成无向图(UGM) (2)马尔科夫 三个性质等价 (3)团和最大团 深度学习中的激活函数导引 参考https://zhuanlan.zhihu....

2018-07-31 18:24:22 289 0

原创 大数据分析Hadoop及Python实现

大数据 1.分布式: 主节点(Master)、从节点(Slaves) 2.集群(多台机器) 同时存储数据,并行处理数据 3.分布式计算 核心思想:分而治之思想 一.Hadoop 1.Apache Hadoop 介绍: 对...

2018-07-23 23:03:10 7856 1

转载 常见的集中优化方法

1.梯度下降 以下均参考https://www.cnblogs.com/shixiangwan/p/7532830.html (1)简介 梯度下降法是最早最简单,也是最为常用的最优化方法。梯度下降法实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优...

2018-07-17 20:00:30 589 0

原创 距离度量

1.闵可夫斯基距离 闵氏距离的缺点: (1)将各个分量的量纲(scale),也就是“单位”相同的看待了; (2)未考虑各个分量的分布(期望,方差等)可能是不同的。 2.马氏距离 马氏距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧...

2018-07-15 11:32:46 157 0

原创 集成学习

一.集成算法综述 参考https://blog.csdn.net/ruiyiin/article/details/77114072 1. 集成算法是一种优化手段或者策略,它通常是结合多个简单的弱机器学习算法,去做更可靠的决策。 2.集成模型是一种能在各种的机器学习任务上提高准确...

2018-07-13 18:21:40 2113 0

原创 EM算法

1.EM简介 EM算法是一种迭代算法,用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计,EM算法的每次迭代由两部分组成: E步:求期望, M步:求极大 该算法又叫期望极大算法,简称EM算法。 2.无偏估计—->标准差 ...

2018-07-12 23:13:42 187 0

原创 PageRanks算法

一.算法原理 (1)如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高 (2)如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页PageRank值也会相应提高。 每个球代表一个网页;球的大小反应...

2018-07-10 23:04:42 371 0

原创 SVM

一.概念 寻找到一个超平面使样本分成两类,并且间隔最大。而我们求得的w就代表着我们需要寻找的超平面的系数。 与超平面的距离表示分类的确信度,距离越远则分类正确的确信度越高 1.多重超平面 B是最好地分离这两个类的线 2. 多分离超平...

2018-07-06 15:06:37 222 0

原创 k-means算法

一.k-means算法 1.概念 事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度(这里为欧式距离),将样本点归到最相似的类中,接着,重新计算每个类的质心(即为类中心),重复这样的过程,知道质心不再改变,最终就确定了每个样本所...

2018-07-05 21:24:36 290 0

原创 贝叶斯算法

一.概率基础知识 1.条件概率 是指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为:P(A|B),读作“在B条件下A的概率”。 P(A|B) = P(B|A) * P(A) / P(B) 例子 一起汽车撞人逃跑事件,已知只有两种颜色的车,比例为蓝色...

2018-07-05 17:19:54 150 0

原创 《算法图解》

一.算法简介 1.二分法 对于区间[a,b]上连续不断且f(a)·f(b)<0的函数y=f(x),通过不断地把函数f(x)的零点所在的区间一分为二,使区间的两个端点逐步逼近零点,进而得到零点近似值的方法叫二分法。 当数据量很大适宜采用该方法...

2018-07-04 22:44:12 236 0

原创 决策树

一.概念 决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树 二.划分依据 1.熵 (1)当系统的有序状态一致时,数据越集中的地方熵值越小,数据越分散的地方熵...

2018-07-04 19:26:43 168 0

原创 matplotlib扩展篇—pyecharts绘图

一.pyecharts介绍 .简介 pyecharts 是一个用于生成 Echarts 图表的类库。Echarts是百度开源的一个数据可视化 JS 库。 用 Echarts 生成的图可视化效果非常棒,pyecharts 是为了与 Python 进行对接,方便在 Python 中直接...

2018-06-28 23:15:56 3152 0

原创 matplotlib—三种方法加载数据文件进行可视化

1.csv获取数据 (1)导入模块 from matplotlib import pyplot as plt import numpy as np import csv #用来正常显示中文标签 plt.rcParams['font.sans-serif']=[...

2018-06-28 21:38:08 4964 0

原创 pandas+matplotlib绘图

1.用Series进行绘图 用series的行索引作为x轴,值作为数据 from matplotlib import pyplot as plt import numpy as np from pandas import DataFrame,Series import pandas a...

2018-06-28 10:22:52 1288 0

原创 pandas高级篇—apply

1.apply apply会将待处理的对象拆分成多个片段,然后对各片段调用传入的函数,最后尝试将各片段组合到一起 2.head() (1)默认查找前五条数据,head(n)查找前n条数据 (2)定义函数,(函数名为top)查找前n条数据 (3)apply()——–>...

2018-06-27 13:27:40 10158 0

原创 matplotlib—高级篇

一.深入了解柱状图 1.创建一个画板 plt.figure(1) 2.为画板划分出多个Axes ax1=plt.subplot(111) #plt.subplot(222)表示将画板分成2行2列,即四块,然后取第一块 3.数据准备 ...

2018-06-26 19:02:25 467 0

原创 matplotlib—画正弦、余弦函数图

一.导入模块 import matplotlib.pyplot as plt import numpy as np plt.rcParams['font.sans-serif']=['SimHei'] # 用于正常显示中文标签 plt.rcParams...

2018-06-26 18:19:56 7317 3

原创 matplotlib—创建画板

一.导入模块 import matplotlib.pyplot as plt # 用于正常显示中文标签 plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示负号 plt.rcParams['axe...

2018-06-26 17:33:41 747 0

提示
确定要删除当前文章?
取消 删除