自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

柳小葱的博客

热爱人工智能与大数据!

  • 博客(16)
  • 资源 (2)
  • 收藏
  • 关注

原创 python机器学习之决策树详解

1.决策树(decision tree)决策树就是一棵树,一颗决策树包含一个根节点、若干个内部结点和若干个叶结点;叶结点对应于决策结果,其他每个结点则对应于一个属性测试;每个结点包含的样本集合根据属性测试的结果被划分到子结点中;根结点包含样本全集,从根结点到每个叶子结点的路径对应了一个判定测试序列。2.构建决策树2.1 如何选择测试属性?测试属性(分支属性)的选择顺序影响决策树的结构甚至决策树的准确率——信息增益、信息增益率、Gini指标。2.2 如何停止划分样本?从归根节点测试属性开始,每个

2021-03-25 21:06:31 11679

原创 python数据分析之Dataframe分组(group by)

Dataframe分组统计group by函数对数据进行分组统计主要使用Dataframe函数,其功能如下:根据给定的条件将数据拆分成组。每个组都可单独应用函数(如sum、mean、std等)。将结果合并到一个数据结果中。语法如下:Dataframe.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,squeeze=False,observed=False)"""by:字典,映射,serie

2021-03-24 15:06:43 64816 2

原创 遗传算法之粒子群算法python实现

粒子群算法的python实现这里的目标函数为rastrigin函数,图像如下所示:本算法主要分为三个部分:1 .将粒子群算法的参数初始化2 .初始化种群,并初始化个体最优pbest与全局最优gbset3 .进行循环更新个体#python编写pso算法import numpy as npimport matplotlib.pyplot as pltimport randomclass PSO_model: def __init__(self,w,c1,c2,r1,r2,N,

2021-03-22 23:02:55 1815

原创 python数据分析之DateFrame数据排序和排名

1.数据排序DataFrame.sort_values(by,axis=0,ascending=True,inplace=False,kind="quicksort",na_position="last",ignore_index=False)"""by:要排序的名称列表axis:轴,0表示行,1表示列ascending:升序或者降序排列,默认是True,升序inplace:是否直接在数据上修改,True为直接修改df,False为副本kind:指定排序算法,na_position:空值(N

2021-03-21 20:27:51 6184 8

原创 python数据分析之pandas设置索引

1.索引的作用索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。更方便地查询数据使用索引可以提升查询性能多维索引用于多维聚类重设索引有一个很重要的方法reindex,它的作用是创建一个适应新索引的对象。语法如下:DataFrame.reindex(labels=None,index=None,column=None,axis=None,method=None,copy=True,level=None,fill_value=nan,limit=None,tolerance=N

2021-03-21 18:14:06 4741

原创 python数据分析之pandas空值、重复值的处理

1.首先查看数据信息import pandas as pdpd.set_option('display.max_rows',1000)#设置展示最高行数pd.set_option('display.max_columns',1000)#设置展示最高列数pd.set_option('display.unicode.east_asian_width',True)#列对齐df=pd.read_excel(r"C:\Users\Administrator\Desktop\python数据分析Code\Co

2021-03-20 11:18:20 1725 1

原创 python数据分析之DataFrame的增、删、改

1.先显示原始数据import pandas as pdpd.set_option('display.unicode.east_asian_width',True)data=[[120,98,89],[105,89,59],[110,120,100],[95,119,99]]index_name=['小红','小兰','小吕','小白']columns=['数学','物理','英语']df=pd.DataFrame(data,index=index_name,columns=columns)p

2021-03-18 23:30:02 1279

原创 python数据分析之DataFrame的数据抽取

pandas的数据抽取主要采用.loc和.iloc来取出自己需要的某行和某列的数据1.介绍.loc和.ilocdf.loc[ ]:主要是通过列名和行名来抽取数据,当只有一个参数时,默认是行名,即抽取这一行的数据。df.iloc[ ]:主要是通过行索引和列索引来抽取数据,当只有一个参数时,默认为取某一行的数据。df.iat[ ]:主要是定为dataframe中的某一个数据,如df.iat[2,2],定位的为(3,3)的数据。2.对行数据的抽取初始化数据:#pandas之数据抽取import p

2021-03-18 17:27:12 13656 3

原创 python数据分析之pandas导入外部数据

1.文件路径的问题如果使用系统默认的文件路径“\”,那么在python中则需要在路径最前面加一个r,避免符号被转义相对路径:相对路径即以当前文件为基础,从而一级一级指向被引用的资源文件。…/: 表示当前文件所在目录的上一级目录。./: 表示当前文件所在的目录。/: 表示当前文件所在的根目录绝对路径:是指文件真实存在的路径,是指从硬盘的根目录开始,从而一级级目录指向文件。2.导入.xls或者.xlsx文件#只列出几个常用的参数pandas.read_excel(io,sheetname

2021-03-17 22:59:56 650 1

原创 python深度学习之基于LSTM时间序列的股票价格预测

1.本文是一篇LSTM处理时间序列的案例我们先来看看数据集,这里包含了一只股票的开盘价,最高价,最低价,收盘价,交易量的信息。本文基于LSTM对收盘价(close)进行预测2. 单维对单步的预测我们这是用前n天的数据预测第n+1天的数据。单维单步的蛤含义如下图,利用2天的数据预测第三天的数据。trainX的形状为(5,2),trainY的形状为(5,1)3.导入所需要的数据#关于lstm对时间序列数据的预测import numpy as npimport matplotlib.pyp

2021-03-17 20:52:58 32252 76

原创 python数据分析之Dataframe学习

pandas中的Dataframe是由多种类型组成的一种二维数据结构。1.介绍创建Dataframe的函数参数pandas.Dataframe(data,index,columns,dtype,copy)"""data:表示输入数据,可以为ndarray数组,series对象,列表,字典等index:设置行索引columns:设置列索引dtype:每一列的数据类型copy:用于复制数据"""2.创建Dataframe的方式通过二维数组和字典创建import pandas as p

2021-03-15 23:01:34 1026 2

原创 python数据分析之Series学习

Series是Dataframe中的一维数组对象,本文主要介绍Series的一些用法。1.解决列名输出不齐,行列显示不全的问题import pandas as pdpd.set_option('display.unicode.east_asian_width',True)#解决列名输出不齐df=pd.read_excel('C:\\Users\\Administrator\\Desktop\\python数据分析Code\\Code\\03\\01\\data.xlsx')#以下两行解决行列输出不

2021-03-15 21:40:12 752

原创 python深度学习之GA(遗传算法)优化LSTM神经网络

上次优化完bp神经网络后,发现用matlab优化高级的神经网络太慢了,于是用tensorflow继续学习GA优化部分。1.项目概述本文采用的是python编程,使用的数据集是mnist手写数据集,该数据集主要是对0-9的手写数字体识别,虽然说图像识别方面用CNN识别率较高,但这里LSTM也可以获取较高的准确率。2.优化参数本文优化的是LSTM的层数参数和各层神经元参数,其中包含了lstm层和Dense层,其中我们规定了神经网络的层数不超过3层,每层的神经元个数在[32,256]之间。3.注意事项

2021-03-15 14:17:26 21373 89

原创 遗传算法之优化BP神经网络

GA算法优化BP神经网络(matlab)这里我首先要介绍一下BP神经网络的一些特点,因为在以下的编程中,我将把这些特点运用在其中,防止大家不知道为什么这样做。1.bp神经网络的层数一般3层效果较好,即只包含输入层、一层的隐藏层、输出层。2.bp神经网络的隐藏层神经元个数一般为输入层神经元个数的2倍再加1,即hiddennum=inputnum*2+1。3.我们用的是遗传算法工具箱来解决的问题1.GA算法优化神经网络的参数介绍本遗传算法优化的部分是输入层与隐藏层的权值w1和偏置b1;隐藏层与输出层

2021-03-11 22:35:49 14778 26

原创 VMware虚拟机扩展硬盘内存

内存不够了,需要扩展,本来以为就和扩展运行内存一样,设置一下就行,结果发现事情并不是这么简单。试了各种方法,就成功了一种,把方法交给大家,让大家少走坑。1.找到VM的安装位置打开文件安装位置2.找到vmware-vdiskmanager.exe文件找到文件后,不用双击运行,先用cmd命令打开终端,然后将vmware-vdiskmanager.exe 文件拖进去,控制台直接就会显示该文件位置3.找到虚拟机安装的文件位置、这里有几个注意点:1.记得把以前的快照先删除,否则会报错2.记得路径

2021-03-09 21:37:15 3393 1

原创 虚拟机安装SQL SERVER 2012和Visual studio 2017各个版本

自己系统卸载sql server 2008 后,安装2012就失败,尝试各种方法,最后还是选择在虚拟机里配置sql和VS。给大家推荐一个网址https://msdn.itellyou.cn/如下:可用在服务器和操作系统这找到自己想要的系统和软件下载好操作系统和sql软件在VM中打开安装即可。...

2021-03-01 23:26:08 484

docker安装flink sql组件

flink sql学习组件,里面包含flink、flink sql clienk、kafka 、ES、mysql等,使用docker命令加载即可,适用于macos,linux系统学习flink

2022-01-26

sqlite3数据库应用程序

学习sqlite3的用户可以下次此程序,直接点击打开就好了

2022-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除