2021年03月_柳小葱

原创 python机器学习之决策树详解

1.决策树（decision tree）决策树就是一棵树，一颗决策树包含一个根节点、若干个内部结点和若干个叶结点；叶结点对应于决策结果，其他每个结点则对应于一个属性测试；每个结点包含的样本集合根据属性测试的结果被划分到子结点中；根结点包含样本全集，从根结点到每个叶子结点的路径对应了一个判定测试序列。2.构建决策树2.1 如何选择测试属性？测试属性（分支属性）的选择顺序影响决策树的结构甚至决策树的准确率——信息增益、信息增益率、Gini指标。2.2 如何停止划分样本？从归根节点测试属性开始，每个

2021-03-25 21:06:31 11679

原创 python数据分析之Dataframe分组（group by）

Dataframe分组统计group by函数对数据进行分组统计主要使用Dataframe函数，其功能如下：根据给定的条件将数据拆分成组。每个组都可单独应用函数（如sum、mean、std等）。将结果合并到一个数据结果中。语法如下：Dataframe.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,squeeze=False,observed=False)"""by:字典，映射，serie

2021-03-24 15:06:43 64816 2

原创遗传算法之粒子群算法python实现

粒子群算法的python实现这里的目标函数为rastrigin函数，图像如下所示：本算法主要分为三个部分：1 .将粒子群算法的参数初始化2 .初始化种群，并初始化个体最优pbest与全局最优gbset3 .进行循环更新个体#python编写pso算法import numpy as npimport matplotlib.pyplot as pltimport randomclass PSO_model: def __init__(self,w,c1,c2,r1,r2,N,

2021-03-22 23:02:55 1815

原创 python数据分析之DateFrame数据排序和排名

1.数据排序DataFrame.sort_values(by,axis=0,ascending=True,inplace=False,kind="quicksort",na_position="last",ignore_index=False)"""by:要排序的名称列表axis:轴，0表示行，1表示列ascending：升序或者降序排列,默认是True，升序inplace:是否直接在数据上修改，True为直接修改df,False为副本kind:指定排序算法，na_position：空值(N

2021-03-21 20:27:51 6184 8

原创 python数据分析之pandas设置索引

1.索引的作用索引的作用相当于图书的目录，可以根据目录中的页码快速找到所需的内容。更方便地查询数据使用索引可以提升查询性能多维索引用于多维聚类重设索引有一个很重要的方法reindex,它的作用是创建一个适应新索引的对象。语法如下：DataFrame.reindex(labels=None,index=None,column=None,axis=None,method=None,copy=True,level=None,fill_value=nan,limit=None,tolerance=N

2021-03-21 18:14:06 4741

原创 python数据分析之pandas空值、重复值的处理

1.首先查看数据信息import pandas as pdpd.set_option('display.max_rows',1000)#设置展示最高行数pd.set_option('display.max_columns',1000)#设置展示最高列数pd.set_option('display.unicode.east_asian_width',True)#列对齐df=pd.read_excel(r"C:\Users\Administrator\Desktop\python数据分析Code\Co

2021-03-20 11:18:20 1725 1

原创 python数据分析之DataFrame的增、删、改

1.先显示原始数据import pandas as pdpd.set_option('display.unicode.east_asian_width',True)data=[[120,98,89],[105,89,59],[110,120,100],[95,119,99]]index_name=['小红','小兰','小吕','小白']columns=['数学','物理','英语']df=pd.DataFrame(data,index=index_name,columns=columns)p

2021-03-18 23:30:02 1279

原创 python数据分析之DataFrame的数据抽取

pandas的数据抽取主要采用.loc和.iloc来取出自己需要的某行和某列的数据1.介绍.loc和.ilocdf.loc[ ]:主要是通过列名和行名来抽取数据，当只有一个参数时，默认是行名，即抽取这一行的数据。df.iloc[ ]:主要是通过行索引和列索引来抽取数据，当只有一个参数时，默认为取某一行的数据。df.iat[ ]:主要是定为dataframe中的某一个数据，如df.iat[2,2]，定位的为（3,3）的数据。2.对行数据的抽取初始化数据:#pandas之数据抽取import p

2021-03-18 17:27:12 13656 3

原创 python数据分析之pandas导入外部数据

1.文件路径的问题如果使用系统默认的文件路径“\”，那么在python中则需要在路径最前面加一个r,避免符号被转义相对路径：相对路径即以当前文件为基础，从而一级一级指向被引用的资源文件。…/: 表示当前文件所在目录的上一级目录。./: 表示当前文件所在的目录。/: 表示当前文件所在的根目录绝对路径：是指文件真实存在的路径，是指从硬盘的根目录开始，从而一级级目录指向文件。2.导入.xls或者.xlsx文件#只列出几个常用的参数pandas.read_excel(io,sheetname

2021-03-17 22:59:56 650 1

原创 python深度学习之基于LSTM时间序列的股票价格预测

1.本文是一篇LSTM处理时间序列的案例我们先来看看数据集，这里包含了一只股票的开盘价，最高价，最低价，收盘价，交易量的信息。本文基于LSTM对收盘价（close）进行预测2. 单维对单步的预测我们这是用前n天的数据预测第n+1天的数据。单维单步的蛤含义如下图，利用2天的数据预测第三天的数据。trainX的形状为（5,2），trainY的形状为（5,1）3.导入所需要的数据#关于lstm对时间序列数据的预测import numpy as npimport matplotlib.pyp

2021-03-17 20:52:58 32252 76

原创 python数据分析之Dataframe学习

pandas中的Dataframe是由多种类型组成的一种二维数据结构。1.介绍创建Dataframe的函数参数pandas.Dataframe(data,index,columns,dtype,copy)"""data:表示输入数据，可以为ndarray数组，series对象，列表，字典等index:设置行索引columns:设置列索引dtype：每一列的数据类型copy:用于复制数据"""2.创建Dataframe的方式通过二维数组和字典创建import pandas as p

2021-03-15 23:01:34 1026 2

原创 python数据分析之Series学习

Series是Dataframe中的一维数组对象，本文主要介绍Series的一些用法。1.解决列名输出不齐，行列显示不全的问题import pandas as pdpd.set_option('display.unicode.east_asian_width',True)#解决列名输出不齐df=pd.read_excel('C:\\Users\\Administrator\\Desktop\\python数据分析Code\\Code\\03\\01\\data.xlsx')#以下两行解决行列输出不

2021-03-15 21:40:12 752

柳小葱的博客

原创 python机器学习之决策树详解

原创 python数据分析之Dataframe分组（group by）

原创遗传算法之粒子群算法python实现

原创 python数据分析之DateFrame数据排序和排名

原创 python数据分析之pandas设置索引

原创 python数据分析之pandas空值、重复值的处理

原创 python数据分析之DataFrame的增、删、改

原创 python数据分析之DataFrame的数据抽取

原创 python数据分析之pandas导入外部数据

原创 python深度学习之基于LSTM时间序列的股票价格预测

原创 python数据分析之Dataframe学习

原创 python数据分析之Series学习

原创 python深度学习之GA（遗传算法）优化LSTM神经网络

原创遗传算法之优化BP神经网络

原创 VMware虚拟机扩展硬盘内存

原创虚拟机安装SQL SERVER 2012和Visual studio 2017各个版本

docker安装flink sql组件

sqlite3数据库应用程序

空空如也