![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
zsffuture
hello world
展开
-
numpy使用教程
目录基础知识数组创建打印数组基本操作索引,切片和迭代形状操纵改变数组的形状堆叠不同的数组将一个数组拆分成几个较小的数组副本和视图全部没有复制查看或浅拷贝深拷贝技巧和提示“自动”整形矢量堆叠基础知识NumPy的主要对象是同构多维数组。它是一个元素表(通常是数字),都是相同的类型,由正整数元组索引。在NumPy维度中称为轴。例...原创 2018-10-01 13:22:36 · 2516 阅读 · 0 评论 -
Keras中RNN、LSTM、GRU等输入形状batch_input_shape=(batch_size,time_steps,input_dim)及TimeseriesGenerator详解
最近在使用Keras进行项目实战时,在RNN这块迷惑了,迷惑就是这个输入数据的形状以及如何定义自己的输入数据,因此系统的学习了一下,把学习的总结一下,感觉会有很多人在这里迷惑,如果对你有帮助记得点赞哈。为了便于大家深入理解batch_input_shape=(batch_size,time_steps,input_dim)的意思,这里我们先从制作数据开始理解,这样效果更好,一旦这个学会,我们就...原创 2019-05-31 16:11:39 · 18960 阅读 · 4 评论 -
2018年度总结和2019年度计划
回顾20182018这一年基本上按照2017年的预定计划完成了任务,制定的计划基本都完成了,少部分还在继续,期间收获了很多也失去了很多,得失在于自己的权衡,总体来说是收获的较多。2017年7月份开始系统学习AI方面的内容,之前一直在关注这个行业,因为和我的专业很相近,因此开始是从机器学习开始的,刚开始学习确实挺难的,这就需要个人的学习能力和理解能力以及学习安排了,同时也和个人的执行能力,自我管...原创 2019-01-06 15:37:40 · 5856 阅读 · 10 评论 -
Seaborn学习(一)------- 构建结构化多绘图网格(FacetGrid()、map())详解
在探索中等维数据时,一种有用的方法是在数据集的不同子集上绘制同一图的多个实例。这种技术有时被称为“格子”或“格子”绘图,它与“小倍数”的概念有关。它允许查看者快速提取有关复杂数据的大量信息。Matplotlib为制作多轴数字提供了很好的支持; seaborn构建于此之上,可直接将绘图结构链接到数据集的结构。要使用这些功能,您的数据必须位于Pandas DataFrame中,并且必须采...原创 2018-10-07 21:16:48 · 34201 阅读 · 5 评论 -
pandas数据处理实践五(透视表pivot_table、分组和透视表实战Grouper和pivot_table)
建议大家多研究pandas的官方文档透视表:DataFrame.pivot_table(values = None,index = None,columns = None,aggfunc ='mean',fill_value = None,margin = False,dropna = True,margins_name ='All' )创建一个电子表格样式的数据透视表作为DataFr...原创 2018-10-06 13:30:23 · 5747 阅读 · 0 评论 -
pandas数据处理实践四(时间序列date_range、数据分箱cut、分组技术GroupBy)
时间序列:关键函数pandas.date_range(start = None,end = None,periods = None,freq = None,tz = None,normalize = False,name = None,closed = None,** kwargs )参数: start:str或datetime-like,可选 生成日期的...原创 2018-10-05 19:08:17 · 7782 阅读 · 0 评论 -
pandas数据处理实践三(DataFrame.apply、merge、rename,数据预处理、DataFrame.drop_duplicates去重)
通过apply、rename进行数据的预处理: DataFrame.apply(func,axis = 0,broadcast = None,raw = False,reduce = None,result_type = None,args =(),** kwds )# apply的用处在于可以给一个函数对数据进行迭代处理,或者只对某些列(特征)感兴趣,可以通过这个进行处理In ...原创 2018-10-04 11:33:14 · 1829 阅读 · 0 评论 -
pandas数据处理实践二(排序(sort_index()、sort_values())、连接(Concatenate(连接,串联)和Combine(结合、联合))
排序: Series的排序:Series.sort_index()按位置排序Series.sort_index()按值排序Series.sort_index(axis = 0,level = None,ascending = True,inplace = False,kind =' quicksort ',na_position ='last',sort_remaining = T...原创 2018-10-04 10:54:20 · 3708 阅读 · 1 评论 -
pandas入门学习
知道pandas主要的数据结构以后就可以实际操作学习了,其实学习主要还是学习如何使用Series和Dataframe的属性和方法使用规则,多使用,多看官方文档就差不多了,下面开始学习pandas:Series的创建使用Python的列表创建Series:import numpy as npimport pandas as pd# 使用list创建s1 = pd.Series(...原创 2018-10-02 18:49:31 · 8375 阅读 · 0 评论 -
pandas数据处理实践一(简单走一遍)
pandas处理数据简单的分为如下步骤:读取数据-->分析数据-->处理数据-->导出数据第一次主要是走一个流程 df1 = pd.read_csv('/path/xx.csv') # 通过pd.read_csv读数据,格式为dataframe# df1.to_csv('df1.csv',index=False) # 把内容写到名为df1.csv的文件中,...原创 2018-10-02 18:42:04 · 1806 阅读 · 0 评论 -
pandas的两种数据类型:Series和DataFrame
首先要明确pandas是做什么的,在确定是如何做的,通过哪些方式去做的?pandas是做什么的? Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和...原创 2018-10-02 12:35:12 · 13094 阅读 · 0 评论 -
numpy功能快速查找
目录数组创建例程举个例子:从现有数据创建记录数组(numpy.rec)创建字符数组(numpy.char)数值范围构建矩阵Matrix类数组操作例程基本操作改变数组形状类似转置的操作更改维数改变数组的种类连接数组拆分数组平铺数组添加和删除元素重新排列元素字符串操作字符串操作比较字符串信息便利类日...翻译 2018-10-01 13:39:52 · 8301 阅读 · 0 评论