Numpy,Pandas
mengqiutong
这个作者很懒,什么都没留下…
展开
-
Numpy学习—np.random.randn()、np.random.rand()和np.random.randint()
在机器学习和神经网络中,常常会利用Numpy库中的随机函数来生产随机数,比如随机初始化神经网络中的参数权重W(备注:W是不能全部初始化为0的,这样会引起symmetry breaking problem,这样隐藏层设置多个神经元就没有任何意义了)。 在Numpy库中,常用使用np.random.rand()、np.random.randn()和np.random.randint()随机函数。这几个...转载 2018-06-07 21:43:21 · 34773 阅读 · 2 评论 -
Pandas之时间操作
1、常用时间类别解释year年month月day日hour时minute分钟second秒microsecond微秒nanosecond纳秒date返回日期time返回时间dayofyear年序日weekofyear年序周week周dayofweek周中的第几天,Monday=0, Sunday=6weekday周中的第几天,Monday=0, Sunday=6weekday_name周中的星期几...转载 2018-05-04 22:45:00 · 4173 阅读 · 0 评论 -
数据清洗、合并、转化和重构
数据清洗是数据分析关键的一步,直接影响之后的处理工作数据需要修改吗?有什么需要修改的吗?数据应该怎么调整才能适用于接下来的分析和挖掘?是一个迭代的过程,实际项目中可能需要不止一次地执行这些清洗操作处理缺失数据:pd.fillna(),pd.dropna()1.数据连接(pd.merge)pd.merge根据单个或多个键将不同DataFrame的行连接起来类似数据库的连接操作示例代码:import ...转载 2018-06-06 22:29:28 · 1910 阅读 · 0 评论 -
Pandas 之groupby操作
pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。对DataFrame的列应用各种各样的函数。应用组内转换或其他运算,如规格化、线性回归、排名或选取子集等。计算透视表或交叉表。执行分位数分析以及其...转载 2018-06-06 22:26:00 · 1867 阅读 · 0 评论 -
Pandas的常用方法
Pandas是一个Python软件包,提供快速,灵活和富有表现力的数据结构,旨在使“关系”或“标记”数据的工作变得简单直观。它旨在成为在Python中进行实际的,真实世界的数据分析的基本高级构件。另外,它具有更广泛的目标,即成为任何语言中最强大,最灵活的开源数据分析/操作工具。它已经很好地走向了这个目标。pandas非常适合许多不同类型的数据:具有异构类型列的表格数据,如在SQL表格或Excel电...转载 2018-06-04 23:29:26 · 1069 阅读 · 0 评论 -
Numpy常用方法
NumPy是用Python进行科学计算的基本软件包。它包含以下内容: 一个强大的N维数组对象复杂的(广播)功能用于集成C / C ++和Fortran代码的工具有用的线性代数,傅里叶变换和随机数能力 除了明显的科学用途外,NumPy还可以用作通用数据的高效多维容器。任意的数据类型可以被定义。这使得NumPy能够与各种各样的数据库无缝,快速地整合。Numpy官网 : http://www.numpy...转载 2018-06-04 23:25:34 · 6506 阅读 · 0 评论 -
pandas创建数据表及数据读写
读取Excel数据#读取excel数据import pandas as pdFileReadPath = r"D:\AI\Others\test.xlsx"df = pd.read_excel(FileReadPath)df.head()写Excel数据#把数据写入ExcelFileWritePath = r"D:\AI\Others\test1.xlsx"writer = pd.Ex...原创 2018-06-02 15:13:39 · 10019 阅读 · 0 评论 -
Numpy数组的计算
import numpy as npMeng_array = np.array([[1,2,3],[4,5,6]])Meng_arrayoutput:array([[1, 2, 3], [4, 5, 6]])np.sum(Meng_array,axis=0)#指定安装列求和output:array([5, 7, 9])np.sum(Meng_array,axis...原创 2018-06-04 22:34:33 · 399 阅读 · 0 评论 -
Numpy数组
Numpy数组比python列表比较:优势:1.数组越大Numpy数组优势更明显,计算高效,代码简洁2.输入输出性能远优于Python的嵌套列表劣势:1.Numpy数组中的所有元素的类型必须相同2.Python列表中的元素类型可以是任意的import numpy as nparray1 = [1,2,3,4,5]#Python列表的定义array2 = np.array([1,2,3,4,5]...原创 2018-06-04 21:57:00 · 1041 阅读 · 0 评论 -
pandas 中 Category 的应用
Categoricals 是 pandas 的一种数据类型,对应着被统计的变量。Categoricals 是由固定的且有限数量的变量组成的。比如:性别、社会阶层、血型、国籍、观察时段、赞美程度等等。与其它被统计的变量相比,categorical 类型的数据可以具有特定的顺序——比如:按程度来设定,“强烈同意”与“同意”,“首次观察”与“二次观察”,但是不能做按数值来进行排序操作(比如:sort_b...转载 2018-06-07 22:18:44 · 10608 阅读 · 0 评论