大数据算法解析 笔记整理

一、Numpy类库

1.含义:一个由多维数组对象和用于处理数组的例程集合组成的库

2.数组属性:

       arr. shape:数组结构

        arr.dtype:数组类型

        arr.size:数组元素个数

        arr.ndim:数组的维度

3.创建数组三种方法:

①array([[1,2],[3,4]])

② range(start, stop,step)

③arange(start,stop,step)

区别:range()不支持步长为小数,arange()支持步长为小数

4.生成随机数组:

常用:numpy.random.randint(1,5,size=[2,3])      生成一个在[1,5)区间的2行3列随机数组

5.多维数组的索引:

        arr[1,3:5]:第1行的第3,4列

        arr[[(1,5),(3,4)]]:arr[1,3]和arr[5,4]

        arr[1:,(0,2,3)] :第2行到最后一行的第0,2,3列

6.改变数组形状:arr.reshape(3,4)      将arr数组改为3行4列的数组

7.展开数组:①arr.ravel()#横向展开     

                     ②arr.flatten()#横向展开

                     ③arr.flatten(‘F’)#纵向展开

注意:任何数组都变成一维数组

8.转置数组:print("arr.T")

9.

        

二、pandas读写数据库

1.连接数据库:

2.读取数据库的三种方法:

①读取student表的内容:

②读取school数据库中表的数量,名称等详情:

③读取加查询数据库:

3.读取文件:(若读取其他文件,改为to_*****()方法)

插入:csv:是字符分割文件

读取文本文件:pd.read_table()

读取csv文件:

4.存储csv文件:(若存储excel文件,改为to_excel()方法)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值