数据分析三剑客

导包

查看版本类似np.__version__
numpy 学习
   1、创建ndarray对象
        np.reshape()重置数组
        np.array()
        np.ones()全为1的数组对象
        np.zeros()全为0的数组对象
        np.full()填充为固定值的对象
        np.eye()单位矩阵
        np.linespace()等差数列
        np.arange()间隔数列
        np.random.randint()随机整数
        np.random.randn()正太分布满足(0,1)
        np.random.normal()正太分布
        np.random.random()[0,1)之间的随机数
    2、常见计算函数    
         round()保留小数位数,不会改变存入文件的数据
         mean()平均数
         var()方差
         std()标准差
          median()中位数
          percentile()百分位数,q=50是中位数
          sin()cos()三角函数
          exp()指数函数
          log10()对数函数
          sum()维度合并
    3、常见属性
         size数据大小ndim维度
         shape大小和维度
         dtype数据类型    
         各种变形操作(numpy1)
         transpose
     4、合并操作
          concatenate
          vhstack()垂直
          hstack()水平
     5、其他
           np.copy(深度复制)   
           np.ravel(降维)  
           np.partition()选取部分数据
     6、条件
        argmax(),argmin()获得最大最小索引值
        argwhere获得某个条件的索引值
        all()全部bool类型
        any() 部分bool类型
     7、排序
          sort                            
    8、算法
          corrcoef正负相关性相关性  
          histogram(a,bins)直方图分类,数据出现在区间的次数
          np.linalg.inv()逆矩阵,dot()点积,用来解方程
          #正则化(数据代表含义不变,去量纲)
                nd =np.random.randint(0,100,size=(4,5))
    v_min=nd.min(axis=0)
    v_max=nd.max(axis=0)
                (nd-v_min)/(v_max-v_min)   
           #实现冒泡算法
    nd =np.random.randint(0,100,size=20)
    for i in range(20):
          for j in range(i+1,20):
                 if nd[i]>nd[j]:
                       nd[i],nd[j]=nd[j],nd[i]
     9、保存和加载
           np.save("./data.npy",a)
           np.load("./data.npy")   
           np.savetxt("./data.txt",a)
           np.loadtxt("./data.txt")
      10、特性
         广播机制+-*/

opencv学习
       下载opencv特征和ffmpeg
       导包
       import numpy as np
       import cv2
       from scipy.io import wavfile 无损音质
      1、常见方法
        cv2.imread()读取图片数据
        cv2.imshow()展示图片在界面上
        cv2.waitKey()等待键盘响应
        cv2.destroyAllWindows()清理窗口缓存     
        cv2.cvtColor(y1,code=cv2.COLOR_BGR2GRAY)改变图片颜色  
        常见操作循环
        while True:
       if ord("q")== cv2.waitKey(1000):
             break
       cv2.destroyAllWindows()        

      2、图片识别步骤
          获取图片对象
                  y1=cv2.imread("./y1.jpg")  
         分类器
              #级联分类
              detector=cv2.CascadeClassifier("./haarcascade_frontalface_default.xml")
           检测函数
              face_zone=detector.detectMultiScale(y1)
              color_list=np.random.randint(0,256,size=3).tolist()随机颜色转为数组才行
           标记人脸
                  for x,y,w,h in face_zone:
            cv2.rectangle(y1,pt1=(x,y),pt2=(x+w,y+h),color=color_list,thickness=4)
            cv2.circle(y1,center=(x+w//2,y+h//2),radius=w//2,color=color_list)
        cv2.imshow("y1",y1)
        cv2.waitKey(0)
        cv2.destroyAllWindows()
      3、视频识别步骤
           获取视频对象
                cap = cv2.VideoCapture("./video.mp4")
           获取视频相关参数
                cap.get(propId=cv2.CAP_PROP_FPS)帧数
                cap.get(propId=cv2.CAP_PROP_FOURCC)  fourcc编码  
           实现摄像捕捉参看open_video文件          
       4、音频操作
            参看ffmpeg文件

pandas学习
      导包
      #三剑客
      import numpy as np
      import pandas as pd
      import matplotlib.pyplot as plt
      from pandas import Series,DataFrame
      #series是一维,dataframe是二维的
      1、series的学习
       series的两种创建方法(列表和字典)
        s=Series(data=np.random.randint(0,150,10),index=list("abcdefghij"),name="Python")  
        s2=Series({"A":120,"B":123,"C":125})    
       2、 常见方法
        s.head()读取前几条数据
        s.tail()读取后几条数据
        s[["d","i"]]选择多列用双括号
        3、重点方法
        isnull()
        notnull()
        4、属性
          s.name
          s.values
        5、计算方法
          s3=s.add(1,fill_value=0)    加法填充
          s3.astype(dtype=np.uint8) 设置数据类型
           s.value_counts() 值出现的次数
          s.T转置矩阵

DataFrame对象
       1、创建方法(字典,列表)
       df=DataFrame(data={'Python':np.random.randint(0,150,size=5),"Math":np.random.randint(0,150,size=5)},index=list("ABCDE"))
       df2=DataFrame(data=np.random.randint(0,150,size=(10,4)),index=list("ABCDEFGHIJ"),columns=["python","math","eng","physical"])
       2、保存读取文件
       to_csv等等
       df2.to_csv("./data.txt",index=True, index_label="id")
       df3=pd.read_excel("./data.xlsx",index_col=0)
       read_csv等等
        3、属性
         values、dtypes、columns
        4、方法
         df.describe()返回多个计算值count、mean、max
数据清洗
      空数据处理
       df.info()整体查看空值
       df.isnull().any(axis=1)查看空值
       dropna()去除空值
       df.drop(labels=["Math"],axis=1)删除具体空值
       多层索引存和读
      df=DataFrame(np.random.randint(0,5,size=(10,3)),columns=["P","M","C"],
             index=pd.MultiIndex.from_product([["A","B","C","D","E"],["期中","期末"]]))
       df.loc["A","期中","模拟一"]["P"]
      
      重要方法
      map 映射
       apply()执行函数
       count()数量
       groupby分组
       g.agg(["sum"])
       g.agg({"weight":"sum","price":"mean"}).round(2)字典映射执行
       concat拼接 merge融合
      df.take(index)随机抽样
       #数据是正太分布将过大过小数据删除,3σ标准
    #x-x_mean>3σ
    cond=df.abs()-df.mean()>3*df.std()
数据集分享:https://github.com/jakevdp/data-USstates/ 美国各州
                   https://search.gitee.com/?q=%E7%BE%8E%E5%9B%BD%E5%A4%A7%E9%80%89%E6%94%BF%E6%B2%BB%E7%8C%AE%E9%87%91&skin=rec&type=repository

下载basemap
在这里插入图片描述
1.2 方法二:在Anaconda Prompt中下载

1)可以在navigator中打开prompt,也可以在电脑左下角搜索栏中搜索Anaconda Prompt打开。

2)先输入:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
换成清华源。

再输入:
conda install basemap

中间会让你确认是否安装,输入y,按下Enter键,即可安装。
————————————————
靠谱!!!本人亲测,最新免费的全自动挂机赚钱软件,国内首款既可以赚钱又可以赚Q币、赚话费的电脑赚钱软件,充分利用上网时间挂机赚钱,电脑开着机就能赚钱,无需手动操作,每天挂机赚50-80元,有详细的视频教程:http://m.baicuang.com/tuiqu/h_goto.php?u=1323424fsdsd
安卓手机用户请下载安卓版手机

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值