数据分析三剑客

最新推荐文章于 2024-06-29 10:16:47 发布

孤风居士

最新推荐文章于 2024-06-29 10:16:47 发布

阅读量356

点赞数

本文链接：https://blog.csdn.net/DBasdas/article/details/118559005

版权

导包

查看版本类似np.__version__
numpy 学习
1、创建ndarray对象
np.reshape()重置数组
np.array()
np.ones()全为1的数组对象
np.zeros()全为0的数组对象
np.full()填充为固定值的对象
np.eye()单位矩阵
np.linespace()等差数列
np.arange()间隔数列
np.random.randint()随机整数
np.random.randn()正太分布满足（0,1）
np.random.normal()正太分布
np.random.random()[0,1）之间的随机数
2、常见计算函数
round()保留小数位数，不会改变存入文件的数据
mean()平均数
var()方差
std()标准差
median()中位数
percentile()百分位数，q=50是中位数
sin()cos()三角函数
exp()指数函数
log10()对数函数
sum()维度合并
3、常见属性
size数据大小ndim维度
shape大小和维度
dtype数据类型
各种变形操作（numpy1）
transpose
4、合并操作
concatenate
vhstack()垂直
hstack()水平
5、其他
np.copy(深度复制)
np.ravel(降维)
np.partition()选取部分数据
6、条件
argmax()，argmin()获得最大最小索引值
argwhere获得某个条件的索引值
all()全部bool类型
any() 部分bool类型
7、排序
sort
8、算法
corrcoef正负相关性相关性
histogram（a，bins）直方图分类，数据出现在区间的次数
np.linalg.inv()逆矩阵，dot(）点积，用来解方程
#正则化（数据代表含义不变，去量纲）
nd =np.random.randint(0,100,size=(4,5))
   v_min=nd.min(axis=0)
   v_max=nd.max(axis=0)
(nd-v_min)/(v_max-v_min)
#实现冒泡算法
   nd =np.random.randint(0,100,size=20)
   for i in range(20):
    for j in range(i+1,20):
   if nd[i]>nd[j]:
   nd[i],nd[j]=nd[j],nd[i]
9、保存和加载
np.save("./data.npy",a)
np.load("./data.npy")
np.savetxt("./data.txt",a)
np.loadtxt("./data.txt")
10、特性
广播机制+-*/

opencv学习
下载opencv特征和ffmpeg
导包
import numpy as np
import cv2
from scipy.io import wavfile 无损音质
1、常见方法
cv2.imread()读取图片数据
cv2.imshow()展示图片在界面上
cv2.waitKey()等待键盘响应
cv2.destroyAllWindows()清理窗口缓存
cv2.cvtColor(y1,code=cv2.COLOR_BGR2GRAY)改变图片颜色
常见操作循环
while True:
    if ord("q")== cv2.waitKey(1000)：
    break
cv2.destroyAllWindows()

2、图片识别步骤
获取图片对象
y1=cv2.imread("./y1.jpg")
分类器
    #级联分类
   detector=cv2.CascadeClassifier("./haarcascade_frontalface_default.xml")
检测函数
    face_zone=detector.detectMultiScale(y1)
   color_list=np.random.randint(0,256,size=3).tolist()随机颜色转为数组才行
标记人脸
    for x,y,w,h in face_zone:
       cv2.rectangle(y1,pt1=(x,y),pt2=(x+w,y+h),color=color_list,thickness=4)
       cv2.circle(y1,center=(x+w//2,y+h//2),radius=w//2,color=color_list)
   cv2.imshow("y1",y1)
   cv2.waitKey(0)
   cv2.destroyAllWindows()
3、视频识别步骤
获取视频对象
cap = cv2.VideoCapture("./video.mp4")
获取视频相关参数
cap.get(propId=cv2.CAP_PROP_FPS)帧数
cap.get(propId=cv2.CAP_PROP_FOURCC) fourcc编码
实现摄像捕捉参看open_video文件
4、音频操作
参看ffmpeg文件

pandas学习
导包
#三剑客
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pandas import Series,DataFrame
#series是一维，dataframe是二维的
1、series的学习
series的两种创建方法（列表和字典）
s=Series(data=np.random.randint(0,150,10),index=list("abcdefghij"),name="Python")
s2=Series({"A":120,"B":123,"C":125})
2、常见方法
s.head()读取前几条数据
s.tail()读取后几条数据
s[["d","i"]]选择多列用双括号
3、重点方法
isnull（）
notnull（）
4、属性
s.name
s.values
5、计算方法
s3=s.add(1,fill_value=0) 加法填充
s3.astype(dtype=np.uint8) 设置数据类型
s.value_counts() 值出现的次数
s.T转置矩阵

DataFrame对象
1、创建方法（字典，列表）
df=DataFrame(data={'Python':np.random.randint(0,150,size=5),"Math":np.random.randint(0,150,size=5)},index=list("ABCDE"))
df2=DataFrame(data=np.random.randint(0,150,size=(10,4)),index=list("ABCDEFGHIJ"),columns=["python","math","eng","physical"])
2、保存读取文件
to_csv等等
df2.to_csv("./data.txt",index=True, index_label="id")
df3=pd.read_excel("./data.xlsx",index_col=0)
read_csv等等
3、属性
values、dtypes、columns
4、方法
df.describe()返回多个计算值count、mean、max
数据清洗
空数据处理
df.info()整体查看空值
df.isnull().any(axis=1)查看空值
dropna()去除空值
df.drop(labels=["Math"],axis=1)删除具体空值
多层索引存和读
df=DataFrame(np.random.randint(0,5,size=(10,3)),columns=["P","M","C"],
index=pd.MultiIndex.from_product([["A","B","C","D","E"],["期中","期末"]]))
df.loc["A","期中","模拟一"]["P"]

重要方法
map 映射
apply（）执行函数
count（）数量
groupby分组
g.agg(["sum"])
g.agg({"weight":"sum","price":"mean"}).round(2)字典映射执行
concat拼接 merge融合
df.take(index)随机抽样
#数据是正太分布将过大过小数据删除，3σ标准
   #x-x_mean>3σ
   cond=df.abs()-df.mean()>3*df.std()
数据集分享：https://github.com/jakevdp/data-USstates/ 美国各州
https://search.gitee.com/?q=%E7%BE%8E%E5%9B%BD%E5%A4%A7%E9%80%89%E6%94%BF%E6%B2%BB%E7%8C%AE%E9%87%91&skin=rec&type=repository

下载basemap
在这里插入图片描述
1.2 方法二：在Anaconda Prompt中下载

1）可以在navigator中打开prompt，也可以在电脑左下角搜索栏中搜索Anaconda Prompt打开。

2）先输入：
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
换成清华源。

再输入:
conda install basemap

中间会让你确认是否安装，输入y，按下Enter键，即可安装。
————————————————
靠谱！！！本人亲测，最新免费的全自动挂机赚钱软件，国内首款既可以赚钱又可以赚Q币、赚话费的电脑赚钱软件，充分利用上网时间挂机赚钱，电脑开着机就能赚钱，无需手动操作，每天挂机赚50-80元，有详细的视频教程：http://m.baicuang.com/tuiqu/h_goto.php?u=1323424fsdsd
安卓手机用户请下载安卓版手机

孤风居士

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据分析三剑客

导包查看版本类似np.__version__numpy 学习 1、创建ndarray对象 np.reshape()重置数组 np.array() np.ones()全为1的数组对象 np.zeros()全为0的数组对象 np.full()填充为固定值的对象 np.eye()单位矩阵 np.linespace()等差数列 np.arange()间隔数列 n...
复制链接

扫一扫