数据处理知识点

夫子耶

已于 2024-04-11 13:59:53 修改

阅读量985

点赞数 23

分类专栏：知识点文章标签： python 大数据数据分析数据挖掘面试人工智能

于 2024-04-03 14:04:23 首次发布

本文链接：https://blog.csdn.net/Fuziqp/article/details/137333756

版权

数据处理知识点

数据处理
1. 常用的数据处理的库有哪些
2. pandas库怎么去做切分
3. pandas库怎么去做合并
4. numpy库基本操作有哪些
5. numpy库的数据结构是什么
6. 常用的数据可视化的库有哪些
7. 怎么处理类别不平衡？
8. 数据样本不平衡的时候怎么办？
9. 了解数据挖掘的方法嘛？
10. 如何处理一个数据存在的空值、重复值、错值？
11. 怎么用python的方式，查找一亿条数据里面的重复值？
12. python中的浅拷贝和深拷贝是什么？

数据处理

对python数据处理相关的知识点进行总结

1. 常用的数据处理的库有哪些

pandas：提供了数据结构和数据分析工具，支持多种数据格式的读取和写入，如 CSV、JSON、SQL 等。
numpy：提供了高效的数组计算和操作，支持多种数学运算和统计分析。支持多维数组和矩阵运算
matplotlib：提供了数据可视化工具，支持多种图形绘制，如折线图、柱状图、散点图等。
scikit-learn：提供了机器学习算法和工具，支持数据预处理、特征选择、模型训练和评估等。
TensorFlow：提供了深度学习框架和工具，支持神经网络的构建、训练和部署等。

2. pandas库怎么去做切分

## 将一列进行拆分
# 对 Name 列进行拆分，按照空格进行拆分
split_df = df['Name'].str.split()
# 将拆分后的结果保存到 DataFrame 中
split_df = df['Name'].apply(lambda x: x.split())

## 将行列进行切分
# 使用loc方法进行行的切分
row1 = df.loc[0]
# 使用iloc方法进行行的切分
row1 = df.iloc[0]
# 使用loc方法进行列的切分
column1 = df.loc[:, 'A']
# 使用iloc方法进行列的切分
column1 = df.iloc[:, 0]

3. pandas库怎么去做合并

# 合并两个 DataFrame
merged_df = pd.merge(df1, df2, on='A')
# 使用 concat()方法进行合并
concat_df = pd.concat([df1, df2], axis=1)
# 使用 join() 方法进行连接
joined_df = df1.join(df2, on=key)
# 使用 merge_asof() 方法进行合并
merged_df = pd.merge_asof(df1, df2, on=key)

4. numpy库基本操作有哪些

import numpy as np

# 创建一个数组
arr = np.array([1, 2, 3, 4, 5])
# 创建矩阵
m = numpy.mat([[1, 2], [3, 4]])
# 创建张量（Tensor）
numpy.tensor([[[1, 2], [3, 4]], [[5, 6

最低0.47元/天解锁文章