算法数据分析实例—城市气候与海洋关系数据分析—[线性回归：y=w*x+b]

最新推荐文章于 2023-05-29 11:15:43 发布

CHEN_BR

最新推荐文章于 2023-05-29 11:15:43 发布

阅读量1.1k

点赞数 1

分类专栏： Data analysis

本文链接：https://blog.csdn.net/Theo93/article/details/102367119

版权

这篇博客介绍了如何使用Python的NumPy、Pandas和matplotlib进行数据分析，特别是通过线性回归模型研究城市气候与海洋距离的关系。文章涵盖了数据导入、数据清洗、去除无关列以及利用sklearn建立线性回归模型来预测和分类。

摘要由CSDN通过智能技术生成

算法数据分析实例—城市气候与海洋关系数据分析—[线性回归：y=w*x+b]

原文：
https://www.cnblogs.com/feifeifeisir/p/10497943.html
https://www.cnblogs.com/zhang-zi-yi/p/10749497.html
https://blog.csdn.net/lm_is_dc/article/details/81260847 （详细）

1. 导入包

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

import matplotlib.pyplot as plt



from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题

NumPy（Numerical Python）是 Python 中的一个线性代数库。对每一个数据科学或机器学习 Python 包而言，这都是一个非常重要的库，SciPy（Scientific Python）、Mat-plotlib（plotting library）、Scikit-learn 等都在一定程度上依赖 NumPy。
对数组执行数学运算和逻辑运算时，NumPy 是非常有用的。在用 Python 对 n 维数组和矩阵进行运算时，NumPy 提供了大量有用特征。

1.1 安装 NumPy

如果你已经装有 Anaconda，那么你可以使用以下命令通过终端或命令提示符安装 NumPy：
conda install numpy
如果你没有 Anaconda，那么你可以使用以下命令从终端上安装 NumPy：
pip install numpy

安装好 NumPy 后，你就可以启动 Jupyter notebook 开始学习了。接下来从 NumPy 数组开始。

https://www.runoob.com/numpy/numpy-install.html

1.2 安装 Pandas

pandas 对于数据分析的人员来说都是必须熟悉的第三方库，pandas 在科学计算上有很大的优势，特别是对于数据分析人员来说，相当的重要。python中有了Numpy ，但是Numpy 还是比较数学化，还需要有一种库能够更加具体的代表数据模型，我们都非常的清楚在数据处理中EXCEL 扮演着非常重要的作用，表格的模式是数据模型最好的一种展现形式。

pandas 是对表格数据模型在python上的模拟，它有简单的像SQL 对数据的处理，能够方便的在python上实现。

https://www.cnblogs.com/bugingcode/p/8310032.html

1.3 安装数据可视化matplotlib.pyplot

https://www.jianshu.com/p/85a01b7d6507
https://blog.csdn.net/zzx2016zzx/article/details/83099583
https://jingyan.baidu.com/article/eb9f7b6d4a1365869364e839.html

2. 导入数据各个海滨城市数据

ferrara1 = pd.read_csv('./ferrara_150715.csv')
ferrara2 = pd.read_csv('./ferrara_250715.csv')
ferrara3 = pd.read_csv('./ferrara_270615.csv')
ferrara=pd.concat([ferrara1,ferrara1,ferrara1],ignore_index=True)

torino1 = pd.read_csv('./torino_150715.csv')
torino2 = pd.read_csv('./torino_250715.csv')
torino3 = pd.read_csv('./torino_270615.csv')
torino = pd.concat([torino1,torino2,torino3],ignore_index=True) 

mantova1 = pd.read_csv('./mantova_150715.csv')
mantova2 = pd.read_csv('./mantova_250715.csv')
mantova3 = pd.read_csv('./mantova_270615.csv')
mantova = pd.concat([mantova1,mantova2,mantova3],ignore_index=True) 

mil