算法数据分析实例—城市气候与海洋关系数据分析—[线性回归:y=w*x+b]

这篇博客介绍了如何使用Python的NumPy、Pandas和matplotlib进行数据分析,特别是通过线性回归模型研究城市气候与海洋距离的关系。文章涵盖了数据导入、数据清洗、去除无关列以及利用sklearn建立线性回归模型来预测和分类。
摘要由CSDN通过智能技术生成

原文:
https://www.cnblogs.com/feifeifeisir/p/10497943.html
https://www.cnblogs.com/zhang-zi-yi/p/10749497.html
https://blog.csdn.net/lm_is_dc/article/details/81260847 (详细)

1. 导入包

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

import matplotlib.pyplot as plt



from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题

NumPy(Numerical Python)是 Python 中的一个线性代数库。对每一个数据科学或机器学习 Python 包而言,这都是一个非常重要的库,SciPy(Scientific Python)、Mat-plotlib(plotting library)、Scikit-learn 等都在一定程度上依赖 NumPy。
对数组执行数学运算和逻辑运算时,NumPy 是非常有用的。在用 Python 对 n 维数组和矩阵进行运算时,NumPy 提供了大量有用特征。

1.1 安装 NumPy

  1. 如果你已经装有 Anaconda,那么你可以使用以下命令通过终端或命令提示符安装 NumPy:
    conda install numpy

  2. 如果你没有 Anaconda,那么你可以使用以下命令从终端上安装 NumPy:
    pip install numpy

安装好 NumPy 后,你就可以启动 Jupyter notebook 开始学习了。接下来从 NumPy 数组开始。

https://www.runoob.com/numpy/numpy-install.html

1.2 安装 Pandas

pandas 对于数据分析的人员来说都是必须熟悉的第三方库,pandas 在科学计算上有很大的优势,特别是对于数据分析人员来说,相当的重要。python中有了Numpy ,但是Numpy 还是比较数学化,还需要有一种库能够更加具体的代表数据模型,我们都非常的清楚在数据处理中EXCEL 扮演着非常重要的作用,表格的模式是数据模型最好的一种展现形式。

pandas 是对表格数据模型在python上的模拟,它有简单的像SQL 对数据的处理,能够方便的在python上实现。

https://www.cnblogs.com/bugingcode/p/8310032.html

1.3 安装数据可视化matplotlib.pyplot

https://www.jianshu.com/p/85a01b7d6507
https://blog.csdn.net/zzx2016zzx/article/details/83099583
https://jingyan.baidu.com/article/eb9f7b6d4a1365869364e839.html

2. 导入数据各个海滨城市数据

ferrara1 = pd.read_csv('./ferrara_150715.csv')
ferrara2 = pd.read_csv('./ferrara_250715.csv')
ferrara3 = pd.read_csv('./ferrara_270615.csv')
ferrara=pd.concat([ferrara1,ferrara1,ferrara1],ignore_index=True)

torino1 = pd.read_csv('./torino_150715.csv')
torino2 = pd.read_csv('./torino_250715.csv')
torino3 = pd.read_csv('./torino_270615.csv')
torino = pd.concat([torino1,torino2,torino3],ignore_index=True) 

mantova1 = pd.read_csv('./mantova_150715.csv')
mantova2 = pd.read_csv('./mantova_250715.csv')
mantova3 = pd.read_csv('./mantova_270615.csv')
mantova = pd.concat([mantova1,mantova2,mantova3],ignore_index=True) 

mil
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值