今天开始学习的是将数据进行可视化,这个是在表格中提取的信息,先是将最高温显示出来
之后通过函数将日期加上
改变数据,将7月转变为全年的温度数据,很直观的可以看出7到9月的最高温度明显更高
在之后将最低温度也加在图上显示
加一个渐变的效果更直观
将两个地方的最高最低温度放在一起进行比较很直观
本来是打算在NOAA那个网站上下载数据再演示的,奈何半天没有邮件,不过这个博客上很详细的说明了应该如何下载气象数据,有需要的可以在这里学习
(1条消息) NOAA气象监测数据下载(可下载最新及每日气象数据)_孙同学的一个笔记本的博客-CSDN博客_noaa气象数据下载
再之后就是利用地震的数据进行了散点图的绘制,利用了pandas,不得不说将数据可视化后比单纯的数字看起来更加直观!!!
这个是这个单元的一些代码,实现了地震数据的散点图表示。
之后我将学习API的使用
哇,这个真的是好厉害啊,通过调用可以知道评论的ip、评论数等等知识,比一个一个去看方便多了
可以通过输出直接点击网页一个直接进到了github仓库中,一个是新闻的网页,真的感觉超厉害!!!
至此,这本编程书学完了所有内容,之后我又买了一本数据分析书估计明天到,继续开始学习可视化方面的知识!!!
之后是分类方面的逻辑回归方法进行学习
这个效果和之前用感知机的结果差不多,不过逻辑回归还可以用到线性不可分上
很显然此时的分界线不再是一条直线,而是一条曲线,并且很好的将两类点进行了分开
以下是随着学习次数的增加,它的精度值也在增加
从图中我们也可以看出,在大约1000左右时,精度值已经达到了1,因此在之后的学习中,当精度值已经达到一时就应该停止学习
之后用随机梯度下降法对其进行分类,效果依然显著!!!
接下来进行正则化方面:
首先是自己创建了一个曲线并加入了8个噪声点
当我没有进行正则化时,会出现过拟合现象,这是我用10阶拟合的效果
之后我又用了正则化的方法,很明显,曲线的效果有了更好的提升
通过对比图也是可以很明显的看出是否使用正则化的区别!!!
今天收获满满。同时完成了两本书的学习,之后的学习道路要更加努力!!!