自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 JUPYTER数据可视化分析

通过观察曲线,我们可以看到,在40-60岁和80岁的年龄段,密度更高、更窄,这表明这些年龄段的数据相对密集。结论:从图表中,我们可以观察到,在血糖水平为100至160之间,糖尿病患者的数量显著增加,尤其是在血糖水平达到峰值的140时。我们使用“cut()”函数将年龄分为四组,使用“value_counts()”功能计算每组的计数,绘制条形图,设置图表标题和轴标签,并在每个条形图上注释计数数据以便于查看。由于这是一个从互联网上下载的数据集,没有丢失值,我手动随机删除了CSV文件中的一些值。

2024-06-30 14:50:24 754

原创 Python 网络爬虫实战:使用 Scrapy + MongoDB 爬取京东网站并部署到云服务器上

在这里有一个小的坑,就是实际按这种方法获取的时候,程序会报错,说找不到 标签中的 src 这个属性,将整个标签打印出来后发现, 标签里确实没有 src 属性,反而是有一个 source-data-lazy-img 的属性,它的值也是一个图片的 URL,在浏览器中打开也是可以正确获取到图片的。我们通过 response.url 得到当前的 url,提取 &page= 后面的值,得到当前的页数,将这个页数加一,然后拼接成新的下一页的 url ,通过 Request 方法去访问,即可实现下一页的爬取。

2024-06-17 13:03:03 1446

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除