自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 数据分析#数据预处理#python

数据分析是指运用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程。• 处理策略:可以选择删除包含缺失值的行或列,用平均值、中位数、众数等统计值填充,或者使用基于模型的方法进行预测填充。二. 数据导入:将收集到的数据导入到 Python 中,常用的库如 pandas 用于读取和处理不同格式的数据文件。四. 数据探索:对数据进行初步的观察和分析,如查看数据的基本统计信息、分布情况等。三. 数据清洗:处理缺失值、异常值、重复数据等,确保数据的质量和准确性。

2024-06-19 15:04:40 418

原创 neo4j教程-Cypher操作

执行上述命令后,Web UI界面的控制台返回“Added 2 labels, created 2 nodes, set 2 properties, created 1 relationship, completed after 3 ms.”信息,说明我们新增两个标签、创建两个节点、设置两个属性、创建一个关系(注意:标签Person是节点的标签;标签Likes是关系的标签)。上述语法中,DELETE是用于永久删除节点或关系的命令,该命令需要与MATCH命令结合使用,删除满足某个条件的节点;

2024-06-18 11:05:07 616

原创 爬取链家二手房房价数据存入mongodb并进行分析

实验目的1.使用python将爬虫数据存入mongodb;2.使用python读取mongodb数据并进行可视化分析。实验原理MongoDB是文档数据库,采用BSON的结构来存储数据。在文档中可嵌套其他文档类型,使得MongoDB具有很强的数据描述能力。本节案例使用的数据为链家的租房信息,源数据来自于链家网站,所以首先要获取网页数据并解析出本案例所需要的房源信息,然后将解析后的数据存储到MongoDB中,最后基于这些数据进行城市租房信息的查询和聚合分析等。实验环境Python3。

2024-06-16 10:51:48 652

原创 MongoDB分片部署(windows)

OS:win10。

2024-04-24 11:12:38 929

原创 爬取链家二手房房价数据存入mongodb并进行分析

实验目的1.使用python将爬虫数据存入mongodb;2.使用python读取mongodb数据并进行可视化分析。实验原理MongoDB是文档数据库,采用BSON的结构来存储数据。在文档中可嵌套其他文档类型,使得MongoDB具有很强的数据描述能力。本节案例使用的数据为链家的租房信息,源数据来自于链家网站,所以首先要获取网页数据并解析出本案例所需要的房源信息,然后将解析后的数据存储到MongoDB中,最后基于这些数据进行城市租房信息的查询和聚合分析等。实验环境Python3。

2024-04-24 10:18:25 604

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除