- 博客(5)
- 收藏
- 关注
原创 数据分析#数据预处理#python
数据分析是指运用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程。• 处理策略:可以选择删除包含缺失值的行或列,用平均值、中位数、众数等统计值填充,或者使用基于模型的方法进行预测填充。二. 数据导入:将收集到的数据导入到 Python 中,常用的库如 pandas 用于读取和处理不同格式的数据文件。四. 数据探索:对数据进行初步的观察和分析,如查看数据的基本统计信息、分布情况等。三. 数据清洗:处理缺失值、异常值、重复数据等,确保数据的质量和准确性。
2024-06-19 15:04:40
418
原创 neo4j教程-Cypher操作
执行上述命令后,Web UI界面的控制台返回“Added 2 labels, created 2 nodes, set 2 properties, created 1 relationship, completed after 3 ms.”信息,说明我们新增两个标签、创建两个节点、设置两个属性、创建一个关系(注意:标签Person是节点的标签;标签Likes是关系的标签)。上述语法中,DELETE是用于永久删除节点或关系的命令,该命令需要与MATCH命令结合使用,删除满足某个条件的节点;
2024-06-18 11:05:07
616
原创 爬取链家二手房房价数据存入mongodb并进行分析
实验目的1.使用python将爬虫数据存入mongodb;2.使用python读取mongodb数据并进行可视化分析。实验原理MongoDB是文档数据库,采用BSON的结构来存储数据。在文档中可嵌套其他文档类型,使得MongoDB具有很强的数据描述能力。本节案例使用的数据为链家的租房信息,源数据来自于链家网站,所以首先要获取网页数据并解析出本案例所需要的房源信息,然后将解析后的数据存储到MongoDB中,最后基于这些数据进行城市租房信息的查询和聚合分析等。实验环境Python3。
2024-06-16 10:51:48
652
原创 爬取链家二手房房价数据存入mongodb并进行分析
实验目的1.使用python将爬虫数据存入mongodb;2.使用python读取mongodb数据并进行可视化分析。实验原理MongoDB是文档数据库,采用BSON的结构来存储数据。在文档中可嵌套其他文档类型,使得MongoDB具有很强的数据描述能力。本节案例使用的数据为链家的租房信息,源数据来自于链家网站,所以首先要获取网页数据并解析出本案例所需要的房源信息,然后将解析后的数据存储到MongoDB中,最后基于这些数据进行城市租房信息的查询和聚合分析等。实验环境Python3。
2024-04-24 10:18:25
604
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人