- 博客(7)
- 收藏
- 关注
原创 Python数据分析与可视化(数据分析)
我们可以很快地发现,与其他所有相关性相比,“hoursperweek”与“educationnum”之间具有更高的相关性,但并不是很高。不过要注意的一件事是,label是分类的,因此计算相关性实际上并没有应用,采用分组频率可能是一种更好的方法。在此示例中,variable的有A,B,Ç,这是一个长格式。values参数是用于计算的列,index参数用于创建多个行的索引值,columns参数用于要在其上创建多个列的值。我们要做的是将两列传递给函数,您将获得这两个变量的所有成对组合的频数。
2024-10-30 09:56:43 859
原创 python数据分析与可视化
数据清洗:填充缺失数据、消除噪声数据等,主要通过分析“脏数据”的产生原因和存在形式,利用现有的数据挖掘手段和方法去清洗“脏数据”,将“脏数据”转化为满足数据质量要求和应用要求的数据,从而提高数据集的质量,满足现阶段数据分析的需求。丰富的标准库和丰富的第三方库:Python 的标准库提供了大量的模块和函数,支持各种常见的任务,如文件 I/O、网络编程、数据库交互等。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。
2024-06-19 14:12:03 2689
原创 neo4j教程-Cypher操作
执行上述命令后,Web UI界面的控制台返回“Added 2 labels, created 2 nodes, set 2 properties, created 1 relationship, completed after 3 ms.”信息,说明我们新增两个标签、创建两个节点、设置两个属性、创建一个关系(注意:标签Person是节点的标签;标签Likes是关系的标签)。上述语法中,DELETE是用于永久删除节点或关系的命令,该命令需要与MATCH命令结合使用,删除满足某个条件的节点;
2024-06-18 10:20:54 1609
原创 Redis安装部署(基于windows平台)
redis简介键值对存储数据库是NoSQL数据库的一种类型,也是最简单的NoSQL数据库。顾名思义,键值对存储数据库中的数据是以键值对的形式来存储的。常见的键值对存储数据库有Redis、Tokyo Cabinet/Tyrant、Voldemort以及Oracle BDB数据库。Remote Dictionary Server,简称Redis,即远程字典服务器,它是一个开源的、高性能的、基于键值对的缓存与存储数据库,并且通过提供多种键值数据结构来适应不同场景下的缓存与存储需求。
2024-06-16 11:24:28 1604
原创 爬取链家二手房房价数据存入mongodb并进行分析
实验目的1.使用python将爬虫数据存入mongodb;2.使用python读取mongodb数据并进行可视化分析。实验原理MongoDB是文档数据库,采用BSON的结构来存储数据。在文档中可嵌套其他文档类型,使得MongoDB具有很强的数据描述能力。本节案例使用的数据为链家的租房信息,源数据来自于链家网站,所以首先要获取网页数据并解析出本案例所需要的房源信息,然后将解析后的数据存储到MongoDB中,最后基于这些数据进行城市租房信息的查询和聚合分析等。实验环境Python3。
2024-06-16 10:39:57 730
原创 MongoDB分片部署(windows)
OS:win10MongoDB:4.4.24从图中可以看出,分片集群中主要由三个部分组成,即分片服务器( Shard )、路由服务器( Mongos )以及配置服务器( Config Server )组成。其中,分片服务器有三个,即 Shard1 、Shard2 、 Shard3 ;路由服务器有两个,即 Mongos1 和 Mongos2 ;配置服务器有三个,即主、副、副。主要有如下所述三个主要组件:Shard: 用于存储实际的数据块,实际生产环境中一个shard server 角可由几台机器组个一
2024-04-23 16:48:39 655
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人