数据分析与挖掘
文章平均质量分 73
无
Steven灬
不知不为过,不学就是错!
展开
-
Pandas-DataFrame常用基础知识点总结
注:以下知识点总结是将数据转为DataFrame格式数据的基础之上进行操作的(首先需要做的是将数据转为DataFrame格式)原创 2023-06-20 20:56:38 · 1429 阅读 · 0 评论 -
Jupyter中使用Pyecharts绘制地图
原因:传入的数据中,各省市的名称必须要和地图上显示的名称一致,不能简写。3、准备数据:需要将各省份和对应频率存储在一个 DataFrame 中,其中列名为 "province" 和 "frequency"。4、绘制地图:使用 Pyecharts 中的 Map 类,将各省份和对应频率填入其中,并设置地图属性。如果想绘制动态显示的地图:即随着时间的变化,各省份相关数据频率也发生变化,地图中颜色在动态变化显示。根据各省频率绘制地图,可以使用 Pyecharts 绘制。1、安装 Pyecharts:可以通过。原创 2023-06-18 21:17:25 · 4125 阅读 · 0 评论 -
Seaborn.load_dataset()加载数据集失败最佳解决方法
load_dataset() 是 Seaborn 库中提供的一个函数,用于加载一些原始数据集。这些数据集包含了许多经典的数据集,比如鸢尾花数据集、小费数据集等,这些数据集在数据可视化和机器学习中非常常见。使用 load_dataset() 函数可以方便地获取这些数据集,并将它们转换为 Pandas DataFrame 格式。这样我们就可以直接对这些数据集进行数据处理、分析和可视化等操作。原因:本地没有数据集。最后,将刚下载下来的数据放到这个文件夹下即可。解决方法:将Seaborn数据集下载到本地。原创 2023-06-01 15:26:25 · 4191 阅读 · 2 评论 -
数据分析初步之数据预处理
有段时间没写博客了,最近一直在忙自己的事。听说今天发一篇原创博客就可以领个勋章,想想没啥可写的,就把之前的学习笔记整理一下,1024,请赐我一枚勋章,哈哈哈……数据分析初步之数据预处理一、生成数据表import numpy as npimport pandas as pd1 导入数据表df = pd.DataFrame(pd.read_csv('name....原创 2019-10-24 16:22:11 · 2946 阅读 · 0 评论 -
python计算四分位及绘制箱型图
一、计算四分位#!/usr/bin/python# -*- coding: UTF-8 -*-"""@author:ZSW@file:quantile_distance.py@time:2021/02/05"""import pandas as pdimport numpy as np# 读取excle文件excel_data = pd.read_excel("1.xlsx")# print(excel_data)data1 = excel_data.to_dict(or原创 2021-02-18 13:38:36 · 9891 阅读 · 4 评论 -
Python调用高德地图web服务API实现地址与经纬度批量转换及地图可视化操作
网上在线经纬度批量转换资源(准确度稍微有偏差):1、经纬度在线查询,地名(批量)查询经纬度,经纬度(批量)查询地名2、经纬度查询,坐标拾取工具高德API官方文档地址:地理/逆地理编码:https://lbs.amap.com/api/webservice/guide/api/georegeo坐标转换:http://lbs.amap.com/api/webservice/guide/api/convert调用高德地图API前,需先申请高德地图key,https:/.原创 2020-11-09 18:16:28 · 4839 阅读 · 6 评论 -
Knime入门简单实践
KNIME Analytics Platform是开源的。下载链接:https://www.knime.com/downloads详细安装步骤 链接:https://blog.csdn.net/dilifish/article/details/103514503工作台介绍接着选择 File——New——New Knime Workflow,即新建文件,接着就可以慢慢探索踩坑了。连接数据库执行SQL语句获取数据:读取excle文件选择字段进行计算:参考链接:htt.原创 2020-10-24 15:43:15 · 5148 阅读 · 0 评论 -
数据挖掘项目之Airbnb 新用户的民宿预定结果预测
摘要本文主要根据对Airbnb 新用户的民宿预定结果进行预测,完整的陈述了从数据探索到特征工程到构建模型的整个过程。其中:1.数据探索部分主要基于pandas库,利用常见的:head(),value_counts(),describe(),isnull(),unique()等函数以及通过matplotlib作图对数据进行理解和探索;2. 特征工程部分主要是通过从日期中提取年...转载 2019-05-11 15:04:12 · 2889 阅读 · 0 评论