数据分析
文章平均质量分 70
数据分析,pandas,个人笔记
语译分西
这个作者很懒,什么都没留下…
展开
-
将excel数据格式转成tableau
import pandas as pddata = pd.read_excel('世界各国人口统计数据_2000-2020(世界银行).xlsx')data.head()print(data.columns.tolist())# 将上面显示出来的列名列表,选出几列作为主类别,此类别output = data.melt(id_vars=['Country Name','Country Code', '国家/地区名称'])outputoutput.to_excel('世界人口统计数据原创 2021-08-03 21:21:45 · 545 阅读 · 0 评论 -
桌面研究-数据源
文章目录1.各国每年人口统计表2.各国年龄结构表3. 国家简介4.城镇化率5.美国房屋统计数据1.各国每年人口统计表1.世界人口表2.世界银行人口统计表2.各国年龄结构表世界年龄分布表CIA的年龄结构数据3. 国家简介1.CIA国家简介4.城镇化率1.世界银行数据2.世界人口、城镇化率5.美国房屋统计数据1.美国房屋统计数据2.statista美国房屋数据...原创 2021-07-13 21:31:16 · 364 阅读 · 0 评论 -
如何生成youtube token
1.注册谷歌账号2.登入谷歌开发者中心 developer console 开发者中心3.创建项目4.启用API服务,勾选youtube5.配置同意屏幕只能选供外部使用然后设置应用名称,保存6.创建凭据7.生成API 和 OAuth 客户端ID选择桌面设备然后下载json文件8.命名Json文件 client_serecet_x.json9.将json文件放到如下程序同目录import osimport numpy as npimport google_auth_oau原创 2020-06-07 10:27:08 · 355 阅读 · 0 评论 -
商务统计分析(第3章 数据描述)
文章目录一、描述数值的度量1.1 集中趋势1.平均数2.中位数3.众数1.2 离散程度1.全距/极差2.方差、标准差3.变异系数4.Z值5.分布形状1.3 总体数据的数值型描述度量1.经验法则(适用于数据对称)2.切比雪夫法则(适用于不对称的数据)1.4 描述两个变量之间的关系的度量1. 协方差(covariance)2.相关系数(coefficient of correlation)一、描述数值的度量在统计应用中,对数值变量进行总结和描述的时候,通常从三个维度进行分析1. 集中趋势:所有数据观测值是原创 2020-10-27 15:18:11 · 2374 阅读 · 0 评论 -
3. Pandas数据预处理
目录一、删除属性/特征选择1.1 删除某几列无用的属性、特征1.2 选择,保留某些特定属性1.3 更改特征,属性列的顺序1.4 删除只有一个值的属性二、缺失值处理2.1 只要有缺失值null就删除该行样本2.2 样本中有x个以上的缺失值才删除该行样本2.3 样本种所有数据都缺失才删除该行样本2.4 使用属性列的均值来填充缺失值2.5 使用特定值来填充缺失值2.6 使用缺失值的前一个/后一个值代替N...原创 2019-09-18 21:18:21 · 4188 阅读 · 1 评论 -
2.Pandas预览数据
目录1.设置Pandas显示参数2.浏览头5行,后5行数据3.检查数据是否存在缺失值3.1 普通检查3.2 复杂检查(能显示缺失百分比)3.3最终检查4. 了解数据的属性名,数据量,数据类型(data_type)5.了解数据的均值、方差、最大最小值...6.了解数据的形状(几行几列)7.获取属性名/列名7.1返回index对象7.2返回array对象7.3变成列表list格式8. 查看featur...原创 2019-08-25 16:23:28 · 1509 阅读 · 0 评论 -
1. Pandas 导入导出数据
一、利用Pandas导入数据1.导入Excel,CSV文件import pandas from pddata = pd.read_excel('data_file_location') #encoding = ’gbk’ data = pd.read_csv('data_file_location’) #engine=’python’ ...原创 2019-08-25 09:29:12 · 392 阅读 · 0 评论