自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 统计学的Python实现-003:中位数

中位数:一组数据按顺序排列后位于中间位置的数值。当该组数据中数值个数为奇数时,中位数为中间位置的数值;当该组数据中数值个数为偶数时,中位数为中间位置两个数值的均值。该组数据中最多有一半的数值小于中位数,也最多有一半的数值大于中位数;因为该组数据中可能有若干数值等于中位数。实现代码方法一:通过判断解决数据个数为奇数、偶数的问题def descriptive_median_1(lis...

2019-03-08 10:59:54 1450

原创 统计学的Python实现-004:众数

众数:一组数据中出现次数最多的数值,一组数据可以不存在、存在一个或多个众数,众数用M表示。当所有数据出现次数都相同时,众数不存在。实现思路因为无法直接获知一个数组当中出现频率最高的数值,所以我们需要先统计数组中每一个数值的出现次数,而后再找出所有出现次数最高的数值。其中:记录每个数值的出现次数,可以使用哈希表存储,变量值的值作为key,变量值出现的频数作为value。 若发现变量值列...

2019-03-07 14:37:02 4573

原创 Python+Pip开发环境安装

我们在电脑上安装一种编程语言的开发环境的过程,就好像经营一家蛋糕房,需要建蛋糕生产的工坊,发卖蛋糕的广告,买做蛋糕、卖蛋糕的工具,装修蛋糕房。在安装Python开发环境的过程中,我们需要做类似的几件事儿:安装Python(相当于建工坊) 将Python的安装路径添加到环境变量path中(相当于在发广告,让电脑里的其他文件知道电脑里有Python) 安装Python包管理工具pip(相当...

2019-03-07 06:48:54 724

Kaggle:tmdb-box-office-prediction(转结构化数据,用于 SQL 练习)

原数据源(将其训练集结构化): https://www.kaggle.com/c/tmdb-box-office-prediction/data 数据量级+建表语句(含字段含义注释)详见博客: https://dataartist.blog.csdn.net/article/details/132268426 共 15 个表: - movies:电影表 - belongs_to_collection:电影系列表 - person:人员表(演员与剧组人员) - cast_rela:电影与演员的关联表 - crew_rela:电影与剧组人员的关联表 - genres:电影体裁表 - genres_rela:电影与体裁关联表 - keywords:电影关键词表 - keywords_rela:电影与关键词关联表 - production_companies:电影制作公司表 - production_companies_rela:电影与制作公司关联表 - production_countries:电影制作国家表 ……

2023-08-14

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除