数据挖掘
文章平均质量分 94
开数据挖掘机的小可爱
这个作者很懒,什么都没留下…
展开
-
【Driven Data竞赛】——疫苗接种情况预测参赛
今天记录一下参加的DrivenData平台的一个数据类竞赛当Score:0.8515,排名(209/1808)前11.5%,还很菜,待提高ing. DrivenData是什么呢?目前有很多的数据类竞赛平台,较为大家熟知的有kaggle、天池等,DrivenData也是一个数据竞赛平台,上面有很多数据挖掘类竞赛,可以根据赛题类型、困难度进行选择适合自己的进行参加,有很多竞赛还是很适合初学者的。 我参与的是疫苗接种情况预测,全名: “Flu Shot Learning: Predict H1N1 and原创 2021-02-07 17:06:29 · 1033 阅读 · 2 评论 -
【数据挖掘】——Matplotlib可视化-常用图表绘制
一、基本格式设置 Matplotlib:python中一个数据可视化的库,可绘制2D图形,也就是说图形中包含x轴和y轴,因此在进行画图时需要传入x和y值。下面是一些关于绘图中的格式参数的介绍:① 设置图片大小:通过画布大小改变图片大小 plt.figure(figsize=(4,4),dpi=100) figsize:画布大小,是一个包括长和宽的列表 dpi:设置分辨率,dpi=100表示没一英寸有100个像素点④ 保存图片: plt.原创 2020-12-18 18:41:47 · 665 阅读 · 1 评论 -
【数据挖掘】—— 一文搞懂Numpy基本操作
Numpy是一个python科学计算库,支持数组和矩阵操作,可用于处理数值类型的数据,进行数值的计算分析一、ndarray ndarray是一个N维数组对象,它里边的数据必须是同类型的,而python中的list对象中数据可以是不同类型的。1.一维数组 ①将list转化为array:np.array(list)#数组计算a=[[1,2,3,4],[2,3,4,5],[3,4,5,6],[4,5,6,7]]b=np.array(a)print(b) ②利用range生成序列,利用原创 2020-12-19 12:05:51 · 174 阅读 · 1 评论 -
【数据挖掘】——pandas中Series和Dataframe
1. Series 类似numpy中的一维数组,但series更灵活,可以自定义索引。创建一维数组:s=Series(data=[1,2,3,4],index=list(‘abcd’))获取数组中的数据:s.values获取数组中的索引:s.index获取数据中的键值对:list(s.iteritems())将字典转换为Series:s=Series(dict),字典的key变为数组的索引,字典的value变为数组的value获取数组中的某个值:①按索引获取:s[ ‘小明’ : ’小亮’原创 2020-12-19 18:51:04 · 232 阅读 · 1 评论 -
【数据挖掘】——向量and矩阵
一、向量向量加减:m+n:对应位置元素加减向量乘以常数:m*3向量点乘(内积):np.dot(m,n)相应位置元素相乘再相加向量叉乘(外积):np.cross(m,n)向量哈达玛积:m*n对应位置相乘二、矩阵矩阵创建:np.mat(np.random.randint(1,10,size=(2,3))矩阵加减:A+B对应位置相加减,两个矩阵必须具有相同阶矩阵与数相乘:A*2矩阵与向量相乘:保证矩阵列数等于向量行数#矩阵与向量相乘import numpy as npA=np.m原创 2020-12-20 13:51:15 · 217 阅读 · 0 评论