数据科学概论
文章平均质量分 68
数据科学概论项目记录
单身狗尊享
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据科学导论复习个人整理
综合了各方的材料整理综合了这一份 但是考试被EDA打脸(doge) 把图片删了,老师课件外传不好 所以涉及老师课件的图都删了,只写知识点名称 大数据概述 1.大数据时代技术支撑:存储设备容量不断增加、CPU处理能力大幅提升、网络带宽不断增加 2.大数据概念:大数据不仅仅是数据的“大量化”,而是包含“快速化”、“多样化”和“价值化”等多重属性 4.云计算概念:云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。 5.云计算关.原创 2021-01-02 16:54:15 · 5395 阅读 · 0 评论 -
山东大学软件学院2020-2021数据科学导论试题回忆
2021.1.2 16:00 刚出考场,心情沉重 考试前半小时,院表白墙有人发帖说 表白某老师,之前说不考试,后来又考 考啥也不明确 复习起来像开天辟地 评论区开始接龙“他甚至连天和地是啥都没说” 属实给我逗乐了 一、简答 1.大数据的全生命周期的各个阶段是什么,用疫情监测应用例子来描述。 2.(1)什么是EDA(Exploratory data analysis),探索性数据分析 (2)探索性数据分析的过程,以及与传统的统计分析的区别? 3.举例说明为什么传统的关系型数据库在web2.0的数据管.原创 2021-01-02 16:17:46 · 981 阅读 · 0 评论 -
python seaborn countplot绘图
任务是得到这么一张图 操作过程中,网络上的学习资料大多是命令行操作进行学习,pycharm里画图无从下手。但是从b站视频听老师讲了这么一句话 seaborn库里封装了 matplotlib 所以,应该是: #此处省略语句 sns.countplot(x='',data=dataframe) plt.show() #即可显示出画的图 参数说明 countplot函数的参数: x='diagnosis' 意味着图形是竖着的,用dataframe里面的diagnosis属性做横轴 若写成 y='diagn原创 2020-11-29 22:02:19 · 2561 阅读 · 0 评论 -
python pandas库读写csv踩坑
任务是读取csv文件,删除特定的三列数据,然后再存为csv格式 但是这个过程中发现存为csv后,出现如下情况 存入了一列为索引的数据 注意to_csv()函数index参数,默认为True 对于DataFrame数据: Color Number 0 red 22 1 blue 10 如果设置True,结果为 ,Color,Number 0,red,22 1,blue,10 而如果False,则没有索引行 Color,Number red,22 blue,10 impor原创 2020-11-29 21:45:41 · 304 阅读 · 0 评论
分享