![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据科学概论
文章平均质量分 68
数据科学概论项目记录
单身狗尊享
这个作者很懒,什么都没留下…
展开
-
数据科学导论复习个人整理
综合了各方的材料整理综合了这一份但是考试被EDA打脸(doge)把图片删了,老师课件外传不好所以涉及老师课件的图都删了,只写知识点名称大数据概述1.大数据时代技术支撑:存储设备容量不断增加、CPU处理能力大幅提升、网络带宽不断增加2.大数据概念:大数据不仅仅是数据的“大量化”,而是包含“快速化”、“多样化”和“价值化”等多重属性4.云计算概念:云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。5.云计算关.原创 2021-01-02 16:54:15 · 4850 阅读 · 0 评论 -
山东大学软件学院2020-2021数据科学导论试题回忆
2021.1.2 16:00刚出考场,心情沉重考试前半小时,院表白墙有人发帖说表白某老师,之前说不考试,后来又考考啥也不明确复习起来像开天辟地评论区开始接龙“他甚至连天和地是啥都没说”属实给我逗乐了一、简答1.大数据的全生命周期的各个阶段是什么,用疫情监测应用例子来描述。2.(1)什么是EDA(Exploratory data analysis),探索性数据分析(2)探索性数据分析的过程,以及与传统的统计分析的区别?3.举例说明为什么传统的关系型数据库在web2.0的数据管.原创 2021-01-02 16:17:46 · 769 阅读 · 0 评论 -
python seaborn countplot绘图
任务是得到这么一张图操作过程中,网络上的学习资料大多是命令行操作进行学习,pycharm里画图无从下手。但是从b站视频听老师讲了这么一句话seaborn库里封装了 matplotlib所以,应该是:#此处省略语句sns.countplot(x='',data=dataframe)plt.show()#即可显示出画的图参数说明countplot函数的参数:x='diagnosis' 意味着图形是竖着的,用dataframe里面的diagnosis属性做横轴若写成y='diagn原创 2020-11-29 22:02:19 · 2407 阅读 · 0 评论 -
python pandas库读写csv踩坑
任务是读取csv文件,删除特定的三列数据,然后再存为csv格式但是这个过程中发现存为csv后,出现如下情况存入了一列为索引的数据注意to_csv()函数index参数,默认为True对于DataFrame数据:Color Number0 red 221 blue 10如果设置True,结果为,Color,Number0,red,221,blue,10而如果False,则没有索引行Color,Numberred,22blue,10impor原创 2020-11-29 21:45:41 · 211 阅读 · 0 评论