自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (1)
  • 收藏
  • 关注

原创 《数据科学概论》Python上机练习

备注:仅用于检验python语言的学习效果,面向数据分析和处理,做编程练习。整个数据科学概论的教学大纲(包括其他上机练习),请参考https://blog.csdn.net/xiongpai1971/article/details/89364071Python与机器学习初步1,(决策树-易)通过信息增益,进行决策树第一个特征选择,请参考5.2.1。 备注:使用课...

2019-03-02 22:21:24 904

原创 理解大数据的三个V实验序列

1,Volume实验 要求:在助教协助下,利用云平台进行Word Count MapReduce实验(或者Sort/Inverted Index等)。目的:对大数据的分布式处理有更加直观认识。提示:助教撰写实验指导。1,助教准备一个大文本文件1GB。2,启动Hadoop,把文件上传HDFS,运行Word Count MapReduce程序,打印结果并且分析,获得Top...

2019-03-02 20:00:43 1075

词项向量化的各种技术

这里讨论如何把一个个的单词转换为向量。这是单词的表示形式(Representation),我们希望这个表示形式,能够捕抓到单词的意思(Meanings)、单词间的语义关系(Semantic Relationships),以及单词所出现的上下文。

2019-04-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除