自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 『数据挖掘』什么样的数据才能称得上是大数据?

在我看来,只有数据量很大且数据维度全的数据才能够称得上是大数据。        为什么数据量必须得要大?        这是因为如果我们使用局部样本来代替整体的时候,可能会由于局部样本不能够完全反映整体,从而导致我们对整体的真实情况的认知造成偏差。例如当我们以贴吧和网易的用户素质来作为全体网民的整体素质,显然会造成我们对整体网民素质的认知要远比真实的素质要低,而如果用知乎来代替整体,则也会

2016-02-18 20:28:04 2150

原创 Python思考之一:『性质决定用途』——利用set和dict来进行去重

我在高中时代学习化学的时候,听到过一句话,我深以为然——结构决定性质,性质决定用途。这里的性质指的是化学物质的物理性质和化学性质,化学物质的质量、颜色、是固态or液态or气态,而化学性质则指的是能够发生什么化学反应以及在反应的过程中产生的化学现象。        而在Python中『性质决定用途』也同样适用。例如set(集合)具有键(元素)互不相同的性质,那么我们可以利用set 的这一性质进行

2016-02-17 18:55:31 1469

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除