- 博客(2)
- 收藏
- 关注
原创 『数据挖掘』什么样的数据才能称得上是大数据?
在我看来,只有数据量很大且数据维度全的数据才能够称得上是大数据。 为什么数据量必须得要大? 这是因为如果我们使用局部样本来代替整体的时候,可能会由于局部样本不能够完全反映整体,从而导致我们对整体的真实情况的认知造成偏差。例如当我们以贴吧和网易的用户素质来作为全体网民的整体素质,显然会造成我们对整体网民素质的认知要远比真实的素质要低,而如果用知乎来代替整体,则也会
2016-02-18 20:28:04 2192
原创 Python思考之一:『性质决定用途』——利用set和dict来进行去重
我在高中时代学习化学的时候,听到过一句话,我深以为然——结构决定性质,性质决定用途。这里的性质指的是化学物质的物理性质和化学性质,化学物质的质量、颜色、是固态or液态or气态,而化学性质则指的是能够发生什么化学反应以及在反应的过程中产生的化学现象。 而在Python中『性质决定用途』也同样适用。例如set(集合)具有键(元素)互不相同的性质,那么我们可以利用set 的这一性质进行
2016-02-17 18:55:31 1491
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人