collection其实就是关系型数据库中的table一样。通常说的“一张表”,在mongodb中就是一个collection.
而shard是集群中的概念。
mongodb集群分两种:一种是Replica set,即副本集,由多个mongod组成,mongod之间存在主副关系,数据是同一份;另一种就是你说的分片,分三个角色,mongos,configserver,以及mongod,configserver存储的是元数据,通常是三个保存同一份数据,mongod实例则可以是单台mongod,也可以是一个副本集。几个mongod共同组成一大份数据。
shard其实通常是指第二种中的mongod。
实际上由于mongodb中分片是以collection为单位,因此一个shard上可以保存不同的数据。
接下来回答你的问题:
1中的理解是错的,一个shard是指一个单台mongod,或者多台mongod组成的副本集
通常是一个服务器或者服务器集群
新插入的collection?这个说话有点不对。
在建立了一个collection后,通常是要给它分片或者不分片的。
如果不分片,所有的数据,都会保存在一个shard上。
如果分片,在数据量未达到chunksize的情况下,还是会在一个shard上,当一个chunk已经饱和,则会生成新的chunk,至于新的chunk在哪个shard上,则是随机的,通常是会选择chunk最小的shard。
至于我刚才提的chunk,这个才是分片中的数据迁移基本单位。