试图从tags查询和元素时,pymongo抛出一个错误db.users.find({"pseudo":"alucaard"}).distinct("produit_up")
Out[1]:
[{u'abus': 0,
u'avctype': u'image/jpeg',
u'date': u'2012-09-15',
u'description': u'le fameux portable solide',
u'id': u'alucaard134766932677',
u'namep': u'nokia 3310',
u'nombre': 1,
u'orientation': u'portrait',
u'photo': ObjectId('5053cd4e3a5f3a0990da8a61'),
u'prix': 1000,
u'tags': [u'solide', u'le', u'fameux', u'portable'],
u'vendu': False}]
list(db.users.find({"solide":{"$in":{"document_up.tags"}}}))
Traceback (most recent call last):
File "C:\Python27\lib\site-packages\IPython\core\interactiveshell.py", line 2746, in run_code exec code_obj in self.user_global_ns, self.user_ns
File "", line 1, in
list(db.users.find({"solide":{"$in":{"document_up.tags"}}}))
File "C:\Python27\lib\site-packages\pymongo\cursor.py", line 778, in next
if len(self.__data) or self._refresh():
File "C:\Python27\lib\site-packages\pymongo\cursor.py", line 729, in _refresh
self.__uuid_subtype))
InvalidDocument: Cannot encode object: set(['document_up.tags'])
注意:对于pymongo用户来说,这只是一个技巧,如果您的用户在文本中的大小有限,那么只需使用一个集合转换它,然后将集合转换为一个列表:
例如:phrase = "hi you, how are you, am i using this"第一步:删除逗号或点以避免正则表达式搜索。
其次,使用phrase.split()分割单词。
将此项添加到set以避免重复单词。
将集合转换为list
这将是一个好主意,使一个措辞,包含一些词,将从名单上删除,如“如何”,“你”,“我”。。。但它会做很多计算。
希望这个想法会有帮助。