whoosh mysql_Writer.add_文档（）函数错误Whoosh mysql循环

最新推荐文章于 2024-01-06 10:58:22 发布

weixin_39553705

最新推荐文章于 2024-01-06 10:58:22 发布

阅读量102

点赞数

文章标签： whoosh mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39553705/article/details/114009399

版权

我试图索引一个数据库的大量文章，它是用拉丁语1编码的。我已经用charset解决了编码问题，但是我无法将添加到索引中的每一行。在

我试过：

1)writer.add_document(Id = unicode(row["Id"]),Body = unicode(row["Body"]), Name = unicode(row["Name"]), Brand = unicode(row["Brand"]), Familia = unicode(row["Familia"]))

这将索引文档，但不考虑索引标签。在

2)

^{pr2}$

此报告add_document()只接受1个参数(给定2个)错误

以下是完整代码：# Open a writer for the index

with ix.writer() as writer:

con= mdb.connect(host="myhost",

user="myuser",

passwd="pass",

db="db",

charset="utf8",

use_unicode=True)

with con:

cur = con.cursor(mdb.cursors.DictCursor)

#cur.execute("SELECT Id, Body, Name, Brand, Familia FROM articles")

rows = cur.fetchall()

for row in rows:

print row

doc6 = row["Brand"]

doc2 = row["Name"]

print doc2

print 'body'

doc3 = row["Body"].replace("á", "a")

doc3 = doc3.replace("é", "e")

doc3 = doc3.replace("í", "i")

doc3 = doc3.replace("ó", "o")

doc3 = doc3.replace("ú", "u")

doc3 = doc3.replace("ñ", "n")

doc3 = doc3.replace(""", "")

print doc3

print 'familia'

doc4 = row["Familia"]

print doc4

print 'id'

doc5 = row["Id"]

print doc5

writer.add_document(Id = unicode(row["Id"]),Body = unicode(row["Body"]), Name = unicode(row["Name"]), Brand = unicode(row["Brand"]), Familia = unicode(row["Familia"]))

#

# doc = unicode(doc5),unicode(doc3), unicode(doc2), unicode(doc6), unicode(doc4)

# writer.add_document(doc) #reports add_document() takes exactly 1 argument (2 given) Error

#writer.add_document(Id = unicode(doc5),Body = unicode(doc3), Name = unicode(doc2), Brand = unicode(doc6), Familia = unicode(doc4))

numdocs = ix.doc_count_all()

print "docs indexed =", numdocs

提前谢谢大家！在

weixin_39553705

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
whoosh mysql_Writer.add_文档（）函数错误Whoosh mysql循环

我试图索引一个数据库的大量文章，它是用拉丁语1编码的。我已经用charset解决了编码问题，但是我无法将添加到索引中的每一行。在我试过：1)writer.add_document(Id = unicode(row["Id"]),Body = unicode(row["Body"]), Name = unicode(row["Name"]), Brand = unicode(row["Brand"]...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。