我有一个大型的
MySQL 5.1数据库,并且出于各种愚蠢的原因,我一直存储,我相信在UTF8表格中编码为LATIN1的UTF8字符.真奇怪.我想修复它.
MySQL – Convert latin1 characters on a UTF8 table into UTF8的问题似乎是一个工作 – 一次一列.但是我有24个表和几十个列来转换.我真的在寻找一种能够一次转换至少一张表的解决方案.
作为参考,适用于我的单列解决方案是:
UPDATE foo SET col1 = CONVERT(CAST(CONVERT(col1 USING latin1) AS binary) USING utf8);
对于表,我可以做:
ALTER TABLE foo CONVERT TO CHARACTER SET latin1;
ALTER TABLE foo CONVERT TO CHARACTER SET binary;
ALTER TABLE foo CHARACTER SET utf8 COLLATE utf8_unicode_ci;
这使我非常接近 – 但是,CONVERT TO CHARACTER SET二进制步骤将所有VARCHAR列转换为VARBINARY,并将我的TEXT列一次性转换为BLOB.我可以通过并改变他们,所有似乎都很好…但是我回到了“让我们单独修改所有的列”世界 – 在这种情况下,我也可以
我在这些SQL语句中尝试了大约50个变体,但是我找不到一个在字符数据类型中留下我的列并且正确编码数据的变量.
有什么建议么?
更新:决定只是修复列,而不是等待数据库或表格解决方案,我想出了:
#!/usr/bin/env ruby
require 'rubygems'
require 'mysql2'
CONNECT_OPTS = {} # whatever you want
Mysql2::Client.default_query_options.merge!(:as => :array)
conn = Mysql2::Client.new(CONNECT_OPTS)
tables = conn.query("SHOW TABLES").map {|row| row[0] }
# See http://dev.mysql.com/doc/refman/5.0/en/charset-column.html
# One might want to include enum and set columns; I don't have them
TYPES_TO_CONVERT = %w(char varchar text)
tables.each do |table|
puts "converting #{table}"
# Get all the columns and we'll filter for the ones we want
columns = conn.query("DESCRIBE #{table}")
columns_to_convert = columns.find_all {|row|
TYPES_TO_CONVERT.include? row[1].gsub(/\(\d+\)/, '')
}.map {|row| row[0]}
next if columns_to_convert.empty?
query = "UPDATE `#{table}` SET "
query += columns_to_convert.map {|col|
"`#{col}` = convert(cast(convert(`#{col}` using latin1) as binary) using utf8)"
}.join ", "
puts query
conn.query query
end
…完成工作有趣的是,这在36秒内运行在我的数据库上,而不是在需要13分钟(有VARBINARY问题)的ALTER TABLE路由或mysqldump解决方案的情况下运行在我的数据库上,假设我可以让它们运行
如果有人知道一个完美的数据库或表格的优雅方式,我仍然会接受一个答案.