关于sqlalchemy读写mysql密码含有【@】、中文读写、迭代器读写、数据精度

1 篇文章 0 订阅
1 篇文章 0 订阅
class Database:
    def __init__(self):
        self.save_schema = 'dwd'
        self.save_table = 'dwd_xxx'
        self.mysql_dwd_config = {
            'drivername': 'mysql+pymysql',
            'username': 'user_a',
            'password': 'xxx@#$xxx',
            'host': 'am-xxxxx.ads.aliyuncs.com',
            'port': 3306,
        }

        if sqlalchemy.__version__ >= '1.4': #其实大于1.4.15之后,密码里面含有@,就必须以这种方式创建正确正则识别密码的引擎了。
            self.mysql_engine_url = sqlalchemy.engine.URL.create(**self.mysql_dwd_config)
            self.mysql_engine_url = self.mysql_engine_url.update_query_dict({'charset': 'utf8mb4'})
        else:
            # password 含有@
            self.mysql_engine_url = '{drivername}://{username}:{password}@{host}:{port}/?charset=utf8mb4'.format(**self.mysql_dwd_config)
        self.mysql_dwd_engine = sqlalchemy.create_engine(self.mysql_engine_url)

    @Usual.time_stat
    def drop_mysql(self):
        sql = f"DROP TABLE IF EXISTS {self.save_schema}.{self.save_table};"
        with self.mysql_dwd_engine.connect() as conn:
            conn.execute(sqlalchemy.text(sql))
        print('drop_table_done.')
        return

    @Usual.time_stat
    def get_mysql_data(self, sql, chunksize=None):
        if not chunksize:
            new_df = pd.read_sql(sql=sql, con=db.mysql_dwd_engine, chunksize=None)
        else:
            df_iter = pd.read_sql(sql=sql, con=db.mysql_dwd_engine, chunksize=chunksize)
            new_df = pd.DataFrame()
            for temp_df in df_iter:
                new_df = new_df.append(temp_df, ignore_index=True)
        print(f'get_df shape: {new_df.shape}')
        return new_df

    @Usual.time_stat
    def write_mysql_data(self, df, if_exists='replace'):
        df.to_sql(
            con=self.mysql_dwd_engine,
            schema=self.save_schema,
            name=self.save_table,
            if_exists=if_exists,
            index=False,
            index_label='id',
            chunksize=10000,
        )
 
	@Usual.time_stat
	def save_csv_feature_to_db(self, csv='/tmp/xxx_feature.csv', chunksize=1000):
	    with pandas.read_csv(csv, iterator=True, chunksize=chunksize) as reader:
	        for i,df in enumerate(reader):
	        	df = df.round(4) # 精度设置为4或6位,一般sql计算出来的小数位数可达16位,严重影响数据大小
	            self.write_mysql_data(df, if_exists='append')
	            logger.info(f'Saved to db: {(i+1)*chunksize}')
	    return     
-- 插入中文不仅是读写引擎的encoding=utf8mb4问题,一般现在都是默认的
-- 所以是创建schema的原始问题
create schema your_schema collate utf8mb4_unicode_ci;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值