关于sqlalchemy读写mysql密码含有【@】、中文读写、迭代器读写、数据精度

最新推荐文章于 2023-02-17 13:57:02 发布

泥鳅812

最新推荐文章于 2023-02-17 13:57:02 发布

阅读量930

点赞数

分类专栏： pandas DB sqlalchemy 文章标签： mysql 数据库 database

本文链接：https://blog.csdn.net/sinat_20174131/article/details/122106922

版权

DB 同时被 3 个专栏收录

28 篇文章 0 订阅

订阅专栏

pandas

1 篇文章 0 订阅

订阅专栏

sqlalchemy

1 篇文章 0 订阅

订阅专栏

class Database:
    def __init__(self):
        self.save_schema = 'dwd'
        self.save_table = 'dwd_xxx'
        self.mysql_dwd_config = {
            'drivername': 'mysql+pymysql',
            'username': 'user_a',
            'password': 'xxx@#$xxx',
            'host': 'am-xxxxx.ads.aliyuncs.com',
            'port': 3306,
        }

        if sqlalchemy.__version__ >= '1.4': #其实大于1.4.15之后，密码里面含有@，就必须以这种方式创建正确正则识别密码的引擎了。
            self.mysql_engine_url = sqlalchemy.engine.URL.create(**self.mysql_dwd_config)
            self.mysql_engine_url = self.mysql_engine_url.update_query_dict({'charset': 'utf8mb4'})
        else:
            # password 含有@
            self.mysql_engine_url = '{drivername}://{username}:{password}@{host}:{port}/?charset=utf8mb4'.format(**self.mysql_dwd_config)
        self.mysql_dwd_engine = sqlalchemy.create_engine(self.mysql_engine_url)

    @Usual.time_stat
    def drop_mysql(self):
        sql = f"DROP TABLE IF EXISTS {self.save_schema}.{self.save_table};"
        with self.mysql_dwd_engine.connect() as conn:
            conn.execute(sqlalchemy.text(sql))
        print('drop_table_done.')
        return

    @Usual.time_stat
    def get_mysql_data(self, sql, chunksize=None):
        if not chunksize:
            new_df = pd.read_sql(sql=sql, con=db.mysql_dwd_engine, chunksize=None)
        else:
            df_iter = pd.read_sql(sql=sql, con=db.mysql_dwd_engine, chunksize=chunksize)
            new_df = pd.DataFrame()
            for temp_df in df_iter:
                new_df = new_df.append(temp_df, ignore_index=True)
        print(f'get_df shape: {new_df.shape}')
        return new_df

    @Usual.time_stat
    def write_mysql_data(self, df, if_exists='replace'):
        df.to_sql(
            con=self.mysql_dwd_engine,
            schema=self.save_schema,
            name=self.save_table,
            if_exists=if_exists,
            index=False,
            index_label='id',
            chunksize=10000,
        )
 
	@Usual.time_stat
	def save_csv_feature_to_db(self, csv='/tmp/xxx_feature.csv', chunksize=1000):
	    with pandas.read_csv(csv, iterator=True, chunksize=chunksize) as reader:
	        for i,df in enumerate(reader):
	        	df = df.round(4) # 精度设置为4或6位，一般sql计算出来的小数位数可达16位，严重影响数据大小
	            self.write_mysql_data(df, if_exists='append')
	            logger.info(f'Saved to db: {(i+1)*chunksize}')
	    return

-- 插入中文不仅是读写引擎的encoding=utf8mb4问题，一般现在都是默认的
-- 所以是创建schema的原始问题
create schema your_schema collate utf8mb4_unicode_ci;

泥鳅812

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于sqlalchemy读写mysql密码含有【@】、中文读写、迭代器读写、数据精度

class Database: def __init__(self): self.save_schema = 'dwd' self.save_table = 'dwd_xxx' self.mysql_dwd_config = { 'drivername': 'mysql+pymysql', 'username': 'nx_user_a', 'password': 'xxx@#$xx
复制链接

扫一扫