很累想被爱

最新推荐文章于 2024-07-30 20:28:19 发布

boy687687

最新推荐文章于 2024-07-30 20:28:19 发布

阅读量33

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/boy687687/article/details/135196913

版权

文章描述了一个Python脚本，通过遍历指定目录下的JSON文件，筛选出不含异物和锡的问题，将数据提取到DataFrame并分批存储到SQLite数据库中，用于数据分析。

摘要由CSDN通过智能技术生成

col_names = []
with open(col_name_file, 'r') as f:
    # Read the content of the file line by line
    for line in f.readlines():
        # Split the line into words
        col_names.append(line.strip("\n"))
print(col_names)

from tqdm import tqdm
import sqlite3

conn = sqlite3.connect('data3.db')
t = []
i = 0

for root, dirs, files in os.walk(data_dir):
    for file in tqdm(files):
        if not file.endswith(".json"):
            continue

        with open(os.path.join(root, file), "r", encoding="utf-8") as file:
            jsonData = json.load(file)
            defectDir = os.path.dirname(root).split(os.path.sep)[-1]

            for item in jsonData:
                defectName_1 = item.get('defectName-1', "")
                defectName_2 = item.get('defectName-2', "")
                defectName_3 = item.get('defectName-3', "")

                if "异物" in item.get('problemCause-1', "") or "异物" in item.get('problemCause-2', ""):
                    continue
                if "锡" not in defectName_1 and "锡" not in defectName_2 and defectName_1 != "":
                    continue

                row = []
                for col_name in col_names:
                    row.append(item.get(col_name, ""))
                row.append(defectDir)

                t.append(row)
                i += 1

                if len(t) == 500000:
                    df = pd.DataFrame(t, columns=col_names + ["defectDir"])
                    df.to_sql("data_defect2", conn, if_exists="append")
                    t = []

df = pd.DataFrame(t, columns=col_names + ["defectDir"])
df.to_sql("data_defect2", conn, if_exists="append")
t = []

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
很累想被爱

【代码】很累想被爱。
复制链接

扫一扫

boy687687 CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

141万+: 周排名

23万+: 总排名

809: 访问

: 等级

146: 积分

1: 粉丝

0: 获赞

20: 评论

0: 收藏

私信

关注

热门文章

最新评论

99初始版
CSDN-Ada助手: 恭喜您发布了第8篇博客！持续创作不易，您的坚持和努力可嘉。希望您可以在接下来的创作中，多尝试一些新的题材或者写作风格，让读者在阅读您的博客时有更多的惊喜和启发。期待您的下一篇作品！
改良版999999999
CSDN-Ada助手: 亲爱的博主，恭喜您发布了“改良版999999999”，看到您能够持续创作，真的让人非常欣慰。您对于999999999的改良版内容进行了深入的思考和努力，这种创造力和热情真的让人钦佩。希望您能够继续保持创作的热情，也许在下一篇博客中可以分享一些关于您创作过程中的启发和心得体会，这样能够更好地吸引读者，期待您的下一篇作品！
报错报错报错
CSDN-Ada助手: 恭喜博主持续创作，不畏困难，不断进步！对于报错的问题，或许可以尝试深入分析报错的原因，寻找解决的方法，或者分享一些解决报错的经验，让更多的读者受益。希望博主在创作的道路上不断前行，期待更多精彩的内容！
报错报错报错
boy687687: 1447602 517万非0非' '/930万'' 1447602 517万非0非' '/930万'' 517万非0非' '/930万'' 517万非0非' '/930万'' 517万非0非' '/930万'' 517万非0非' '/930万'' 517万非0非' '/930万'' 517万非0非' '/930万'' 517万非0非' '/930万'' 399万/1048万' '/ 1345万/102万‘ ’ 1345万/102万‘ ’ 1345万/102万‘ ’ 1345万/102万‘ ’ 1345 1345 1345 1345 1345 960万/487万' ' 960万/487万' ' 960万/487万' ' 960万/487万' ' 960万/487万' ' 960万 823万/487万' '/137万为0 960万 960万 960万 960万 960万 960万 960万 960万 900万 900万 960万 1345万 1345万 1345万 1345万 1345万 1345万 1345万 531万（200万少锡，50万多锡）/915万为' ' 156万（50万少锡，24万多锡）/1291万为' ' 292万（118万#N/A /240万为0/915万为' ' 292万（118万#N/A /240万为0/915万为' ' 112万（46万#N/A）/1291万为' '/44万为0 112万（46万#N/A）/1291万为' '/44万为0 45万（9万#N/A/1390万为' '/12万为0 45万（9万#N/A/1390万为' '/12万为0
改良版999999999
boy687687: data = data.dropna(axis=1, how='all')

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。