paddledetection x2coco不能分别转换训练集和测试集

分别转换测试集合训练集,将会导致类别出错,就是训练集和测试集的那个映射是不一样的。

 

PaddleX -- 飞桨全流程开发工具,以低代码的形式支持开发者快速实现产业实际项目落地。 PaddleX 集成飞桨智能视觉领域图像分类、目标检测、语义分割、实例分割任务能力,将深度学习开发全流程从数据准备、模型训练与优化到多端部署端到端打通,并提供统一任务API接口及图形化开发界面Demo。开发者无需分别安装不同套件,以低代码的形式即可快速完成飞桨全流程开发。 PaddleX 经过质检、安防、巡检、遥感、零售、医疗等十多个行业实际应用场景验证,沉淀产业实际经验,并提供丰富的案例实践教程,全程助力开发者产业实践落地。 安装: PaddleX提供三种开发模式,满足用户的不同需求: 1、Python开发模式: 通过简洁易懂的Python API,在兼顾功能全面性、开发灵活性、集成方便性的基础上,给开发者最流畅的深度学习开发体验。 前置依赖 paddlepaddle >= 1.8.4 python >= 3.6 cython pycocotools pip install paddlex -i https://mirror.baidu.com/pypi/simple 详细安装方法请参考PaddleX安装 2、Padlde GUI模式: 无代码开发的可视化客户端,应用Paddle API实现,使开发者快速进行产业项目验证,并为用户开发自有深度学习软件/应用提供参照。 前往PaddleX官网,申请下载PaddleX GUI一键绿色安装包。 前往PaddleX GUI使用教程了解PaddleX GUI使用详情。 PaddleX GUI安装环境说明 3、PaddleX Restful: 使用基于RESTful API开发的GUI与Web Demo实现远程的深度学习全流程开发;同时开发者也可以基于RESTful API开发个性化的可视化界面 前往PaddleX RESTful API使用教程 PaddleX 更新日志: v2.0.0.rc0 全面支持飞桨2.0动态图,更易用的开发模式 目标检测任务新增PP-YOLOv2, COCO test数据集精度达到49.5%、V100预测速度达到68.9 FPS 目标检测任务新增4.2MB的超轻量级模型PP-YOLO tiny 语义分割任务新增实时分割模型BiSeNetV2 C++部署模块全面升级  PaddleInference部署适配2.0预测库  支持飞桨PaddleDetectionPaddleSeg、PaddleClas以及PaddleX的模型部署  新增基于PaddleInference的GPU多卡预测  GPU部署新增基于ONNX的的TensorRT高性能加速引擎部署方式  GPU部署新增基于ONNX的Triton服务化部署方式 Tags:PaddleX源码包 PaddleX2.0 pp飞桨 PaddleX
假设你的数据集是以data为后缀的,比如traindata.csv和testdata.csv,其中traindata.csv包含y,x1,x2,x3的数据,testdata.csv只包含x1,x2,x3的数据。下面是使用pyspark mllib进行拆分和线性回归训练的代码: ```python from pyspark import SparkConf, SparkContext from pyspark.mllib.regression import LabeledPoint, LinearRegressionWithSGD from pyspark.mllib.util import MLUtils # 初始化Spark配置和SparkContext conf = SparkConf().setAppName("LinearRegression") sc = SparkContext(conf=conf) # 读取训练集测试集 trainData = MLUtils.loadLibSVMFile(sc, "traindata.csv") testData = MLUtils.loadLibSVMFile(sc, "testdata.csv") # 把训练集测试集分别拆分成y和x1,x2,x3 trainLabels = trainData.map(lambda lp: lp.label) trainFeatures = trainData.map(lambda lp: lp.features) testFeatures = testData.map(lambda lp: lp.features) # 把训练集分成训练集和验证集 (trainingData, validationData) = trainData.randomSplit([0.7, 0.3]) # 训练线性回归模型 model = LinearRegressionWithSGD.train(trainingData, iterations=100, step=0.1) # 使用验证集评估模型 valuesAndPreds = validationData.map(lambda p: (p.label, model.predict(p.features))) MSE = valuesAndPreds.map(lambda vp: (vp[0] - vp[1]) ** 2).reduce(lambda x, y: x + y) / valuesAndPreds.count() print("Mean Squared Error = " + str(MSE)) # 在测试集上预测 predictions = model.predict(testFeatures).collect() # 输出预测结果 print("Predictions: " + str(predictions)) # 停止SparkContext sc.stop() ``` 这段代码首先读取了训练集测试集,然后把训练集测试集分别拆分成y和x1,x2,x3。接着把训练集分成训练集和验证集,使用LinearRegressionWithSGD.train训练线性回归模型,使用验证集评估模型的性能。最后在测试集上预测,输出预测结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值