kaggle比赛练习_1: 做的什么菜?(What's Cooking?)

本文介绍了Kaggle数据分析竞赛平台,并探讨了'What's Cooking?'比赛,这是一个预测菜品的挑战。通过使用逻辑回归(LR)方法,作者分享了实验性代码,旨在提供实践机器学习算法的机会,提升对算法理解及编程能力。
摘要由CSDN通过智能技术生成

Kaggle简介

Kaggle是一个数据分析的竞赛平台,网址:https://www.kaggle.com/。企业或者研究者可以将数据、问题描述、期望的指标发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案,类似于KDD-CUP(国际知识发现和数据挖掘竞赛)。Kaggle上的参赛者将数据下载下来,分析数据,然后运用机器学习、数据挖掘等知识,建立算法模型,解决问题得出结果,最后将结果提交,排名前面的可能会获得丰厚的报酬

我们又不是大牛,那么kaggle对于我们有什么意义呢?个人觉得是练习,纸上得来终觉浅,把书本,paper中的机器学习算法,写成代码用于实际问题中,可以提高自己对算法的理解与写代码的能力。(从最简单的开始)工作之余,也要提高自己,所以最近准备在kaggle上做一些题目,也写出来与大家分享讨论。 本博客给出的代码都是准确度一般的实验性代码,排名不会靠前,只做练习分享。

菜品是什么?what’s cooking

训练数据包含,”ID,菜品,菜品,菜的原料”,菜品是要预测的类,菜的原料可以认为是feature. 训练数据只包含“ID, 菜的原料”,需要预测菜品是哪一类。由 Yummly公司提供的真实数据。
问题提供的数据为json格式。

LR解法

本文用多类的逻辑回归算法,采用随即梯度下降法优化,得到了76%的预测准确率。代码如下。
# -*- coding: utf-8 -*-
'''
Created on 2015-9-25

@author: joeyqzhou
'''
import json
import numpy as np
import csv


t_set = set()
x_set = set() #x : feature

learning_rate = 1

alpha = 0.00001 #正则项惩罚系数
iter_time = 5

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值