逻辑回归与梯度算法

最新推荐文章于 2024-07-03 13:21:32 发布

wukk007

最新推荐文章于 2024-07-03 13:21:32 发布

阅读量1.9k

点赞数

分类专栏： python 文章标签：算法

本文链接：https://blog.csdn.net/fennvde007/article/details/12745671

版权

python 专栏收录该内容

99 篇文章 1 订阅

订阅专栏

逻辑回归（logistic regression）

1. sigmoid 函数：

梯度上升（Gradient Ascent）与梯度下降（Gradient Descent）：

2. 循环迭代的梯度上升计算系数w：

 
         def  
         loadDataSet(): 
        
         dataMat  
         =  
         []; labelMat  
         =  
         [] 
        
         fr  
         =  
         open 
         ( 
         'testSet.txt' 
         ) 
        
         for  
         line  
         in  
         fr.readlines(): 
        
         lineArr  
         =  
         line.strip().split() 
        
         dataMat.append([ 
         1.0 
         ,  
         float 
         (lineArr[ 
         0 
         ]),  
         float 
         (lineArr[ 
         1 
         ])])   
         # here set x0=1.0 
        
         labelMat.append( 
         int 
         (lineArr[ 
         2 
         ])) 
        
         return  
         dataMat,labelMat 
        
         def  
         sigmoid(inX): 
        
         return  
         1.0 
         / 
         ( 
         1 
         + 
         exp( 
         - 
         inX)) 
        
         def  
         gradAscent(dataMatIn, classLabels): 
        
         dataMatrix  
         =  
         mat(dataMatIn)              
         #convert to NumPy matrix 
        
         labelMat  
         =  
         mat(classLabels).transpose()  
         #convert to NumPy matrix 
        
         m,n  
         =  
         shape(dataMatrix) 
        
         alpha  
         =  
         0.001 
        
         maxCycles  
         =  
         500 
        
         weights  
         =  
         ones((n, 
         1 
         )) 
        
         for  
         k  
         in  
         range 
         (maxCycles):               
         #heavy on matrix operations 
        
         h  
         =  
         sigmoid(dataMatrix 
         * 
         weights)      
         #matrix mult 
        
         error  
         =  
         (labelMat  
         -  
         h)               
         #vector subtraction 
        
         #weights = weights + alpha * dataMatrix.transpose()* error 
        
         weights  
         =  
         weights  
         +  
         alpha  
         *  
         dataMatrix.transpose() 
         *  
         error 
         / 
         m   
         #matrix mult 
        
         return  
         weights

3. 画出上面2计算出来的分类结果：

 
    
         def  
         plotBestFit(weights): 
        
 
              
         import  
         matplotlib.pyplot as plt 
        
 
              
         dataMat,labelMat 
         = 
         loadDataSet() 
        
 
              
         dataArr  
         =  
         array(dataMat) 
        
 
              
         n  
         =  
         shape(dataArr)[ 
         0 
         ]  
        
 
              
         xcord1  
         =  
         []; ycord1  
         =  
         [] 
        
 
              
         xcord2  
         =  
         []; ycord2  
         =  
         [] 
        
 
              
         for  
         i  
         in  
         range 
         (n): 
        
 
                  
         if  
         int 
         (labelMat[i]) 
         = 
         =  
         1 
         : 
        
 
                      
         xcord1.append(dataArr[i, 
         1 
         ]); ycord1.append(dataArr[i, 
         2 
         ]) 
        
 
                  
         else 
         : 
        
 
                      
         xcord2.append(dataArr[i, 
         1 
         ]); ycord2.append(dataArr[i, 
         2 
         ]) 
        
 
              
         fig  
         =  
         plt.figure() 
        
 
              
         ax  
         =  
         fig.add_subplot( 
         111 
         ) 
        
 
              
         ax.scatter(xcord1, ycord1, s 
         = 
         30 
         , c 
         = 
         'red' 
         , marker 
         = 
         's' 
         ) 
        
 
              
         ax.scatter(xcord2, ycord2, s 
         = 
         30 
         , c 
         = 
         'green' 
         ) 
        
 
              
         x  
         =  
         arange( 
         - 
         3.0 
         ,  
         3.0 
         ,  
         0.1 
         ) 
        
 
              
         y  
         =  
         ( 
         - 
         weights[ 
         0 
         ] 
         - 
         weights[ 
         1 
         ] 
         * 
         x) 
         / 
         weights[ 
         2 
         ]       
         #for sigmoid,input=0 is the classifier line for 0 and 1, so the classifier is w0x0+w1x1+w2x2=0 
        
 
              
         ax.plot(x, y) 
        
 
              
         plt.xlabel( 
         'X1' 
         ); plt.ylabel( 
         'X2' 
         ); 
        
 
              
         plt.show() 
        
 
  

4.随机梯度上升(stochastic gradient ascent)

由于上述的梯度上升算法，每次迭代都是用到全部的数据集，当数据量特别大，并且特征维数特别高时，计算量将会非常巨大；因此一种替代方法就是每次迭代更新都是用一个新样本来完成，即随机梯度上升法。

随机梯度上升法（1）步长a可变（2）每次迭代，随机选取样本来更新系数w

 
    
         def  
         stocGradAscent1(dataMatrix, classLabels, numIter 
         = 
         150 
         ): 
        
 
              
         m,n  
         =  
         shape(dataMatrix) 
        
 
              
         weights  
         =  
         ones(n)    
         #initialize to all ones 
        
 
              
         for  
         j  
         in  
         range 
         (numIter): 
        
 
                  
         dataIndex  
         =  
         range 
         (m) 
        
 
                  
         for  
         i  
         in  
         range 
         (m): 
        
 
                      
         alpha  
         =  
         4 
         / 
         ( 
         1.0 
         + 
         j 
         + 
         i) 
         + 
         0.0001     
         #apha decreases with iteration, does not  
        
 
                      
         randIndex  
         =  
         int 
         (random.uniform( 
         0 
         , 
         len 
         (dataIndex))) 
         #go to 0 because of the constant 
        
 
                      
         h  
         =  
         sigmoid( 
         sum 
         (dataMatrix[randIndex] 
         * 
         weights)) 
        
 
                      
         error  
         =  
         classLabels[randIndex]  
         -  
         h 
        
 
                      
         weights  
         =  
         weights  
         +  
         alpha  
         *  
         error  
         *  
         dataMatrix[randIndex] 
        
 
                      
         del 
         (dataIndex[randIndex]) 
        
 
              
         return  
         weights 
        
 
  

这样可以用比较少次数的迭代，就会得到和2里相类似的结果，下图是numIter=5次随机梯度结果：

  
  
   
   #coding:utf-8
  
  
  
  
   
   #===================================
  
  
  
  
   
   #Logistic回归
  
  
  
  
   
   #author:zhang haibo
  
  
  
  
   
   #time: 2013-7-12
  
  
  
  
   
   #===================================
  
  
  
  
   
    
  
  
  
  
   
   import 
   
   math
  
  
  
  
   
   from 
   
   numpy 
   
   import 
   
   *
  
  
  
  
   
    
  
  
  
  
   
   #加载数据集
  
  
  
  
   
   def 
   
   loadDataSet
   
   ():
  
  
  
      
   
   dataMat 
   
   = 
   
   []; 
   
   labelMat 
   
   =
   
   []
  
  
  
      
   
   fr 
   
   = 
   
   open
   
   (
   
   'testSet.txt'
   
   )
  
  
  
      
   
   for 
   
   line 
   
   in 
   
   fr
   
   .
   
   readlines
   
   ():
  
  
  
          
   
   lineArr 
   
   = 
   
   line
   
   .
   
   strip
   
   ()
   
   .
   
   split
   
   ()
  
  
  
          
   
   dataMat
   
   .
   
   append
   
   ([
   
   1.0
   
   , 
   
   float
   
   (
   
   lineArr
   
   [
   
   0
   
   ]), 
   
   float
   
   (
   
   lineArr
   
   [
   
   1
   
   ])])
  
  
  
          
   
   labelMat
   
   .
   
   append
   
   (
   
   int
   
   (
   
   lineArr
   
   [
   
   2
   
   ]))
  
  
  
      
   
   return 
   
   dataMat
   
   , 
   
   labelMat
  
  
  
  
   
    
  
  
  
  
   
   #sigmod函数
  
  
  
  
   
   def 
   
   sigmoid
   
   (
   
   inX
   
   ):
  
  
  
      
   
   return 
   
   1.0
   
   /
   
   (
   
   1
   
   +
   
   exp
   
   (
   
   -
   
   inX
   
   ))
  
  
  
  
   
    
  
  
  
  
   
   #Logistic回归梯度上升优化算法：用全部的样本进行训练，大量的乘法
  
  
  
  
   
   def 
   
   gradAscent
   
   (
   
   dataMatIn
   
   , 
   
   classLabels
   
   ):
  
  
  
      
   
   dataMatrix 
   
   = 
   
   mat
   
   (
   
   dataMatIn
   
   )
  
  
  
      
   
   labelMat 
   
   = 
   
   mat
   
   (
   
   classLabels
   
   )
   
   .
   
   transpose
   
   ()
  
  
  
      
   
   m
   
   ,
   
   n 
   
   = 
   
   shape
   
   (
   
   dataMatrix
   
   )
  
  
  
      
   
   alpha 
   
   = 
   
   0.001
  
  
  
      
   
   maxCycles 
   
   = 
   
   500
  
  
  
      
   
   weights 
   
   = 
   
   ones
   
   ((
   
   n
   
   ,
   
   1
   
   ))
  
  
  
      
   
   for 
   
   k 
   
   in 
   
   range
   
   (
   
   maxCycles
   
   ):
  
  
  
          
   
   h 
   
   = 
   
   sigmoid
   
   (
   
   dataMatrix
   
   *
   
   weights
   
   )
  
  
  
          
   
   error 
   
   = 
   
   (
   
   labelMat 
   
   - 
   
   h
   
   )
  
  
  
          
   
   weights 
   
   = 
   
   weights 
   
   + 
   
   alpha 
   
   * 
   
   dataMatrix
   
   .
   
   transpose
   
   () 
   
   * 
   
   error
  
  
  
      
   
   return 
   
   weights
  
  
  
  
   
    
  
  
  
  
   
   #随机梯度上升算法:在线学习算法，每次仅用一个样本进行训练
  
  
  
  
   
   def 
   
   stocGradAscent0
   
   (
   
   dataMatrix
   
   , 
   
   classLabels
   
   ):
  
  
  
      
   
   m
   
   ,
   
   n 
   
   = 
   
   shape
   
   (
   
   dataMatrix
   
   )
  
  
  
      
   
   alpha 
   
   = 
   
   0.01
  
  
  
      
   
   weights 
   
   = 
   
   ones
   
   (
   
   n
   
   )
  
  
  
      
   
   for 
   
   i 
   
   in 
   
   range
   
   (
   
   m
   
   ):
  
  
  
          
   
   h 
   
   = 
   
   sigmoid
   
   (
   
   sum
   
   (
   
   dataMatrix
   
   [
   
   i
   
   ]
   
   *
   
   weights
   
   ))
  
  
  
          
   
   error 
   
   = 
   
   classLabels
   
   [
   
   i
   
   ] 
   
   - 
   
   h
  
  
  
          
   
   weights 
   
   += 
   
   alpha
   
   *
   
   error
   
   *
   
   dataMatrix
   
   [
   
   i
   
   ]
  
  
  
      
   
   return 
   
   weights
  
  
  
  
   
    
  
  
  
  
   
   #改进的随机梯度上升算法
  
  
  
  
   
   def 
   
   stocGradAscent1
   
   (
   
   dataMatrix
   
   , 
   
   classLabels
   
   , 
   
   numIter
   
   =
   
   150
   
   ):
  
  
  
      
   
   m
   
   ,
   
   n 
   
   = 
   
   shape
   
   (
   
   dataMatrix
   
   )
  
  
  
      
   
   weights 
   
   = 
   
   ones
   
   (
   
   n
   
   )
  
  
  
      
   
   for 
   
   j 
   
   in 
   
   range
   
   (
   
   numIter
   
   ):
  
  
  
          
   
   dataIndex 
   
   = 
   
   range
   
   (
   
   m
   
   )
  
  
  
          
   
   for 
   
   i 
   
   in 
   
   range
   
   (
   
   m
   
   ):
  
  
  
              
   
   alpha 
   
   = 
   
   4
   
   /
   
   (
   
   1.0
   
   +
   
   j
   
   +
   
   i
   
   ) 
   
   + 
   
   0.01
  
  
  
              
   
   randIndex 
   
   = 
   
   int
   
   (
   
   random
   
   .
   
   uniform
   
   (
   
   0
   
   ,
   
   len
   
   (
   
   dataIndex
   
   )))
  
  
  
              
   
   h 
   
   = 
   
   sigmoid
   
   (
   
   sum
   
   (
   
   dataMatrix
   
   [
   
   dataIndex
   
   [
   
   randIndex
   
   ]]
   
   *
   
   weights
   
   ))
  
  
  
              
   
   error 
   
   = 
   
   classLabels
   
   [
   
   dataIndex
   
   [
   
   randIndex
   
   ]] 
   
   - 
   
   h
  
  
  
              
   
   weights 
   
   += 
   
   alpha
   
   *
   
   error
   
   *
   
   dataMatrix
   
   [
   
   dataIndex
   
   [
   
   randIndex
   
   ]]
  
  
  
              
   
   del
   
   (
   
   dataIndex
   
   [
   
   randIndex
   
   ])
  
  
  
      
   
   return 
   
   weights
  
  
  
  
   
    
  
  
  
  
   
    
  
  
  
  
   
   #Logistic回归分类函数
  
  
  
  
   
   def 
   
   classifyVector
   
   (
   
   inX
   
   , 
   
   weights
   
   ):
  
  
  
      
   
   prob 
   
   = 
   
   sigmoid
   
   (
   
   sum
   
   (
   
   inX
   
   *
   
   weights
   
   ))
  
  
  
      
   
   if 
   
   prob 
   
   > 
   
   0.5 
   
   :
  
  
  
          
   
   return 
   
   1.0
  
  
  
      
   
   else
   
   :
  
  
  
          
   
   return 
   
   0.0
  
  
  
      
  
  
  
  
   
   #示例：预测病马的死亡率
  
  
  
  
   
   def 
   
   colicTest
   
   ():
  
  
  
      
   
   frTrain 
   
   = 
   
   open
   
   (
   
   'horseColicTraining.txt'
   
   )
  
  
  
      
   
   frTest 
   
   = 
   
   open
   
   (
   
   'horseColicTest.txt'
   
   )
  
  
  
      
   
   trainingSet 
   
   = 
   
   []; 
   
   trainingLabels 
   
   = 
   
   []
  
  
  
      
   
   for 
   
   line 
   
   in 
   
   frTrain
   
   .
   
   readlines
   
   ():
  
  
  
          
   
   currLine 
   
   = 
   
   line
   
   .
   
   strip
   
   ()
   
   .
   
   split
   
   (
   
   '
   
   \t
   
   '
   
   )
  
  
  
          
   
   lineArr 
   
   = 
   
   []
  
  
  
          
   
   for 
   
   i 
   
   in 
   
   range
   
   (
   
   21
   
   ):
  
  
  
              
   
   lineArr
   
   .
   
   append
   
   (
   
   float
   
   (
   
   currLine
   
   [
   
   i
   
   ]))
  
  
  
          
   
   trainingSet
   
   .
   
   append
   
   (
   
   lineArr
   
   )
  
  
  
          
   
   trainingLabels
   
   .
   
   append
   
   (
   
   float
   
   (
   
   currLine
   
   [
   
   21
   
   ]))
  
  
  
      
   
   trainWeights 
   
   = 
   
   stocGradAscent1
   
   (
   
   array
   
   (
   
   trainingSet
   
   ), 
   
   trainingLabels
   
   , 
   
   500
   
   )
  
  
  
      
   
   errorCount 
   
   = 
   
   0
   
   ; 
   
   numTestVec 
   
   = 
   
   0.0
  
  
  
      
   
   for 
   
   line 
   
   in 
   
   frTest
   
   .
   
   readlines
   
   ():
  
  
  
          
   
   numTestVec 
   
   += 
   
   1.0
  
  
  
          
   
   currLine 
   
   = 
   
   line
   
   .
   
   strip
   
   ()
   
   .
   
   split
   
   (
   
   '
   
   \t
   
   '
   
   )
  
  
  
          
   
   lineArr 
   
   = 
   
   []
  
  
  
          
   
   for 
   
   i 
   
   in 
   
   range
   
   (
   
   21
   
   ):
  
  
  
              
   
   lineArr
   
   .
   
   append
   
   (
   
   float
   
   (
   
   currLine
   
   [
   
   i
   
   ]))
  
  
  
          
   
   if 
   
   int
   
   (
   
   classifyVector
   
   (
   
   array
   
   (
   
   lineArr
   
   ), 
   
   trainWeights
   
   )) 
   
   != 
   
   int
   
   (
   
   currLine
   
   [
   
   21
   
   ]):
  
  
  
              
   
   errorCount 
   
   += 
   
   1
  
  
  
          
   
   errorRate 
   
   = 
   
   (
   
   float
   
   (
   
   errorCount
   
   )
   
   /
   
   numTestVec
   
   )
  
  
  
          
   
   print 
   
   "the error rate of this test is: 
   
   %f
   
    " 
   
   % 
   
   errorRate
  
  
  
          
   
   return 
   
   errorRate
  
  
  
  
   
    
  
  
  
  
   
   def 
   
   multiTest
   
   ():
  
  
  
      
   
   numTests 
   
   = 
   
   10
   
   ; 
   
   errorSum 
   
   = 
   
   0.0
  
  
  
      
   
   for 
   
   k 
   
   in 
   
   range
   
   (
   
   numTests
   
   ):
  
  
  
          
   
   errorSum 
   
   += 
   
   colicTest
   
   ()
  
  
  
      
   
   print 
   
   "after 
   
   %d
   
    iterations the average error rate is: 
   
   %f
   
   " 
   
   %
   
   (
   
   numTests
   
   , 
   
   errorSum
   
   /
   
   float
   
   (
   
   numTests
   
   )) 
  
  
  
      
  
  
  
  
   
    
  
  
  
  
   
   #=============测试代码=====================
  
  
  
  
   
   dataArr
   
   , 
   
   labelMat 
   
   = 
   
   loadDataSet
   
   ()
  
  
  
  
   
   print 
   
   gradAscent
   
   (
   
   dataArr
   
   , 
   
   labelMat
   
   )
  
  
  
  
   
   print 
   
   stocGradAscent1
   
   (
   
   array
   
   (
   
   dataArr
   
   ),
   
   labelMat
   
   )
  
  
  
  
   
   multiTest
   
   ()