调参总结

一.Tensorflow的迭代次数到底应该设置为多少?

  1. 训练集对迭代次数的影响
  2. 学习率对迭代次数的影响
  3. 权重对迭代次数的影响
  4. 隐藏层节点数对迭代次数的影响
  5. 卷积核数量对迭代次数的影响
  6. 网络层数对迭代次数的影响

二.迭代次数对网络分类准确率的影响

三.快速设定网络参数的一种便捷方法

 

1.训练集对迭代次数的影响

完全相同的两个对象无法被分成两类,比如用一个二分类网络去分类mnist的0和0,这个网络的分类准确率永远是50%。也就是说分类两个完全相同的对象的迭代次数是无穷大,由此可以引申出如果两个被分类对象之间的差异越小,与之对应的迭代次数将越大。

因此可以将迭代次数理解成是两个被分类对象之间差异大小的量度。

制作9个网络分别用来分类0-1到0-9

(mnis 0, mnist x)-con(3*3)-49-30-2-(1,0)(0,1)

三层网络节点数是81,30,2。有一个3*3的卷积核,分类mnist的0和mnist x,让x=1-9,让0向(1,0)收敛,让x向(0,1)收敛。

同时设置这个网络的迭代停止标准是

|输出函数-目标函数|<δ

让δ等于0.1到1e-7的31个值,每组值收敛199次,统计每次的迭代次数并统计平均值,得到的表格

 

9

6

8

2

5

3

4

7

1

δ

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

0.1

2362.905

2763.372

2617.372

2785.725

3508.412

2567.648

2352.869

2232.146

2081.131

1.00E-02

3377.824

3516.397

3487.045

3620.905

4482.322

3501.432

3239.744

3104.673

2850.236

1.00E-03

4638.894

4851.055

4888.638

4846.435

6103.94

4664.523

4525.779

4367.447

4126.91

1.00E-04

7127.503

7646.131

6770.578

7709.22

8919.698

7099.93

6481.905

6468.623

5887.709

9*1e-5

7156.286

7773.497

7345.497

7951.16

9349.02

7262.709

6723.286

6437.633

5996.663

8*1e-5

7367.859

7928.668

7308.02

8182.51

9539.442

7505.925

6901.276

6564.357

6169.337

7*1e-5

7518.492

8338.367

7442.362

8193.28

10203.43

7687.362

6983.593

6779.578

6184.608

6*1e-5

7833.106

8790.824

7950.407

8780.59

9851.553

8094.297

7224.774

6887.774

6469.729

5*1e-5

8203.98

8774.352

7781.106

9227.095

10868.83

8405.387

7523.724

7299.528

6686.593

4*1e-5

8463.402

9638.643

8625.352

9473.415

11182.1

8815.392

7910.116

7553.477

7160.337

3*1e-5

9201.839

10600.94

9775.462

10478

12931.17

9679.422

8599.352

8293.955

7711.472

2*1e-5

10848.2

11411.08

11628.49

12060.84

14625.32

10461.67

9137.015

8723.643

8744.005

1.00E-05

13375.71

14873

14918.06

19757.36

20225.77

12683.54

11235.33

10555.44

9885.658

9*1e-6

13466.41

15159.28

14988.04

22245.54

21326.77

13059.99

11316.15

10476.27

9949.095

8*1e-6

14629.72

17935.03

16597.2

22214.93

23468.94

13171.09

11563.64

10925.47

10597.78

7*1e-6

14828.54

18620.5

17736.16

28045.61

24229.22

13862.52

12665.93

11219.57

10781.61

6*1e-6

15859.35

19321.87

20981.81

28410.34

27358.97

15417.61

13010.63

11748.35

11409.87

5*1e-6

18927.24

21230.97

21156.49

33681.76

31394.19

15919.56

13712.61

12474.75

11777.72

4*1e-6

19663.64

24558.27

24769.43

37281.58

36071.51

18205.72

14354.06

13049.01

12539.73

3*1e-6

26072.95

31304.92

32129.62

45173.59

43770.63

22269.52

16352.39

14324.43

13767.38

2*1e-6

34811.55

46862.86

53448.89

60366.62

53362.96

31163.59

18902.75

16918.78

14645.3

1.00E-06

70131.85

100355.9

73646.55

90392.45

76472.83

47298.7

29535.1

21313.81

18080.93

9*1e-7

77841.01

103772.7

81385.9

99247.65

86231.85

50701.34

28357.42

21287.42

18234.14

8*1e-7

108462

119839

91615.03

95016.96

91895.45

50896.83

32744.68

24145.12

19182.81

7*1e-7

123232.6

129092.7

109482.4

113411.5

94373.55

62449.56

35204.73

27625.46

20378.61

6*1e-7

140167.9

127953.1

109426.8

116304.3

101428.6

64837.91

39191.89

29357.48

20348.53

5*1e-7

149534.4

156705.3

124867.1

129507.3

95963.77

77875.12

48544.11

40684.06

22365.02

4*1e-7

164962.1

161217.8

137533.3

135768.1

112533.3

88745.73

60192.69

40085.21

23351.5

3*1e-7

249506.1

205342.5

159985.3

149701.4

120549.3

114492.7

69731.63

62320.85

27243.87

2*1e-7

289655.7

256312.4

187551.5

155856.8

135646.8

141850.7

99327.43

74617.93

34178.87

1.00E-07

 

318339.7

 

207402.7

159863.3

1.82E+05

155931.3

133071.7

38643.19

 

可以明显的观察到0-9的迭代次数最大,0-1的迭代次数最少

对应同一个δ迭代次数n由小到大的顺序是1<7<4<3<5<2<8<6<9,这一规律体现出09的差异比较小相应的迭代次数就比较多,而01的差异则比较大相应的迭代次数则比较少。这两个迭代次数之间的比值可以达到8.45倍。

 

2.学习率对迭代次数的影响

(mnis 0, mnist 2)-con(3*3)-49-30-2-(1,0)(0,1)

用网络分类0-2,让学习率从0.6变化到1e-3,让δ=0.1到1e-7,利用多次测量求平均值的办法统计对应每个δ和每个学习率的迭代次数

δ\r

0.6

0.5

0.4

0.3

0.2

0.1

9*1e-2

8*1e-2

7*1e-2

6*1e-2

5*1e-2

4*1e-2

3*1e-2

2*1e-2

1.00E-02

                

0.1

450.9

509.7

601.6

832.2

1347

2786

3022.15

3421.49

3760.23

4466.9

5034.79

6573.76

8421.98

13866.1

29395.11

1.00E-02

707.2

757.2

998.1

1110

1717

3621

4132.17

4517.59

5232.74

6364.6

7586.89

9070.88

13176.8

17543.2

33094.21

1.00E-03

1102

1333

1451

1674

2429

4846

5419.32

6337.57

7445.61

8704.97

10398.8

13593.1

18510.3

26145.6

59695.11

1.00E-04

2527

2765

3067

3262

3965

7709

8515.03

9764.71

11357.2

13413.6

17218.2

21796.3

28744.2

42848.8

92427

0.00009

2686

2780

3145

3561

4488

7951

9066.59

9938.67

11039

14057.1

17463.9

22672.1

31534.5

46692.4

102512.5

0.00008

2923

3232

3656

3935

4710

8183

8945.27

10424.5

12045

14629.4

18146.8

22694.6

31008.1

50762.4

96688.84

0.00007

2632

3064

3951

4072

4461

8193

9274.57

10642.4

12481.7

14741.7

18819.3

24147.9

34670.9

46805.2

107360.5

0.00006

3413

3510

4434

4480

5156

8781

9656.64

10810.9

12898.6

15812.2

19477.4

24635.7

34407.5

53700.6

101850.8

0.00005

3514

3871

4467

4494

5562

9227

9912.13

11487

13513.3

16702

19825.9

26156.2

34971.2

54688.2

114240.8

0.00004

4030

4434

5692

5888

6443

9473

10787.3

12214.6

15033.8

17546.2

21844.8

27275.6

37760.9

56086.2

110557.3

0.00003

5155

6595

6183

6651

6918

10478

11589.7

13443.5

16093.2

19075

22692.5

31011.1

41042.7

66337.2

145883.5

0.00002

6346

6691

8426

8511

12241

12061

13977.1

16357.6

18447.9

20868.3

25713.1

34325.6

46288.7

73116.6

157999.1

1.00E-05

10469

12805

14397

16428

17083

19757

19716.1

21967.6

28235.1

26126.3

31903.6

42933.4

57378.8

88206.8

184000.7

0.000009

14149

15900

14249

20380

18225

22246

22123

23800.7

24885.1

30206.6

36951.2

45709.4

61453.5

99080.4

197259.9

0.000008

12061

16991

17343

20878

18793

22215

24338.4

23525.6

26229.4

30248.3

37264.6

45744

63118.8

102147

238433.6

0.000007

15448

17055

16757

23394

24627

28046

26621.4

27583.9

27712.9

33021.7

40300.9

48154.7

66872.6

91680.2

227748.7

0.000006

16363

19539

23098

23525

25263

28410

30478

30443.5

34617.6

36609.3

43348.8

51335.1

72964.4

101187

235256.2

0.000005

15435

22017

28748

27565

27952

33682

32414.7

34133.3

39291.5

39831.4

49829.6

57589.2

79256.6

112888

231381.4

0.000004

22164

27614

32166

35141

38190

37282

40560.4

38845.3

49073

49934.9

56060.9

59055.6

80945.5

105719

235798.3

0.000003

22927

28860

36660

35043

42120

45174

51076.8

54023.8

56240.5

55068.8

61498.8

72600.9

94621.9

130338

311185.9

0.000002

33399

36130

41347

47989

54458

60367

70687.1

73467.4

65498.1

79889.1

84106.9

99886.3

110987

195190

346350.5

1.00E-06

44777

49353

58197

66138

74129

90392

100524

110145

103614

111490

127627

135720

159008

232212

477003.3

1.00E-07

91115

    

2E+05

212024

243068

255093

300479

360578

405315

481567

  

 

结果表明在δ不变的前提下学习率越小对应的迭代次数越大。

 

3. 权重对迭代次数的影响

(mnis 0, mnist 2)-con(3*3)-49-30-2-(1,0)(0,1)

分类mnist的0-2,设d是从1-100的随机数,让隐藏层的权重=d/x,让x=10到50万,让δ等于0.1到1e-6的22个值。每组值计算99次取平均值。

n

50w

10w

50000

10000

5000

2000

1000

500

100

10

0.1

2954.606

2925.677

2682.434

2789.273

2851.414

2934.99

2785.725

2469.051

1492.364

824.5455

1.00E-02

3905.949

3822.828

3697.778

3839.242

3665.414

3597.384

3620.905

3195.273

2412.556

2290.162

1.00E-03

5019.576

4922.071

5071.838

5135.232

5039.111

5039.828

4846.435

4716.636

4220.495

6053.737

1.00E-04

7745.818

7713.869

7586.202

7566.566

7782.485

7884.495

7709.22

7643.263

7695.222

16028

9*1e-5

7963.232

8079.162

7945.636

8140.626

7738.576

7998

7951.16

7770.828

7968.343

15690.17

8*1e-5

8365.172

8228.737

8023.788

8136.414

8344.596

8009.616

8182.51

8274.535

8373.879

13377.99

7*1e-5

8351.596

8663.02

8172.141

8062.172

8338

8543.707

8193.28

8299.495

8587.455

15126.16

6*1e-5

8417.556

9177.737

8753.091

8484.495

8541.737

8616.182

8780.59

8658

8802.596

22843.65

5*1e-5

9031.434

8857.374

9313.737

9411.121

8861.606

8909.141

9227.095

8950.667

9941.172

27780.29

4*1e-5

9703.253

9872.081

9288.869

9631.778

9538.909

9668.152

9473.415

9662.909

10444.78

27402.92

3*1e-5

10273.36

10113.93

10285.41

10206.91

10629.06

10816.66

10478

10568.34

14323.28

24808.89

2*1e-5

11731.25

11892.36

12266.43

11755.62

11908.38

12202.96

12060.84

12658.81

15518.96

41082.65

1.00E-05

18167.29

16326.62

17709.88

16517.19

18050.47

17632.76

19757.36

19631.6

27037.91

41576.35

9*1e-6

18092.37

17627.63

17650.47

18858.78

18803.26

18320.92

22245.54

22426

34867.61

55239.19

8*1e-6

20048.55

20191.28

20609.12

18776.23

21052.76

20959.47

22214.93

29472.02

32882.16

38499.32

7*1e-6

19530.55

23512.86

22542.05

21879.03

23718.92

22918.35

28045.61

27159.87

44096.94

52918.58

6*1e-6

24351.96

23340.25

26207.54

24757.15

27849.16

28211.88

28410.34

30183.58

46843.72

46127.79

5*1e-6

29944.24

28645.25

28010.44

28571.44

31057.9

30435.4

33681.76

37208.66

53281.34

60459.68

4*1e-6

33255.04

35861.74

30981.66

34554.54

35596.87

34793.94

37281.58

40257.97

55912.52

60573.09

3*1e-6

42423.89

40650.68

40574.6

43801.63

41936.11

47156.65

45173.59

46803.47

68222.7

57790.01

2*1e-6

59707.64

60227.69

60508.31

55440.01

56348.59

58648.75

60366.62

66742.11

79970.38

76566.7

1.00E-06

90144.53

82600.19

81751.4

79639.55

85065.39

92023.44

90392.45

93909.44

109287.6

125939.1

结果很清晰在δ不变的前提下x越小迭代次数越大

4.隐藏层节点数对迭代次数的影响

(mnis 0, mnist 2)-con(3*3)-49-x-2-(1,0)(0,1)

分类0和2让隐藏层的节点数等于20-1000,让δ等于0.5到1e-6的26个值,每组值测量199次取平均值

δ

49*20*2

49*30*2

49*40*2

49*50*2

49*60*2

49*70*2

49*80*2

49*90*2

49*100*2

49*200*2

49*500*2

49*1000*2

0.5

25.54271

19.34673

14.68342

11.38191

9.562814

8.19598

8.678392

6.643216

6.713568

5.874372

366.4925

427.3367

0.4

1963.995

1847.327

1764.221

1649.487

1576.447

1480.261

1418.327

1433.764

1318.367

972.9296

327.407

416.7387

0.3

2327.337

2152.91

2053.513

1929.819

1867.296

1810.663

1733.02

1758.487

1724.548

1385.97

351.1457

495.2915

0.2

2514.834

2431.106

2247.01

2125.985

2047.809

2066.814

2061.312

1933.638

1919.312

1509.106

445.1106

431.7739

0.1

2907.417

2785.725

2586.347

2471.467

2336.698

2228.251

2266.432

2177.734

2181.518

1814.653

551.9648

538

0.01

3885.196

3620.905

3409.337

3290.392

3211.704

3154.075

2935.085

2922.005

2812.744

2409.899

1947.156

958.5578

0.001

5718.608

4846.435

4769.618

4482.884

4176.96

4087.307

4172.447

3935.538

3826.744

3242.412

2687.367

2178.156

1.00E-04

9210.337

7709.22

6843.774

6534.899

6287.417

5992.899

5800.96

5795.191

5498.035

4641.508

3755.719

3671.734

9.00E-05

9710.065

7951.16

7050.683

6653.683

6228.538

6188.085

5818.04

5733.683

5592.457

4643.814

3834.146

3766.915

8.00E-05

9738.583

8182.51

7373.899

6771.176

6455.231

6244.548

6237.206

5827.538

6010.317

4800.719

4004.121

3537.553

7.00E-05

10116.43

8193.28

7534.085

6862.09

6728.658

6499.869

6520.226

5903.482

5896.548

4944.121

3983.704

3755.638

6.00E-05

11118.71

8780.59

7912.809

7370.769

6712.94

6664.392

6259.513

6207.869

5955.121

5034.216

4338.09

3795.146

5.00E-05

12111.81

9227.095

8041.648

7763.618

7220.683

6979.608

6658.965

6452.015

6224.266

5301.121

4155.116

3860.779

4.00E-05

13728.94

9473.415

8914.709

7870.065

7335.975

6974.879

6793.106

6877.789

6384.94

5264.402

4743.256

3863.553

3.00E-05

15497.58

10478

8983.256

8461.719

7950.296

7625.261

7386.211

6936.482

6846.653

5613.075

4725.739

4506.377

2.00E-05

23317.28

12060.84

10254.75

9369.106

8535.261

8129.583

7959.653

7832.623

7559.673

6100.709

5045.266

4465.935

1.00E-05

38937.04

19757.36

13325.5

11380.39

9927.246

10038.44

9422.307

8606.266

8652.513

6956.779

5789.261

4991.508

9.00E-06

43911.23

22245.54

14199.69

12113.82

10543.48

10136.59

9981.849

9199.065

8930.714

7182.894

5733.809

5153.573

8.00E-06

53602.43

22214.93

15274

12452.03

10837.76

10599.35

9611.568

9402.352

8958.739

7194.166

5806.985

5193.623

7.00E-06

53211.28

28045.61

16940.79

13635.24

12077.03

11315.1

10070.84

9749.487

9323.196

7430.01

6073.266

5183.844

6.00E-06

57217.69

28410.34

19087.45

14732.5

12292.16

11030.2

10436.6

10225.85

9608.98

7687.754

6300.633

5706.01

5.00E-06

77478.28

33681.76

19354.78

16120.72

12830.23

12153.75

11567.16

10823.58

10396.34

8213.729

6550.332

6091.136

4.00E-06

84001.14

37281.58

24309.85

17517.83

16267.97

14135.49

11897.39

11054.88

11352.55

8421.467

6433.166

5787.121

3.00E-06

90617.76

45173.59

30329.22

20533.79

17320.02

15464.66

14069.67

13135.28

12671.94

8811.065

6982.005

6397.271

2.00E-06

119310.4

60366.62

40249.79

29888.18

24441.9

20569.78

18074.04

15542.84

15187.57

10138.04

7838.643

6485.407

1.00E-06

153821.4

90392.45

66962.16

48307.74

40945.18

31941.37

30805.03

25686.17

23370.95

15122.7

9934.658

8098.126

规律很明显x越小对应的迭代次数越大。X越大对应的迭代次数越少。但是x越大网络越大单次迭代的计算量也越大,因此随着x的增大δ不变的前提下收敛时间有个极小值。

 

5.卷积核数量对迭代次数的影响

(mnist 0 ,mnist2)81-con(3*3)*n-(49*n)-30-2-(1,0) || (0,1)

分类0和2,向这个网络增加n个3*3的卷积核,让n分别等于0-9.当n=0时,网络相当于一个三层的网络

(mnist 0 ,mnist2)81-30-2-(1,0) || (0,1)

让δ分别等于0.5到1e-6的34个值每组值收敛199次,统计迭代次数平均值。

  

1

2

3

4

5

6

7

8

9

δ

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

迭代次数n

0.5

8.864322

16.24623

13.80905

14.90452

15.17588

12.13568

11.83417

11.92462

13.06533

11.13065

0.4

208.9397

1685.925

1134.131

882.4573

751.9347

664.0804

594.8342

526.3166

481.1859

445.8191

0.3

268.7286

1923.096

1299.829

1047.608

869.2663

788.8694

699.3417

648.0251

593.9447

548.1809

0.2

324.0151

2120.045

1440.628

1160.975

988.6633

872.4271

790.1357

712.6784

664.0754

630.4221

0.1

410.5879

2318.668

1637.131

1291.804

1105.392

971.6834

880.6131

814.5879

764.2714

718.4573

0.01

685.5477

2832.724

2076.397

1656.417

1424.9

1282.628

1206.704

1101.251

1039.472

999.1859

0.001

1447.131

3803.322

2899.739

2436.895

2234.598

2142.965

2086.709

2070.985

2123.764

2199.789

9.00E-04

1450.915

3783.528

2924.246

2495.834

2291.754

2173.563

2137.221

2139.347

2256.804

2365.523

8.00E-04

1494.925

3831.327

3005.176

2545.623

2314.834

2233.156

2231.533

2247.498

2312.97

2508.678

7.00E-04

1552.714

3962.889

3032.824

2621.95

2432.156

2312.236

2360.945

2437.226

2532.663

3025.829

6.00E-04

1711.628

4070.799

3151.97

2738.246

2520.181

2427.558

2559.216

2598.543

2897.819

3426.171

5.00E-04

1968.714

4228.101

3268.749

2908.442

2656.392

2614.231

2638.94

3189.176

3705.146

4812.141

4.00E-04

2165.055

4379.653

3413.588

3049.171

2878.216

2938.784

3379.382

4073.372

5242.417

7248.422

3.00E-04

2324.08

4616.387

3568.749

3236.673

3262.699

3474.136

4279.653

6453.819

8586.452

11609.67

2.00E-04

2720.844

5050.874

4034.085

3941.784

4741.608

5935.935

8696.774

11151.12

15180.14

19449.47

1.00E-04

3165.709

6349.699

5698.945

6692.221

9883.704

14487.85

20128.9

26472.59

31021.32

34488.16

9.00E-05

3407.91

6705.251

6425.643

7671.834

10057.86

16786.43

22643.76

27280.82

33107.07

36141.16

8.00E-05

3486.764

6955.814

6875.578

8632.764

13695.61

18656.79

24313.79

30661.9

32898.83

37901.49

7.00E-05

3668.683

7528.92

7582.653

10520.67

14594.5

21585.94

27430.91

33478.19

37926.07

39971.74

6.00E-05

3962.563

8184.292

8908.658

10364.41

17772.01

26005.45

33621.57

37461.17

40297.02

43397.05

5.00E-05

4167.678

8865.02

9484.176

13928.86

20620.39

29064.9

36309.25

40110.72

43048.42

45538.37

4.00E-05

4515.829

9644.558

11563.16

18354.37

27010.35

33951.97

40799.66

44108.27

45917.92

48308.95

3.00E-05

5059.879

11485.9

15935.82

23537.47

31983.07

40540.77

44894.17

48028.65

49944.31

52696.23

2.00E-05

6524.874

15515.14

23050.37

31693.9

39692.1

46629.56

50373.94

54465.65

55854.44

57249.01

1.00E-05

8527.9

25127.07

34262.57

43816.4

51902.06

55930.22

60159.97

61394.46

63830.06

66139.31

9.00E-06

8746.422

26410.51

37680.04

46022.3

54010.82

57544.23

61327.05

63699.2

64750.77

68351

8.00E-06

9474.01

29507.95

39589.83

48614.33

54025.24

59733.02

62842.51

64384.89

66818.93

68970.2

7.00E-06

10301.67

31298.12

40019.11

50429.01

56361.68

62009

63321.66

66217.43

69258.37

69606.42

6.00E-06

11850.65

33845.36

44199.28

51939.93

59028.91

63013.84

65983.75

67526.19

69809.58

70851.06

5.00E-06

13068.73

36965.26

47009.32

56133.38

62123.93

66072.72

68282.15

71326.04

72951.16

74612.08

4.00E-06

14670.05

40347.78

49610.82

59106.07

63852.48

69004.8

71463.16

73956.1

77287.44

76819.8

3.00E-06

17112.47

44845.01

56031.89

62566.35

67823.03

73042.56

74778.5

77379.65

80787.31

81893.53

2.00E-06

23285.87

52058.75

62225.43

70379.01

74180.41

77512.57

81224.45

85341.33

87238.95

87805.16

1.00E-06

35222.24

66830.71

77563.4

82040.66

86059.04

90214.99

93471.64

96062.58

99403.25

102968.4

迭代次数随着卷积核数量的增加而增加。并且迭代次数与卷积核数量的平方根成正比

X---卷积核的数量

α---系数

 

并且收敛时间与卷积核数量的3/2次幂成正比。

 

6.网络层数对网络迭代次数的影响

(mnist 0 ,mnist 2)81-30-2-(1,0) || (0,1)

(mnist 0 ,mnist 2)81-30-49-30-2-(1,0) || (0,1)

(mnist 0 ,mnist 2)81-30-49-30-49-30-2-(1,0) || (0,1)

(mnist 0 ,mnist 2)81-30-49-30-49-30-49-30-2-(1,0) || (0,1)

制作4个网络去分类0和2,这4个网络的层数分别是3层,5层,7层,9层.

让δ等于0.5到1e-6的34个值,每组值收敛199次,统计平均值。

 

 

9

7

5

3

δ

迭代次数n

迭代次数n

迭代次数n

迭代次数n

0.5

8.291457

7.628141

5.728643

4.824121

0.4

334.3869

136.5377

47.92965

10.60302

0.3

445.608

223.8141

105.6432

32.92462

0.2

500.1307

275.8442

155.2563

68.78894

0.1

612.9146

369.5226

248.9497

155.2965

0.01

1085.503

754.2462

596.3015

492.8593

0.001

9882.784

8027.377

2793.01

1295.281

9.00E-04

10881.03

8691.206

2924.266

1368.503

8.00E-04

11977.38

9745.246

3438.271

1426.709

7.00E-04

14072.29

10714.58

4023.141

1494.201

6.00E-04

16406.42

12371.1

4890.673

1667.829

5.00E-04

20385.63

15137.29

5992.065

1749.307

4.00E-04

24298.51

17785.58

7844.638

1875.171

3.00E-04

32696.08

22253.22

11235.22

2184.286

2.00E-04

44724.82

31035.44

15313.87

2582.925

1.00E-04

89078.6

56299.69

25407.06

3498.412

9.00E-05

95407.9

63010.57

27220.85

3645.025

8.00E-05

104874.4

68325.11

29562.66

3840.156

7.00E-05

116214.4

78167.16

32122.32

4077.126

6.00E-05

131232.3

89236.13

34942.84

4212.678

5.00E-05

149461.3

102580.9

39240.9

4589.568

4.00E-05

166924.9

117010.6

42965.2

5167.663

3.00E-05

204507.9

149188.4

52871.19

5821.111

2.00E-05

274629

212703

64717.94

6976.513

1.00E-05

439076.3

360851.1

90076

9615.879

9.00E-06

473836.4

386946.7

91610.54

9692.05

8.00E-06

514704.1

429464.9

99462.98

10012.85

7.00E-06

550991.1

455372.7

105727.8

10419.32

6.00E-06

616058.6

535610.7

110838.9

11089.11

5.00E-06

742561

608267.8

118164.4

12141.85

4.00E-06

892665.6

729212.1

138541.7

12888.37

3.00E-06

1155870

930735.7

155032.7

13944.59

2.00E-06

1.69E+06

1390712

189751.4

16152.7

1.00E-06

3.35E+06

2727215

318306.6

20551.51

 

δ不变的前提下,随着网络层数的增加迭代次数增加。

将上述所有现象总结成表格

δ

训练集差异

学习率

权重

隐藏层节点数

卷积核数量

网络层数

 

不变

增加

减小

增大

减小

增加

增加

迭代次数增加

        

δ

训练集差异

学习率

权重

隐藏层节点数

卷积核数量

网络层数

 

减小

不变

不变

不变

不变

不变

不变

迭代次数增加

δ不变的前提下,训练集差异增加,学习率减小,权重增大,隐藏层节点数减小,卷积核数增加,网络层数增加都会导致迭代次数增加。

在网络结构不变的前提下δ减小,迭代次数增加。

 

二.迭代次数对网络分类准确率的影响

前面的所有实验都表明在训练集不变,δ不变的前提下迭代次数越多网络的分类准确率越大。但是不包括由于卷积核数量的增加而引起的迭代次数的增加。

平均性能

0-1

81*30*2>2>3>4>5>6>7>8>9>1

没有正面价值

 

0-5

2>3>4>5>6>7>8>9>81-30-2>1

明显提升

 

0-6

81*30*2>2>9>8>1>7>6>5>4>3

没有正面价值

 

0-2

81*30*2>2>3>4>5>6>7>8>9>1

没有正面价值

      

最大性能

0-1

81*30*2=1=2=3=4=5=6=7=8=9

没有提升

 

0-5

2>3>4>5>6>7>8>9>1>81-30-2

提升明显

 

0-6

81*30*2=2=7>8>1=3=4>6>5

无明显提升

 

0-2

5>3>2>4=7=8>1=9>6>81*30*2

提升明显

 

卷积核数量对网络性能的影响的实验共做了4次,分别是0-1,0-2,0-5,0-6.这4次实验都表明卷积核的数量有一个最优值,超过最优值以后网络的性能是下降的。

卷积核有可能改善网络性能比如0-5,但是卷积核也有可能没有任何正面价值,比如0-1,0-6,0-2增加卷积核只会导致网络平均性能下降。

7个变量对网络性能影响的总结

δ

训练集差异

学习率

权重

隐藏层节点数

卷积核数量

网络层数

 

不变

增加

减小

增大

减小

有最优值

增加

网络性能增加

        

δ

训练集差异

学习率

权重

隐藏层节点数

卷积核数量

网络层数

 

减小

不变

不变

不变

不变

不变

不变

网络性能增加

如果不考虑卷积核数量改变导致的迭代次数改变,可以简单的概括成在δ不变的前提下,迭代次数越多网络性能越好。分类准确率越高。因此使网络性能更好有两种等效的调参策略,一种是通过调节学习率,权重,节点数,网络层数使迭代次数变大;或者在其他所有参数都不变的情况下将δ调小。

 

三.快速设定网络参数的一种便捷方法

由上述所有讨论,一个参数最优的网络应该满足:隐藏层节点数应该小于等于节点数效率最优值,卷积核数应该等于卷积核数量最优值。而其余无论是由学习率,权重,网络层数引起的迭代次数的增加都可以用δ减小来等效的替代。

也就是可以通过将δ不断减小的办法来使网络性能得到单向的不断的提升。甚至一个网络即便不满足参数最优,把δ调的更小也确定的会使网络的性能得到改善,因此这是一种便捷的单参数调参法。

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黑榆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值