首先是博客看起来不那么正式的感想:
每天还是要有点感想的,活下去24个小时是一件很有意义的事,无论是混过去了24个小时睡过去了24小时还是好好学习了24个小时。
作为全组最慢的孩子,在各位大佬的提携下终于坚持写完了这个看起来比较小的目标。
浓缩只有一句感想:计算机的小姑娘绝不认输(微笑)。
工作汇报
1.了解vector的主要用法。
2.复习文件读取。
3.复习梯度下降法。
4.完成简单线性回归-房价问题的代码。(中心)
0716-工作1&2
1.vector主要用法参考http://www.runoob.com/w3cnote/cpp-vector-container-analysis.html
难点: c++学的并不扎实,导致我对vector的概念十分模糊。本可换一个方法,如用二维数组来表示或者直接用一个类表示。然而这两种途径均有缺点:前者是无法掌握数组的大小,能否解决实际问题还有待商榷;后者无法控制变量顺序,循环过程中难以把控。
解决方案:研究别人的代码。了解vector与类的本质。
注:
1.1需要和数组区分。
1.2需要分配空间。
2.文件读取
难点:c++文件读取在计费管理系统中也有讲到过。六月有复习,七月份结合vector重新复习一遍。
解决方案:依照模板练习。
注:在vector中返回的实际是一个类。
vector<vector<double>> readFromData(string filename)
{
vector<vector<double>> house;
ifstream in(filename, ios::in);
if (!in.is_open())
{
cout << "文件不存在";
return house;
}
while (!in.eof())
{
vector<double> cr;
for (int i = 0; i < 13; i++)
{
double m;
in >> m;
cr.push_back(m);
}
house.push_back(cr);
}
return house;
}
因此可以得出模板:
classname readFromData(string filename)
{classname A;
ifstream in(filename, ios::in);
if (!in.is_open())
{
cout << "文件不存在";
return A;
}
while (!in.eof())
{
in<<
//将读取的数据存储到A中
}
return A;
}
0717&0718-工作3&工作4
梯度下降法和简单线性回归在前日博客里详细记载,这里便不多说。我想讲讲关于我编程时遇到的问题。
#include <iostream>
#include<vector>
#include<fstream>
#include<cmath>
using namespace std;
vector<vector<double>> readFromData(string filename)
{
vector<vector<double>> house;
ifstream in(filename, ios::in);
if (!in.is_open())
{
cout << "文件不存在";
return house;
}
while (!in.eof())
{
vector<double> cr;
for (int i = 0; i < 13; i++)
{
double m;
in >> m;
cr.push_back(m);
}
house.push_back(cr);
}
return house;
}
int main()
{
vector<vector<double>>house = readFromData("C:\\Users\\Rumin\\Desktop\\机器学习\\梯度下降法\\Project2\\Project2\\house_price_data.txt");
//cout << house[1][2];
double alpha = 0.000001;
double theta[12];
for (int i = 0; i < 12; i++)
{
theta[i] = 1;
}
vector<double>jtheta1;
vector<double>jtheta2;
vector<double>jtheta3;
double n = 0.1;
double lijia= 1;
while (abs(n - 0) > 0.001)
{
for (int i = 0; i < house.size(); i++)
{
double q = 0;
for (int j = 0; j < 12; j++)
{
q = q + theta[j] * house[i][j];
}
jtheta1.push_back(q);
//jtheta1[i] = jtheta1[i] + theta[0];
//cout << jtheta1[i] << endl;
}
double m = 0;
n = 0;
for (int j = 0; j < 12; j++)
{
for (int i = 0; i < house.size(); i++)
{
m = m + (jtheta1[i] - house[i][12])*(jtheta1[i] - house[i][12]) / (2*house.size());
n = n - 0.1 + (jtheta1[i] - house[i][12])*house[i][j] / house.size();
}
theta[j] = theta[j] - alpha * n;
//cout << "[" << number << "]" << m << endl;
}
if (abs(n - 0) < 0.001)
{
jtheta2.push_back(m);
jtheta3.push_back(n);
}
else jtheta1.clear();
cout << "[" << lijia << "]" << m <<endl<< n<<endl;
lijia++;
}
for (int i = 0; i < 12; i++)
{
cout << "第" << i << "个数据是" << theta[i] << endl;
}
system("pause");
return 0;
}
问题1.如何处理未知参数。
很简单,设定初值即可。然后变换中得到最终结果。
问题2.梯度下降法和损失函数的关系
在此时,我们运算梯度下降法,是为了运算出损失函数的最小值。根据公式求导,应该是改变的每一个参数的值,而不是仅仅改变一个参数的值。
问题3.vector分配空间
vector的空间需要调用push_back函数可以完成。否则vector的size一直会为0。