主要记录一些没懂的还要继续学的
-
第一次接触类的概念,楼主是EE生,编程之前只学过C和汇编。
给我的感觉是 类是一种数据类型。像C里面结构体的格式。 -
听了一个公开课
讲的类似于推荐的
思路确实不错
源代码:
import pandas as pd
from matplotlib import pyplot as plt
from sklearn import linear_model
from sklearn.metrics import mean_squared_error
import numpy as np
data = pd.read_csv('data.txt')
#
num = int(data.shape[0]*0.7)
x, y = data[['money']],data[['amount']]
#训练集测试集
x_train,x_test = x[:num],x[num:]
y_train,y_test = y[:num],y[num:]
#画图
plt.scatter(x_train,y_train)
#数据建模
model = linear_model.LinearRegression()
model.fit(x_train,y_train)
#模型评估
predict_test_y = model.predict(x_test)
print('MSE均方误差是:%.2f' % mean_squared_error(y_test,predict_test_y))
#预测
new_x = np.array([[84632]])
pre_y = model.predict(new_x)
print(pre_y)
data.shape[]
-
知识图谱-推荐算法-图论-社区发现算法
语言:(1)工程 java(2)算法 python scala(spark) -
不平衡数据集分类
-
scikit-learn