大家好,作为一名资深算法工程师,我想把自己的经验与大家分享。新时代的新产物推动着生产力的进步,要么拥抱新的生产力,要么被新的生产力淘汰,AI算法工程师90天入门到精通,跟着我一起开始第二天的课程吧!
前面我们说了GPT算法工程师学习需要学哪些东西。GPT时代,如何成为一名优秀的算法工程师?
然后1/90第一天给大家分享了机器学习中的监督学习,举了Python中scikit-learn库的线性回归、逻辑回归的监督学习。今天继续给大家讲scikit-learn库用决策树进行监督学习。
监督学习——scikit-learn库
假设我们有一个鸢尾花(Iris)数据集,其中包含鸢尾花的萼片和花瓣的长度和宽度四个特征,以及鸢尾花的品种标签。我们将使用决策树算法分类鸢尾花品种。
首先,需要导入需要的模块和数据:
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
iris = load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
然后,我们可以创建一个DecisionTreeClassifier对象,并使用训练数据进行拟合:
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)
接下来,我们可以使用测试数据进行预测并计算分类报告:
y_pred = clf.predict(X_test)
print(classification_report(y_test, y_pred, target_names=iris.target_names))
输出结果为:
precision recall f1-score support
setosa 1.00 1.00 1.00 19
versicolor 0.96 0.96 0.96 24
virginica 0.93 0.93 0.93 12
avg / total 0.97 0.97 0.97 55
这表明我们的决策树模型对测试数据进行了良好的分类,具有高精度。
监督学习——Tensorflow库
Tensorflow可以实现二元分类,图