理论技术:大数据 | 数据挖掘 | 机器学习
理论技术:大数据 | 数据挖掘 | 机器学习
RealMoYe
进击的小矮人
展开
-
【百度云&薪火科技】表格文字识别
# encoding:utf-8import requestsimport base64import timeimport urllib.request'''表格文字识别(异步接口)''''''请求access token'''def getToken(ak, sk): host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id='+ak+'&am原创 2021-02-20 15:33:03 · 721 阅读 · 0 评论 -
Python实现KNN
# -*- coding: utf-8 -*-import numpy as npimport operatordef knnClassify(inX, dataSet, labels, k): """ KNN算法 :param inX: 待判断样本的特征 :param dataSet: 数据集各个样本的特征 :pa...原创 2019-03-25 16:40:00 · 655 阅读 · 0 评论 -
如何理解准确率、召回率和精确率?
一、概念精确率(precision):针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。召回率(recall):针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。准确率(accuracy):针对我们预测结果而言的,它表示的是预测结果中正确的预测占总样本数的比例。精确率:precision = TP / (TP + FP)召回率:recall =...原创 2019-03-18 10:49:42 · 6168 阅读 · 0 评论 -
无法启动datanode,log提示impatiable cluster IDs
问题产生及其原因datanode数据节点无法启动,日志提示为cluster ID有冲突,具体为namenode的cluster ID与datanode的cluster ID不一致。产生原因之一为,多次格式化namenode,即多次执行过以下命令:hdfs namenode -format这造成namenode cluster ID产生更新,而原来datanode的cluster ID没有...原创 2018-11-14 09:04:17 · 267 阅读 · 0 评论