大数据学习
春田花花幼稚园优秀毕业生
春田花花幼稚园优秀毕业生
展开
-
踩坑记录:TypeError: Expected cv::FileNode for argument ‘fn‘ cv2.read()报错
knn.read(‘knn.xml’)修改为file = cv2.FileStorage('knn.xml', cv2.FILE_STORAGE_READ)self.knn.read(fn=file.getNode('opencv_ml_knn'))getNode后面带的文件内的命名原创 2021-04-19 19:39:42 · 324 阅读 · 0 评论 -
踩坑记录,cv2.ml 下的模型使用 load() 报错 :‘cv2.ml_KNearest‘ object has no attribute ‘load‘
将load替换为read同时cv2.FileStorage为你要读取的文件。getnode为文件下你要的file = cv2.FileStorage(‘knn.xml’, cv2.FILE_STORAGE_READ)knn.read(fn=file.getNode(‘opencv_ml_knn’))原创 2021-04-19 19:36:06 · 604 阅读 · 0 评论 -
pd用布尔值插入新列报错:The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(),
这个问题解决方法就是每个表达式都套个括号。。。这里还有就是这种写法也是错的,错误暂时没查到,以后知道了会更新原创 2021-03-24 18:06:13 · 233 阅读 · 0 评论 -
决策树 ID3算法 python实现 不用现成库
决策树 id3 学校作业,数据集不多,没划分测试训练,结果看最后数据集及描述import numpy as npimport pandas as pdimport numpy.randomimport timeimport mathimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlinefrom scipy.io import arfffilepath='caesarian.csv.arff'原创 2020-10-11 18:51:11 · 626 阅读 · 0 评论 -
逻辑回归 python实现 不用现成库
函数名瞎写的,轻喷import numpy as npimport pandas as pdimport numpy.randomimport timeimport matplotlib.pyplot as plt%matplotlib inlinef=open('data_banknote_authentication.txt','r',encoding='utf-8')data = f.read()fdata=data.split('\n')Mdata=pd.Series(fda原创 2020-10-05 22:00:09 · 465 阅读 · 0 评论 -
利用panda对学生成绩进行预处理,使用正则匹配分数
老师布置了个作业,要进行成绩分析。先看看数据长啥样嗯,难看(@_@????给了一大堆,能直接拿来用的也就只有总分了,memo一项里有平时分期中分期末分总评分,但是有缺失值,有的课程没有期末分或者期中,这样的话没办法批量处理,只能遍历,一个个处理。先准备好正则表达式#2019-1-14 15:13:52_XXX_提交_平时:85/期末:69/总评:75;2019-1p1 = re.compile('.*平时:([0-9]*\.?[0-9]+)/期')p2 = re.compile('.*期中:([原创 2020-05-09 18:27:02 · 426 阅读 · 0 评论 -
使用sklearn构建神经网络进行成绩预测
# coding=gbkimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.neural_network import MLPRegressordef get_class(T_class, info, num): # 从总的课程(info)里取出指定班级(T_class),将总评的列名改成num info = pd.DataFrame(info)[['StuName', 'S原创 2020-05-09 18:15:22 · 2790 阅读 · 0 评论 -
tensorflow神经网络进行成绩预测(非时序)
这个预测很简陋,就是用一个人的高数1、2的两个成绩预测线性代数成绩,数据量不大,预测的实际意义也不大。主要是体验下流程,应付下作业。( ̄y▽, ̄)╭首先是数据的类型,我们这次拿到的数据是3个班的高数1、2和线性代数的成绩。考虑到一些因素,这里只用前两个班的成绩。数据如下(表头我自己图省事改了改)这里我只需要总评分和前两个班级的数据,所以def get_class(T_class, info, num): # 从总的课程(info)里取出指定班级(T_class),将总评的列名改成num in原创 2020-05-09 18:10:00 · 2242 阅读 · 1 评论