2019年8月
qq_41629976
这个作者很懒,什么都没留下…
展开
-
周志华西瓜书-第四天阅读-类别不平衡问题
类别不平衡(class-imbalance)就是指分类任务中不同类别的训练样例数目差别很大的情况。不失一般性,本节假定正类样例较少,反类样例较多.在现实的分类学习任务中,我们经常会遇到类别不平衡,例如在通过拆分法解决多分类问题时,即使原始问题中不同类别的训练样例数目相当, 在使用OvR 、MvM策略后产生的二分类任务仍可能出现类别不平衡现象,因此有必要了解类别不平衡性处理的基本方法.解决思路...原创 2019-08-31 14:46:57 · 410 阅读 · 0 评论 -
周志华西瓜书-第三天阅读-多分类学习
谈一谈多分类学习很多问题可以可以分为两个类别,称为二分类问题。但有时我们需要分的类不止两个,这时候我们就需要涉及到多分类问题了。今天我就谈一谈多分类学习的基本策略。二分类直接推广有些多分类问题可以直接由二分类推广,比如说在线性回归的基础上加上对数几率函数构造二分类模型,我们只需要将分类函数进一步替换即可在线性回归的基础上构造多分类模型。拆分策略不失一般性,考虑N 个类别,多分类学习的基本...原创 2019-08-31 13:20:12 · 365 阅读 · 0 评论 -
周志华西瓜书-第二天阅读-模型评估
谈一谈混淆矩阵、ROC、AUC的理解原创 2019-08-30 21:29:35 · 156 阅读 · 0 评论 -
周志华西瓜书-第一天阅读-评估方法
2.2评估方法在训练好模型后我们需要进行验证,这时候需要我们在分割数据时进行一些处理,在这记录一下书中的几个方法。留出法:将数据集D 划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T。在S 上训练出模型后,用T 来评估其测试误差,作为对泛化误差的估计。但在划分数据集时需要注意三个点:1.分布:训练/测试集的划分要尽可能保持数据分布的一致性,避免因数据划分过程引入额外的偏...原创 2019-08-30 16:28:38 · 237 阅读 · 1 评论 -
python模型部署初涉--PMML篇
一点点废话最近科研立项做项目需要做机器学习的模型,模型做好了但需要在Java上部署,经过了解后,才发现原来python上训练的模型可以保存下来,而不需要每次预测都要先训练。经过一番折腾后,大致了解了模型部署的流程,再次记录,也供君参考。为什么要部署只有当训练和预测在不同平台时,才会设计部署。同一个平台比如python下既训练又预测,那么只需要保存下来,在需要使用时在python工程中调用即可...原创 2019-08-30 01:33:25 · 1963 阅读 · 0 评论 -
从python了解csv
什么是csv?csv是一种文件格式,全称为逗号分割值文件,可以理解为一种表格数据。通常从电子表格和数据库导出数据以及在其他程序中导入数据的文件格式。怎么在python中使用csv#引入pandas库import pandas as pd#data换为你的数组,columns中设置列名pd_data = pd.DataFrame(data,columns=[‘total_num’,‘le...原创 2019-08-30 01:00:21 · 116 阅读 · 0 评论 -
网络爬虫
URL全称是统一资源定位符(Uniform Resource Locator),一般语法格式为:(带方括号[]的为可选项):protocol原创 2019-08-12 01:54:17 · 66 阅读 · 0 评论 -
python基于requests的网络通信
requests是python实现的第三方HTTP库,用于python网络通信。因为是第三方库,所以cmd-pip install requests-import requests即可使用。基本请求方式:import requestsrequests.get('http://www.baidu.com')##用于获取数据requests.post('http://www.baidu.com...原创 2019-08-10 20:15:55 · 328 阅读 · 0 评论 -
UnicodeDecodeError: 'gbk' codec can't decode byte 0x82 in position 66: illegal multibyte sequence
代码如下:file_in=“C:\Users\Administrator\Desktop\parking datum.txt”data=’’fbegin=0fend=0d=’’with open(file_in,“r”) as file:for i in file.readlines():for e in i:if e==’"’:continue;if e==’}’:fbe...原创 2019-08-09 23:50:27 · 12384 阅读 · 1 评论