qq_44987376-CSDN博客

转载机器学习笔记－－classification_report&精确度/召回率/F1值

classification_report简介sklearn中的classification_report函数用于显示主要分类指标的...

2019-11-25 22:39:49 905 2

原创报错"UnicodeDecodeError: 'utf-8' codec can't decode byte"的解决办法

在读取数据文件时发现报错：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte原因：在程序中设定文件打开的编码格式为“utf-8”,但是在保存文件时却发现原文件的编码方式是“ANSI”解决办法：打开文件，点击另存为在编码一栏选择UTF-8，保存...

2019-11-25 22:13:22 62497

原创 anaconda上面安装imblearn包

安装命令：conda install -c glemaitre imbalanced-learn如果上面的命令执行不下去，那就应该看看自己的环境是否符合imblearn的安装要求，如果不满足要求，请更新后执行安装命令。主要是要更新scikit-learn的版本更新scikit-learn的命令：conda update scikit-learn这里注意，中间有几个安装包可能需要离...

2019-11-25 01:07:17 7920

转载在anaconda上面安装imblearn包而引发的一系列踩坑过程（二）

接上回，已经满足了安装imblearn的前提条件了，但是再次去Anaconda Prompt里面安装还是报错了，只是这次是另一个问题：Solving enviroment: failed with initial frozen solve.Retrying with flexible solve.去Anaconda的 navigation里面安装也是报错：再次谷歌一下，发现好几个博客都说...

2019-11-24 21:55:24 687

转载 anaconda没法更新scikit-learn

命令 conda upgrade scikit-learn并没用，报错一大堆，主要还是没法连接上那个continuum官方网站。所以这个时候，用pip吧pip install --upgrade 库名比如在我们的案例中，用pip install --upgrade scikit-learn就好了p.s.更新pip 的命令python -m pip ins...

2019-11-24 19:09:48 496

转载 Anaconda安装、查看、卸载第三方库

Anaconda安装第三方库：下载第三方库：下载地址：https://www.lfd.uci.edu/~gohlke/pythonlibs/1、Ctrl+F 查找2、下载，点击即可，注意下载的文件要与python环境相匹配3、将下载的 .whl文件放入...yourpath....\Anaconda3...

2019-11-24 18:58:18 2058

转载在anaconda上面安装imblearn包而引发的一系列踩坑过程（一）

首先一开始是在anaconda里面安装的，使用的命令是：conda install -c glemaitre imbalanced-learn1结果出现了满屏的这个：这一下子把我看的满脸的问号？这是什么情况？sqlite路径冲突？于是在网上搜了一下并没有类似的解决办法，又跑到官方文档打开看他的安装方法：于是我再次用官方的anaconda的安装方法去安装，结果还是出现同样的问题。。...

2019-11-24 18:55:11 1839 1

转载【Python】解决使用 plt.savefig 保存图片时一片空白

问题当使用如下代码保存使用 plt.savefig 保存生成的图片时，结果打开生成的图片却是一片空白。import matplotlib.pyplot as plt""" 一些画图代码 """plt.show()plt.savefig("filename.png")原因其实产生这个现象的原因很简单：在 plt.show() 后调用了 plt.savefig() ，在 plt.s...

2019-11-20 17:59:44 237

转载 SVM从原始问题到对偶问题的转换及原因

1、转化对偶问题上篇博客中我们得到的目标函数：（1）我们在优化时喜欢求最小值，将上式转化正等价的求最小值如下：（2）对于（2）式，这是一个凸二次规划问题，我们可以使用拉格朗日乘数法进行优化。 ...

2019-11-17 11:27:09 874

转载 Pandas的set_index和reset_index用法

set_index():函数原型：DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) 参数解释：keys：列标签或列标签/数组列表，需要设置为索引的列drop：默认...

2019-11-07 21:16:41 1315

1.相关背景在许多领域的研究与应用中，通常需要对含有多个变量的数据进行观测，收集大量数据后进行分析寻找规律。多变量大数据集无疑会为研究和应用提供丰富的信息，但是也在一定程度上增加了数据采集的工作量。更重要的是在很多情形下，许多变量之间可能存在相关性，从而增加了问题分析的复杂性。如果分别对每个指标进行分析，分析往往是孤立的，不能完全利用数据中的信息，因此盲目减少指标会损失很多有用的信息，从而产生错误...

2019-11-06 17:50:50 538

转载 PCA(sklearn参数详解)

本篇仅针对sklearn中的PCA作记录一、代码怎么写sklearn.decomposition.PCA(n_components=None, copy=True, whiten=False) 二、关于参数n_components: 意义：PCA算法中所要保留的主成分个数n，也即保留下来的特征个数n类型：int 或者 stri...

2019-11-06 14:45:23 892

转载 apply,applymap和map的应用

apply,applymap和map的应用总结:apply 用在dataframe上，用于对row或者column进行计算；applymap 用于dataframe上，是元素级别的操作；map （其实是python自带的）用于series上，是元素级别的操作。在Python中如果想要对数据使用函数，...

2019-11-06 10:41:19 91

转载 pandas中.value_counts()的用法

pandas中.value_counts()的用法value_counts()是一种查看表格某列中有多少个不同值的快捷方法，并计算每个不同值有在该列中有多少重复值。value_counts()是Series拥有的方法，一般在DataFrame中使用时，需要指定对哪一列或行使用import pandas as pdimport numpy as npfilepath='C:\python\d...

2019-11-05 16:47:02 867

转载 Python3 subprocess.check_output返回值转string

Python3 subprocess.check_output返回值转stringCloudox_关注2018.01.19 10:33:39字数 367阅读 8,155Python3中的subprocess.check_output函数可以执行一条sh命令，并返回命令的输出内容，用法如下：output = subprocess.check_output(["python3", "xx.py"],...

2019-11-05 14:44:24 2347

转载 Pandas：透视表(pivotTab)和交叉表(crossTab)

import numpy as npimport pandas as pdfrom pandas import Series,Da...

2019-11-05 09:41:11 202

转载标准化、归一化、中心化

标准化、归一化、中心化数据分析及挖掘中常提到的几个概念（数据的标准化、归一化、中心化），虽然经常在用，但可能还是有一些比较生僻的知识容易搞混淆，所以在十月国庆大家都出门上高速堵车的时候抽了点时间对这些概念以我的能力和理解做一个相对系统和浅显的总结。本篇文章通过个人以前对这些知识的一个先验理解，然后主要查...

2019-11-03 22:31:31 634

转载数据归一化的方法总结

数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数...

2019-11-03 22:30:23 588

转载数据归一化和两种常用的归一化方法

数据标准化（归一化）处理是数据挖掘的一项基础工作，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。以下是两种常用的归一化方法：...

2019-11-03 22:28:49 1658

转载怎么解决Iterable over raw text documents expected, string object received

因为你传入的参数是string，修改成list就行了比如之前传入的是’hi’，改成[‘hi’] ...

2019-11-03 15:57:18 625

转载关于sklearn中出现的ValueError: Unknown label type: 'continuous'

分类专栏：机器学习先是参照了这篇添加链接描述博文，在y_train后面添加了astype（int），发现可以运行了，但是由于我需要的是float数据，改成了float后继续报错。继续搜索解决方法，最后在添加链接描述发现了解决方法其实很简单，把X_train和y_train后面乘10（希望得到的是小数点后一位），最后得到预测结果后再除以10，问题就解决了。其实直接在前面乘10后，后面的lr...

2019-11-03 09:55:43 1310

转载 csdn怎么快速转载别人的文章

2019-11-02 21:21:56 66

转载 Numpy学习—np.random.randn()、np.random.rand()和np.random.randint()

在机器学习和神经网络中，常常会利用Numpy库中的随机函数来生产随机数，比如随机初始化神经网络中的参数权重W（备注：W是不能全部初始化为0的，这样会引起symmetry breaking problem，这样隐藏层设...

2019-11-02 21:19:46 166

转载 sklearn中predict_proba用法（注意和predict的区别）

转自：https://blog.csdn.net/m0_37870649/article/details/79549142predict_proba返回的是一个 n 行 k 列的数组，第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。# conding :utf-8 from sklearn.linear_model import Lo...

2019-07-22 17:43:55 1262

转载正负样本不均衡的解决办法

转载自：http://blog.csdn.net/lujiandong1/article/details/52658675这几年来，机器学习和数据挖掘非常火热，它们逐渐为世界带来实际价值。与此同时，越来越多的机器学习算法从学术界走向工业界，而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的，但绝对是最重要的问题之一。一、数据不平衡在学术研究与教学中，很多算法都有一个基本假设，那就是数据...

2019-07-21 22:55:02 757

转载 Python中os.sep、join( )、os.path.join()函数

Python中os.sep、join( )、os.path.join()函数os.sep是什么？因为Python是一个跨平台语言，在Windows上，文件的路径分隔符是’’，在Linux上是’/’，在Mac是’:’。那么怎么解决这个问题，os.sep 就是解决这个问题的os.sep会根据你所在的环境自适应相应的分隔符举例Linux下一个路径，/usr/share/python,那么上面的...

2019-07-21 10:42:42 1819

qq_44987376的博客