python
文章平均质量分 64
python使用
永不落后于人
永远相信美好的事情即将发生
展开
-
centos7安装python3
2.创建一个目录存放python3的安装文件,比如mkdir/opt/module/python3。如果出现这样的界面就代表python3安装成功了,输入exit()退出页面。可以使用wget方式下载,如果wget下载很慢,可以在这个地址(如果出现这样的界面就代表pip3可以正常使用,这个警告可以忽略。)手动下载tar.xz格式的压缩包,然后上传到服务器。1.先进入解压后的Python-3.8.6文件夹。...原创 2022-07-23 10:20:27 · 330 阅读 · 0 评论 -
血泪史:centos7误删了/usr/bin/python2,如何恢复?
有个不懂python的朋友在我这借了一个python工具类想要简化工作,因为公司服务器没有python3环境,就想自己安装一下环境,但是没想到被某些博客误导,博客中提到删除python2的软连接,朋友是python小白,不小心误删了/usr/bin/目录下的python2文件!找了几篇博客,大致都是需要先完全卸载服务器的python2残留文件,再去重新安装对应版本,具体怎么操作不做过多描述,但是问题又来了,朋友没有权限删除残留文件!,查看服务器内核版本,我的是7.4.1708版本,注意你的版本号。...原创 2022-07-22 18:42:00 · 1950 阅读 · 0 评论 -
python中如何使用正则表达式,看这一篇文章就够了
python正则表达式的使用原创 2022-04-02 17:41:55 · 3703 阅读 · 0 评论 -
python引入自己创建的工具类时报错no module named xxx
首先要注意目录层级关系,如果两个包是同层级的,如下图的情况。如果我想在dwd包下的read_test_csv.py文件中引用utils包下的rd.py工具类。如果直接写from utils import rd会报错,这是因为运行dwd包中的程序时,默认会在dwd层开始找要导入的module,dwd层没有utils,所以会报错。解决方法在read_test_csv.py中先导入sys,使用sys.path.append指定需要导入的包的路径,可以是绝对路径,也可以是相对路径。注意要先append,才能原创 2021-10-12 13:16:04 · 1997 阅读 · 0 评论 -
pip 命令安装库时没有下载完毕就报错
原因:pip命令安装库时默认从国外网站下载,网络不通畅时就会下载失败。解决办法:1.pip安装库时同时指定国内镜像源(临时生效,下次打开cmd就失效了)。如:pip install pymysql -i https://pypi.tuna.tsinghua.edu.cn/simple2.修改本地配置(永久生效)。在cmd输入以下命令:conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/fr.原创 2020-12-21 08:48:06 · 326 阅读 · 0 评论 -
通过pip命令安装好包之后,在pycharm中不显示此库,也不能调用
在cmd输入pip list 命令可以看到我的库都已经安装好了,但是pycharm中却没有显示。原因: 电脑中存在多个版本的python(anaconda也算),pycharm选择的python解释器和使用pip命令的解释器不是同一个。**解决方法:**参考这篇博客:https://blog.csdn.net/FlatTiger/article/details/109814966。重新选择一下本地的python解释器即可。更多关于python、机器学习、数据分析的资料可以扫描二维码添加我们的助教老原创 2020-12-21 08:35:52 · 5426 阅读 · 1 评论 -
监督学习之支持向量机SVM原理与代码实现
支持向量机SVMSVM最基本的应用就是分类。对于SVM,有一个分类平面,两个点集到此平面的最小距离最大,两个点集中的边缘点到此平面的距离最大。原创 2020-12-18 09:31:01 · 176 阅读 · 0 评论 -
监督学习之朴素贝叶斯原理与代码实现
贝叶斯概率公式:|表示后面的条件发生时,前面的事件发生的概率。P(类别|特征) 就表示当特征发生时,这个类别发生的概率。公式可以进行变形:P(类型|特征)*P(特征) = P(特征|类别)*P(类别)等号两侧也就是类别和特征同时发生的概率。先验概率和后验概率:先验概率和后验概率的概念比较抽象,下面我们用一个例子来说明什么是先验概率,什么是后验概率。假设我们开车时堵车有两个因素:车辆太多和发生了交通事故。堵车就是先验概率。如果我们出门前看到新闻上说,今天的路上发生了交通事故,那么我想计原创 2020-12-18 09:28:42 · 181 阅读 · 0 评论 -
监督学习之最邻近分类算法KNN原理与代码实现
最邻近分类算法KNN:近朱者赤近墨者黑,由邻居判读你的分类。为了判断未知样本的类别,以所有已知类别的样本作为参照,计算未知样本与所有已知样本的距离,从中选取与未知样本距离最近的K个已知样本,根据少数服从多数的投票法则,将未知样本与K个最邻近样本中所属类别占比较多的归为一类。距离怎么算?K怎么确定?通过交叉验证(将样本数据按照一定比例,拆分出训练用的数据和验证用的数据,比如6:4拆分出部分训练数据和验证数据),从选取一个较小的K值开始,不断增加K的值,然后计算验证集合的mean_square_原创 2020-12-18 09:27:18 · 262 阅读 · 1 评论 -
监督学习之随机森林原理与代码实现
随机森林:当你对某件事犹豫不决的时候,询问朋友的意见,听从大部分朋友的意见来做决定。随机森林由多个决策树组成,每一棵决策树分别进行判断和分类,每棵决策树都会得到一个自己的分类结果。最后随机森林对所有决策树的分类结果进行统计,分类结果最多的就是最终所属分类。随机森林的构造:构造随机森林的时候,会构造不同的决策树。哪里不同?训练数据不同,特征不同。构造步骤:假设有N个样本,我们有放回的随机抽取(取出一个,记录后放回,再重新抽取)N个样本,用这N个随机的样本训练决策树,作为决策树的根节点处的样本。原创 2020-12-18 09:23:15 · 592 阅读 · 0 评论 -
监督学习之决策树原理与代码实现
决策树:根据已知的条件,从根节点到叶子节点,根据不同的特征逐步判断,最终得到分类结果。决策树的分类过程就像人思考的过程。举个栗子:小明的妈妈给他介绍了一个相亲对象,小明正在考虑要不要去。决策树的构建(ID3决策树):随着树深度的增加,节点的熵迅速降低,熵降低的速度越快越好。这样有望构造一颗高度最矮的决策树。这里的熵指的是信息熵。事情越复杂,出现不同情况的种类就越多,信息熵越大;事情越简单,出现情况种类很少(极端情况为1种情况,那么对应概率为1,那么对应的信息熵为0),此时的信息熵较小。信息熵原创 2020-12-14 17:41:46 · 215 阅读 · 1 评论 -
监督学习之逻辑回归原理与代码实现
逻辑回归(Logistic Regression):逻辑回归虽然称作回归,但是并不是做回归拟合的,实际上是做二分类的。比如:判断一封邮件是否是垃圾邮件;判断银行贷款是否是欺诈行为;判断一个人是否生病。逻辑回归的结果就是1或0(是或否)。逻辑回归如何分类?之前的博客有介绍线性回归:https://blog.csdn.net/FlatTiger/article/details/110954733逻辑回归就是把线性回归的结果代入Sigmoid函数。Sigmoid函数的取值范围是 0-1。以0.5原创 2020-12-11 11:04:04 · 249 阅读 · 0 评论 -
监督学习之线性回归原理分析与代码实现
线性回归原理:机器学习中,回归就是拟合。利用回归方程(函数),对特征值(feature)和标签值(label/target)之间的关系进行建模。回归方程: 特征:影响结果的因素,也就是x。标签:最终的结果,也就是y。举个栗子:公司中每个人的薪资水平是不一样的,影响薪资的因素(特征)有:资历、学历、岗位、技能等等,薪资就是标签。假如我们把特征的具体值都数字化,我们根据已有员工的特征和标签,生成模型。就能预测新入职员工的薪资水平。误差分析:预测值和真实值之间一般会存在一定的误差,那么如何计算这原创 2020-12-11 09:48:02 · 199 阅读 · 0 评论 -
无监督学习之k-means聚类算法原理分析及代码实现
聚类把相似的对象通过静态分类的方式分成不同的组别或者更多的子集。同一子集中的对象都有相似的属性。K-Means聚类算法:K-Means是找到给定数据集k个簇的算法。簇的个数K是由用户指定的,每一个簇通过其质心(簇中所有点的中心)来描述。K-Means聚类算法的原理:1.创建k个点作为起始质心(通常都是随机选择的)。2.计算数据集中每个数据点到质心的距离,距离哪个质心近,就属于哪一个分类。3.对每一个簇中所有的数据点,计算他们的平均值作为新的质心,并重新计算每一个数据点到质心的距离,重新分类原创 2020-12-10 15:23:30 · 833 阅读 · 1 评论 -
机器学习:监督学习与无监督学习的区别
监督学习:根据现有的数据集,知道输入和输出结果,也就是已知特征和标签的对应关系。根据这种已知的关系,训练得到最优的模型。在监督学习的数据集中,既有特征(feature)信息又有标签(label)信息。通过训练,使得机器找到特征和标签之间的关系(训练得到最优模型)。在新的数据集中,只有特征信息没有标签,让机器根据训练的模型自动去判断出标签。举个栗子:我们知道适当的水分和充足的光照可以使植物的生长速度更快(但是机器不知道这个常识)。下面是一组记录了每天不同光照时间的植物的生长速度(以下数据属于作者杜撰,原创 2020-12-10 12:09:25 · 1167 阅读 · 0 评论 -
python中关于axis=0和axis=1应该如何理解?
axis=0:数据在纵向发生变化;axis=1:数据在横向发生变化。下面我们用python代码的方式更加直观的了解axis=0和axis=1的区别。import pandas as pddata = pd.DataFrame(data=[['吴文化', '男', 100, 98, 85], ['史珍香', '女', 66, 75, 72], ['范建', '男', 77, 88, 100],原创 2020-12-07 15:48:23 · 6209 阅读 · 2 评论 -
无监督学习之关联分析原理探究与代码实现
关联规则分析也称作是购物篮分析。最早是为了发现超市购物中不同的商品之间的关联关系。关联规则反映了一个事物和其他事物的关联性,如果多个事物之间存在着某种关联关系,那么其中一个事物就可以通过其他事物预测到。关联分析是一种在大规模数据集中寻找相互关系的任务。这些关联可以有两种形式:1)频繁项集:经常出现在一起的物品合集;2)关联规则:暗示两个物品之间可能存在很强的关联关系。...原创 2020-12-07 10:10:26 · 886 阅读 · 0 评论 -
python导入自定义包时出现红色波浪线,但是代码能正常运行
python用from *** import *** 时出现红色波浪线,但是代码可以正常运行,点开more查看更多信息时可以看到:Inspection info: This inspection detects names that should resolve but don’t. Due to dynamic dispatch and duck typing, this is possible in a limited but useful number of cases. Top-level an.原创 2020-12-04 17:23:25 · 2354 阅读 · 0 评论 -
机器学习中为什么要对特征做数据归一化?
对于线性模型来说,对特征做数据归一化是为了使不同的特征处于同样的量级范围内,不至于出现某些特征所占比重过大,从而主导预测结果。另外,归一化可以提升收敛速度。对于梯度下降优化的算法,如果我们的数据没有做归一化,会导致特征空间的不规则性,求最优解过程中,很可能会导致Z字形路线,需要迭代多次才能收敛。归一化之后,在梯度下降进行求解时能较快的收敛。归一化方法:1)x=(x−min)/(max−min)这种方法适用于数值比较集中的情况。这种方法有个缺陷,如果max和min不稳定,很容易使得归一化结果不原创 2020-11-27 12:00:44 · 1134 阅读 · 0 评论 -
机器学习之保存训练模型
话不多说,直接进入正题。1.首先导入joblib包import joblib2.训练好模型之后,即可保存模型到本地joblib.dump(模型实例名称,本地路径/文件名称)比如:joblib.dump(lr, r'G:\学习文件\机器学习\import_learing\predict_card.sav')3.最后在新的文件中导入模型并代入特征数据import joblibtrain_module = joblib.load(r'G:\学习文件\机器学习\import_learing\p原创 2020-11-27 10:59:53 · 1043 阅读 · 0 评论 -
关于python文件读写的路径问题
对于初学文件读写的小伙伴来说,经常会遇到文件路径不知道怎么写的问题。要搞明白这个问题,就要理解绝对路径与相对路径。首先说一下什么是绝对路径,绝对路径是当前文件在计算机磁盘中存放的具体位置。比如说:我的E盘data文件夹下的test_data文件夹下有一个data.csv文件,就像下面这张图:这个文件的绝对路径就是C:\data\test_data代码实例:with open(r'E:\data\test_data\data.csv', mode='r',encoding='utf8') as f:原创 2020-11-23 11:58:47 · 11933 阅读 · 0 评论 -
关于python代码中缩进的详解
python中的缩进是很严格的,python中用缩进来代表不同层级的代码块,同一层级的代码要对齐。那么什么是层级?什么是代码块?下面就用代码示例给大家详细的介绍一下。# 循环中的缩进sum_num = 0for i in range(1, 101): sum_num += i print(sum_num)上面这段代码实现的功能是1-100的整数相加,每相加一次就输出一次结果。在上面这段代码中,sum_num和for循环在同一层级,所以sum_num和for循环是对齐的。for循环原创 2020-11-23 11:06:01 · 5064 阅读 · 0 评论 -
pycharm 提示 no python interpreter configured for the project
打开pycharm会看到代码最上方一直提示no python interpreter configured for the project。run代码会出现如下窗口这是因为pycharm中没有配置python解释器。具体配置步骤可以参考这篇博客:https://blog.csdn.net/FlatTiger/article/details/109814966...原创 2020-11-19 16:16:17 · 330 阅读 · 0 评论 -
pycharm配置python解释器
1.点击file>settings2.点击project:interpreter,点击后面的齿轮,然后点add3.点击…选择本地python解释器make available to all projects 勾选上以后,创建新的项目默认使用当前配置的python解释器4.点击apply>ok即可...原创 2020-11-19 16:01:34 · 3950 阅读 · 3 评论 -
pycharm社区版安装及使用教程(win10系统)
1.下载下载地址:https://www.jetbrains.com/pycharm/download/#section=windows2.双击安装程序,直接next3.选择安装路径(安装路径最好不要带中文和空格)4.勾选配置,然后next没有框起来的那一项不用勾选,其他选项的作用如图5.这一步直接install6.直接finish7.打开pycharm并进行设置8.二选一都可以9.skip就可以...原创 2020-11-19 15:38:30 · 7936 阅读 · 2 评论 -
anaconda配置环境变量
本教程是win10系统,win7系统的同学修改环境变量的方法与此类似。第一步:此电脑>右键>属性>高级系统设置第二步:点击环境变量第三步:选择系统变量中的path>编辑第四步:新建环境变量第五步:输入本地的anaconda的相关目录,注意这个目录是你自己的安装目录。下面是我的anaconda相关目录:G:\develop\anacondaG:\develop\anaconda\Library\mingw-w64\binG:\develop\anaconda\原创 2020-11-18 12:06:27 · 26073 阅读 · 8 评论 -
anaconda安装步骤
1.下载anaconda安装包官网下载地址:https://www.anaconda.com/products/individual官网下载可能比较慢,下面是国内清华源镜像的地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/注意事项:先查看自己电脑是32位还是64位,具体查看方法:计算机右键>属性。自己的操作系统是多少位的就下载多少位的安装包。2.安装anaconda(以windows版本为例)第一步:直接next第原创 2020-11-18 11:27:47 · 305 阅读 · 0 评论