python笔记一天一个小知识
文章平均质量分 55
Calorie_Wu
没有学不会的知识,只有不努力的小白!加油!
展开
-
正则化定义和类别
正则化定义和类别什么是正则化: 在解决回归过拟合中,我们选择正则化,但对于其他机器学习算法如分类算法来说也会出现这种问题,数据提供的特征有那些影响模型复杂度或者这个特征的数据点异常比较多,所以算法在学习的时候尽量减少这个特征的影响,就是正则化L2正则化:作用可以使其中一些W的都很小都接近于0,削落某个特征的影响优点:越小的参数水明越简单越简单的模型与不容易产生过拟合RIdge回归:L1正则化作用:可以使的其中的一些W为0,删除这个特征影响。Lasso回归岭回归是在结构风险最小化的正则原创 2021-03-15 10:08:44 · 380 阅读 · 0 评论 -
欠拟合和过拟合定义和解决办法
欠拟合和过拟合定义和解决办法定义:过拟合:一个假定在训练集数据上能够获得比其他假设更好的拟合,但在测试集上却不能很好的拟合数据,此时认为这个假设出现过拟合的现象(模型过于复杂)欠拟和:假定在训练集上不能获得更好的拟合并且在测试集上也不能很好的拟合数据此时认为这个假设出现欠拟合的现象(模型过于简单)解决办法:欠拟合原因以及解决办法学习到数据的特征过少解决办法1)添加其他特征项,有时候我们模型出现欠拟合的时候是因为特征项不够导致的,可以添加其他特征项来很好地解决。例如,“组合”、“泛化”、“原创 2021-03-15 09:58:55 · 692 阅读 · 0 评论 -
聚类算法
什么是聚类?介绍一下聚类算法聚类我的理解是就好比喻物以类聚,人以群分,某一种东西或者物体有某种相关联的性质聚在一起,聚类算法可以建立在无特征无标记的数据上一种非监督的学习方法,聚类根据自身的距离,特性,相似度分成诺干组,分划的组内是内部距离最小外部距离最大。kmeans算法的原理kmeans算法接受输入量k,然后将n个对象划分为k个聚类获得的聚类满足:同一聚类中的对象相似度较高,然而聚类中的对象相似度较小,聚类相似度是利用各聚类中的均值所得一个中心对象来进行计算你之前的项目如何使用聚类(kmeans原创 2021-03-15 09:42:56 · 106 阅读 · 0 评论 -
机器学习算法优缺点总结
机器学习算法优缺点总结:无监督学习算法:聚类算法:K-MeansK-Means中心思想:事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度,将样本点归到最相似的类中,接着,重新计算每个类的质心,重复这样的过程,直到质心不再改变,最终就确定了每个样本所属的类别以及每个类的质心。优点:算法原理简单、处理速度较快当聚类是密集的,且类与类之间区别明显时,效果较好缺点:在K-Means算法中,K是事先给定的,比较难确定对孤立点原创 2021-03-15 09:26:19 · 707 阅读 · 0 评论 -
安装虚拟环境—手把手教学
创建自己的虚拟环境相信很多人学习了很久Python,还不会安装虚拟环境,这里手把手教会你创建自己的虚拟环境,步骤如下:选择一个途径:如:以我的F盘为例新建文件夹并命名。(如:myproject)输入virtualenv .venv创建虚拟环境(.venv中的"."代表创建的是一个隐藏文件)创建完成后打开myproject,出现一个关于.venv的文件夹,表示环境创建成功双击进入.venv 里面的Scripts文件夹输入activate 点击回车激活并进入虚拟原创 2021-03-06 09:29:26 · 2540 阅读 · 29 评论 -
探索性数据分析(EDA)
探索性数据分析(EDA)举例:泰坦尼克仅供展示图用定义:是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法各种杂乱的 “脏数据” ,往往不知所措,不知道从哪里开始了解目前拿到手上的数据时候,探索性数据分析就非常有效。安装3个包:**Pandas_Profiling** ,**Sweetviz**,**pandasGUI**第一:Pandas_Profiling生成了一个快原创 2021-03-05 16:20:43 · 830 阅读 · 3 评论 -
用户流失预警项目
用户流失预警项目(一)用到的算法有:随机森林,集成学习梯度提升决策树,决策树,逻辑回归,xgboost五种优化方法:利用网格搜索GridSearchCV()工具优化模型的参数1 字段说明:‘State’: 所在州‘Account Length’: 账号长度‘Area Code’: 区域号码‘Phone’: 电话号码“Int’l Plan”: 是否开通国际套餐‘VMail Plan’: 是否开通语音邮箱‘VMail Message’: 是否开通语音邮箱消息套餐‘Day Mins’原创 2021-03-04 00:33:41 · 922 阅读 · 5 评论 -
Python初学者零碎基础笔记(四)对字符串s排重 相关题目[⾯试题]
[⾯试题]对字符串s排重 相关题目对字符串s排重 但是不影响字符的顺序例:s = 'hello bye 123 see you’方法一:普通做法s = 'hello bye 123 see you's1=(set(s))s2=list(s1)s2.sort(key=s.index)print(''.join(s2))>>>helo by123su方法一:简便做法s = 'hello bye 123 see you'print(''.join(sorted(set(原创 2020-10-11 16:38:16 · 2028 阅读 · 6 评论 -
Python初学者零碎基础笔记(三)全局变量与局部变量,闭包变量的区分用法
全局变量与局部变量,闭包变量的区分先扩展:) 内建作用域:系统的函数和变量,在所有的文件中都可以使用例:print(max(1,2,344,55)) # max属于内建作用域)全局作用域:在一个代码文件中,变量(必须在函数外定义) 从定义开 始到本文件结束)闭包作用域:嵌套函数中,外部函数里 变量从定义开始到函数结束)局部作用域: 在一个函数里,变量从定义开始到函数结束)内建作用域 > 全局作用域 >闭包作用域>局部作用域6 .)原创 2020-10-11 15:51:51 · 750 阅读 · 13 评论 -
mysql数据库初学者简单操作
mysql数据库操作mysql操作步骤:在cmd中链接mysql服务器:mysql -u root -pentry password: 输入密码当进入到mysql服务器中,可以查看有哪些数据库show databases;创建数据库: create database 数据库的名字;进入数据库: use 数据库的名字;查询当前是在哪个数据库: select database();创建表结构-create table 表名( 字段1 字段类型 [约束条件], 字段2 字原创 2020-10-11 10:10:31 · 1840 阅读 · 9 评论 -
Python初学者零碎基础笔记(二)
Python初学者零碎基础笔记字符串内置函数:capitalize():将字符串的第一个字符换成大写name='xiao ming'names=name.capitalize()print(names)>>>Xiao mingtitle():每个单词的首字母换成大写name='xiao ming'names=name.title()print(names)>>>Xiao Mingistitle():判断语句,判断每个单词的首字母原创 2020-10-09 20:44:51 · 680 阅读 · 9 评论 -
Python初学者零碎基础笔记(一)
Python初学者零碎基础笔记一行代码输入多个参数方法1.) a,b,c=map(类型,input(“请输入”).split())#默认空格分隔,若要转其他类型,把类型换成需要的如-----转整型:map(int,input(“请输入”).split())a,b,c=map(int,input("请输入").split())print(a+b+c,type(a),type(b),type(c))>>>请输入1 2 3>>>>6 <cla原创 2020-10-09 11:48:25 · 4857 阅读 · 35 评论