机器学习人工智能
文章平均质量分 90
shuiyuejihua
这个作者很懒,什么都没留下…
展开
-
python37 dlib win10 64 vs2019
一场face_alignment引发的惨案人脸识别face_alignment,看着挺好,想试试pip install face-alignment -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com结果中间包dlib安装失败,7M左右的小包,看了看pip官网,py36还有whl的轮子,直接装,之后的都是tar.gz,需要自己编。正常情况,python,cmake,加上vs sudio就ok原创 2021-04-15 19:22:58 · 235 阅读 · 0 评论 -
模型性能度量 混淆矩阵
1.回归模型度量方法:均方误差 mean_squared_errorR2分数 r2_score可释方差分数 explained_variance_score2.分类模型度量方法:错误率、精度accuracy。分类错误或正确的样本数占样本总数的比例在查准率、查全率、f分数之前,先看看混淆矩阵,容易晕人这个混淆矩阵:样本实际情况(True、False)、预测结果(...原创 2018-01-04 16:53:09 · 524 阅读 · 0 评论 -
模型评估方法
1.留出法 hold-out一定比例划分出训练集、测试集 保证数据分布的一致性,否则划分后数据分布差异产生偏差;每次数据划分的地方不同,结果就不同。单次使用留出法,结果不可靠一般训练集在2/3到4/5之间2.交叉验证 cross validation随机不同的划分 特例 : 留一法 leave-one-out ,K-1个训练集、余下的作为测试集 结果比较准确;计算复杂度高3.自助原创 2018-01-03 16:00:09 · 475 阅读 · 0 评论 -
2.1 中位数、平均值、众数的总结
中位数、平均值、众数的总结中位数 median 1.中位数,数据从小到大排序,中间位置的那个数字。奇数,+1除以2;偶数,则用除以2,除以2然后+1,这两项的和,再除以2求个平均 2.不容易受到数据两端的异常值影响,不受组距影响;在直方图上,左右面积大概相等的位置点。比如5出现10次,然后6 7 8 9 9 9 9 ,这样5的这条方块就比较高,中位数偏5这边。比毕竟555555555567原创 2017-10-31 10:03:25 · 3561 阅读 · 0 评论 -
数据整理
1.收集数据根据数据来源及其格式,收集数据的步骤各不相同高级收集过程:获取数据(从互联网下载文件、抓取网页、查询 API 等),然后将该数据导入编程环境(例如 Jupyter Notebook)。2.评估数据评估数据的目的包括:质量:内容问题。低质量数据也称为脏数据。整洁度:使分析难易进行的问题。不整洁数据也称为杂乱数据。条理数据的要求包括: 每个变量成一列。每个观察结果成一行。每原创 2017-12-19 23:35:45 · 486 阅读 · 0 评论 -
人
人,包含硬件和软件而流感病毒、扭伤、发炎这些,主要破坏硬件而所谓的信仰、敢死队、传销,这些主要是破坏软件而有的人会为生活所逼,精神异常、感情异常、行为异常,精神病;这些主要是软件系统破坏,有的还会自杀,这叫自毁程序所以,有的人练习瑜伽、气功、修身养性,想去修改软件底层代码,这肯定很难,以至于有的人花了十多年,几十年,还在修行中。我想说的是,身体硬原创 2017-09-11 16:12:30 · 257 阅读 · 0 评论 -
机器学习路线
01 机器学习简介1. 机器学习定义;2. 机器学习行业应用举例;3. 机器学习任务:分类、回归、聚类、降维、半监督学习、迁移学习、强化学习;4. 机器学习算法的组成部分:目标函数(损失函数+正则)、优化方法;5. 模型评估和模型选择:模型复杂度、overfitting、交叉验证、超参数空间、网格搜索…案例:波士顿房价。包含内容——损失函转载 2017-09-10 10:53:33 · 322 阅读 · 0 评论 -
大数据学习路线
第一阶段:linux+搜索+hadoop体系Linux大纲 这章是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,kvm,openstack等众多课程。因为企业中无一例外的是使用Linux来搭建或部署项目。1) Linux的介绍,Linux的安装:VMware Workstation虚拟软件安装过程转载 2017-08-29 11:32:00 · 725 阅读 · 0 评论