人工智能
文章平均质量分 60
chenXin@Euler
黄金分割点、白银分割点
展开
-
自然语言处理常用到的包
斯坦福的corenlp,可以用来entities的提取。 http://nlp.stanford.edu/software/corenlp.shtml关于情感分析情感分析的词库,sentiment Word wordnet 是近义词词典 sentiwordnet 基于wordnet的,现在已经 3.0了 http://sentiwordnet.isti.cnr.it/ ...转载 2018-08-21 17:21:59 · 1719 阅读 · 0 评论 -
AUC和ROC
AUC(Area Under Curve)被定义为ROC曲线下的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。使用AUC值作为评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好,而作为一个数值,对应AUC更大的分类器效果更好。这句话有些绕,我尝试解释一下:首先AUC值是一个概率值,当你随机挑选一个正样...原创 2018-08-13 15:26:35 · 473 阅读 · 0 评论 -
无人驾驶环境感知设备中 激光雷达和摄像头各自的优缺点
无人驾驶环境感知设备中 激光雷达和摄像头各自的优缺点原创 2018-11-16 11:59:24 · 11552 阅读 · 2 评论 -
过拟合和欠拟合以及相对应的解决办法
欠拟合:是指模型的学习能力比较低,以至于,只学到了很少的一部分信息,当进行预测的时候,会发生方差最低,和偏差较大的情况 过拟合:是指模型的学习能力比较强,以至于,直接把题给背下来了,如果考到原题,就会实现相应的预测100%,如果预测的不再训练集中,那么结果就是0. 过拟合是偏差较小,但是方差较大 上面的较小与较大是和不欠拟合也不过拟合的相比而言的,这也在某种程度上说明了,偏差 和方差是一个均...原创 2018-08-16 15:29:58 · 663 阅读 · 0 评论 -
mac安装tensorflow,因为找不到合适的版本资源问题
有很多博主的解答是需要把pip更新到18.0版本 其实我的尝试是,根本不是这样的一个问题,即使你更新了,你发现,你依旧是安装不了的,苦于这样,我给你们带来了我的亲身体验,并且我的问题已经解决了。 分享给大家 其实在安装tensorflow的时候,如果,你是在python3.7版本上安装的,并且使用的命令是 pip3 install tensorflow 那么一定会报错(当然可能pytho...原创 2018-08-12 10:16:22 · 1788 阅读 · 0 评论 -
梯度下降法详解
我是转载,这个人真的很牛,但是我还是没有想明白,为何凸函数作为损失函数,梯度下降法一定会收敛到全局最优点,如果有解答过或明白的,请告知谢谢 https://www.cnblogs.com/pinard/p/5970503.html...转载 2018-08-15 18:11:20 · 500 阅读 · 0 评论 -
机器学习中的损失函数(凸函数辨别)
(转)机器学习中的损失函数 损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是经验风险函数的核心部分,也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项,通常可以表示成如下式子: θ∗=argminθ1N∑i=1NL(yi,f(...转载 2018-08-15 18:00:08 · 14500 阅读 · 2 评论 -
xgboost参数解释
XGBoost参数,xgboost最终要的部分就是参数的配置在运行XGboost主要设置的三种类型参数:general parameters,booster parameters和task parameters:General parameters: 参数控制在提升(boosting)过程中使用哪种booster,常用的booster有树模型(tree)和线性模型(linear mode...原创 2018-08-12 15:28:18 · 1666 阅读 · 0 评论 -
独热向量编码原理
`# -- coding: utf-8 -- from future import unicode_literals import numpy as np import sklearn.preprocessing as spraw_samples = np.array([ [1, 3, 2], [7, 5, 4], [1, 8, 6], [7, 3...原创 2018-08-13 11:09:38 · 3136 阅读 · 0 评论 -
觉得比较有用的几道机器学习面试题,很基础的
来自tinymind,这个你们也可以去注册一个,关注一下这个人工智能社区 不客气 原文网址,可以在这里进行注册的 https://www.tinymind.cn/articles/109 1、你会在时间序列数据集上使用什么交叉验证技术?是用k倍或LOOCV? 都不是。对于时间序列问题,k倍可能会很麻烦,因为第4年或第5年的一些模式有可能跟第3年的不同,而对数据集的重复采样会将分离这些趋...转载 2018-08-15 19:57:15 · 159 阅读 · 0 评论 -
未经审批不得OTA!工信部新规加强自动驾驶升级管理
未经审批不得OTA!工信部新规加强自动驾驶升级管理未经审批不得OTA!工信部新规加强自动驾驶升级管理未经审批不得OTA!工信部新规加强自动驾驶升级管理未经审批不得OTA!工信部新规加强自动驾驶升级管理一切都是为了安全!!!一切都是为了安全!!!一切都是为了安全!!!未经审批不得OTA!工信部新规加强自动驾驶升级管理未经审批不得OTA!工信部新规加强自动驾驶升级管理未经审批不得OTA!工信部新规加强自动驾驶升级管理2021年8月12日,工信部近日印发了《关于加强智能网联汽车生产企业及产品准入管理的意见原创 2021-08-16 22:38:28 · 409 阅读 · 0 评论 -
自动驾驶工信部道路测试十四项纲要
自动驾驶工信部十四项交通标志标线识别及响应限速标志识别及响应停车让行标志识别及响应车道线识别及响应人行横道识别及响应交通信号灯识别及响应机动车信号灯识别及响应方向指示灯识别及响应前方车辆行驶状态识别及响应车辆驶入识别及响应对向车道借道本车道行驶识别及响应障碍物识别及响应障碍物测试误作用测试行人和非机动车识别及避让行人横穿马路行人沿道路行驶两轮车横穿马路两轮车沿道路行驶跟车行驶稳定跟车行驶停走功能靠边停车靠路边应急停车靠右车道内靠边停车超车超车并道临近车道无车并道临近车道有车并道前方车道减少交叉路口通行直行车原创 2021-08-16 22:22:52 · 523 阅读 · 0 评论 -
自动驾驶测试流程大全
自动驾驶测试自动驾驶包含的工作流程自动驾驶测试主要验证目的包含在环测试包含什么,其验证的目的分别是什么?场地测试主要测试内容包括什么?目前汽车上市前需要进行的具体测试项目有哪些?自动驾驶测试面临的主要困难有什么?国内国际的主流标准法规有哪些?生成一个适合你的列表创建一个表格生成一个适合你的列表创建一个表格SmartyPants创建一个自定义列表如何创建一个注脚去[博客设置](https://mp.csdn.net/console/configBlog)页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的原创 2021-08-16 10:52:07 · 6635 阅读 · 0 评论 -
陆奇:人工智能时代创新创意的浪潮
在著名的命名规则当推Microsoft公司的"匈牙利"法,该命名规则的主要思想是"在变量和函数中加入前缀以增进人们对程序的理解"。例如所有的字符变量均以 ch为前缀,若是指针则追加前缀p 。如果变量由 ppch开头,则表明他是指向字符指针的指针。"匈牙利"法最大的缺点就是繁琐,因为繁琐的程序会让绝大多数程序猿无法忍受。据统计,没有一种命名规则可以让所有的程序员赞同,程序设计教科书一般都不指定命...原创 2019-09-12 16:37:52 · 406 阅读 · 1 评论 -
Tusimple-benchmark-data
Tusimple-benchmark原创 2018-11-16 12:52:56 · 1672 阅读 · 5 评论 -
线性回归中 给损失函数加的正则项L1和L2
正则化(Regularization) 机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作ℓ1-norm和ℓ2-norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数。L1正则化和L2正则化可以看做是损失函数的惩罚项。 L1正则化是指权值向量w中各个元素的绝对值之和,通常表示为||w||1 L2正则化是指权值向量w中各个元素的平方和然后再...原创 2018-08-22 21:51:13 · 3239 阅读 · 0 评论 -
mac登陆远程服务器
Mac 用户可以使用本机的 terminal 软件来连接服务器。Windows 用户可以使用 cmd 或者 XShell 软件来连接服务器。 XShell 软件连接服务器最开始,查看七月在线官网的私信(官网登陆后,点击头像,进入消息中心,最后点击私信),你需要知道以下几个参数: username:格式为 chenxinjingjing_451855@101.132.121.198 pas...翻译 2018-08-27 15:06:22 · 4618 阅读 · 0 评论 -
sklearn 逻辑回归中的参数的详解'newton-cg', 'lbfgs', 'liblinear', 'sag', 'saga'
penalty : str, ‘l1’ or ‘l2’, default: ‘l2’ 这个是l1 or l2正则化,一般选l2正则化对于逻辑回归分类算法 dual:选择默认的就好,针对的就是l2正则和libliner solver C : float, default: 1.0 正则强度逆或者叫做惩罚系数就是对误差的容忍度,值越高越不能容忍 fit_intercept : bool, d...翻译 2018-08-27 17:20:52 · 13936 阅读 · 0 评论 -
机器学习降维技术(unsupervision/supervision)
线性将维技术本质是把数据投影到低维线性子空间,通过特征的线性组合来降维,其代表方法有主成分分析(PCA),线性判别技术(LDA)等。原始观察空间中的样本具有极大的信息冗余,样本的高维数引发分类器设计的“维度灾难”。将维可以在一定程度上解决这个问题,比如说样本数400,但是特征属性有40000个,这就是一个维度灾难的实际现象。 缓解维度灾难的一个重要途径是降维,即将高纬度空间的数据缩放到低纬度空...原创 2018-08-20 18:26:59 · 590 阅读 · 0 评论 -
特征选择算法(机器学习)
1)特征选择理论 一份数据有很多属性,但有些属性可能很关键,另一些没有用。从给定特征集中选择出相关特征子集的过程称为特征选择。特征选择是一个重要的数据预处理过程。一般在正式的数据处理之前进行。 特征选择是一个重要的数据预处理过程,他不仅可以降低数据维数,以节省时间,简化分析,规避“维度灾难”,更可以去除无关特征,抓住主要矛盾,使分析结果更加准确。同时,采用特征选择算法还便于理解和可视化数据,降...原创 2018-08-20 23:04:25 · 4766 阅读 · 0 评论 -
机器学习集成模型
下面示例的是boosting集成,bagging集成,stacking集成 详细的信息,明天早晨起床再添加吧!困了先睡了翻译 2018-08-20 23:29:49 · 3423 阅读 · 0 评论 -
机器学习之聚类
衡量聚类距离的方式有很多,常用的方式有欧式距离和曼哈顿距离两种。对于两个n维数据Xi,Xj,以下是两种距离的计算公式, 上图中的k代表的是维度数,最高是n维,而不是幂次数 图片裁剪的像素尺度不好,导致图片只能倒放,造成的不便还请多多包涵! 原型聚类:K-means 聚类算法有很多种,常用的聚方法包括原型聚类,密度聚类,层次聚类几种。 原型聚类是指聚类结构能通过一组原型刻画的聚类,原...原创 2018-08-21 10:36:46 · 476 阅读 · 0 评论 -
机器学习之情感分析
情感分析# -*- coding: utf-8 -*-from __future__ import unicode_literals# sent.pyimport nltk.corpus as ncimport nltk.classify as cfimport nltk.classify.util as cupdata = []fileids = nc.movie_review...原创 2018-08-25 15:17:24 · 1301 阅读 · 0 评论 -
Julia语言的安装针对mac linux window(有空我会翻译下)
Platform Specific InstructionsWindows Julia is available for Windows 7 and later, both 32 bit and 64 bit.Download the Windows julia.exe installer for your platform. 32-bit julia works on both x86...原创 2018-09-05 22:42:18 · 594 阅读 · 0 评论 -
python代码编写去除奇异值
对于这个代码,对于异常值不是很明显的是无法处理的,对于相对应的波峰波谷(如果很小的差距是不可以检测出来的)利用的原理是3sigam# -*- coding:utf-8 -*-# sed 1d excel_file.xlsx > new_excel_file.xlsx# 上面这条命令的方式是为了删除带有第一行的文件的标题头import numpy as npdata = np.l...原创 2018-09-21 16:02:24 · 2794 阅读 · 0 评论 -
ubuntu14.04 install ros 发生的各种问题以及解决方案broken packages problem and soulation
if you find error :you have xxx broken packages i hope you don’t try again ,you must again install ubuntu 14.04 iso ubuntu iso if you dont find erro:xxxx broken packages…. do this : ros install ...原创 2018-09-07 10:05:01 · 317 阅读 · 0 评论 -
随机森林(randomForest)和极限树或者叫做极端随机树(extraTree),
随机森林:是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。,随机森林对回归的结果在内部是取得平均 但是并不是所有的回归都是取的平均,有些是取的和,以后会发博文来解释这样的一个现象,需要整理些资料出来。 随机森林里的随机包含的意思是: 样本随机 特征随机 参数随机 模型随机(ID3 ,C4.5) 极限树/极端随机树里的随机包含的意思是: 特征随机 参...原创 2018-08-18 22:39:28 · 39300 阅读 · 1 评论