Data Mining
文章平均质量分 87
lxy_Alex
这个作者很懒,什么都没留下…
展开
-
linux中的sed 命令-替换
sed源自stream editor, 意为流编辑器. 是linux的三大文本编辑工具之一(seg, grep, awk). sed是一种在线编辑器,它一次只处理一行内容,并将结果发送到屏幕。具体过程如下: 1) 首先sed把当前正在处理的行保存在一个临时缓存区中(也称为模式空间); 2) 然后处理临时缓冲区中的行,完成后把该行发送到屏幕上。sed每处理完一行就将其从临时缓冲区删除,然...原创 2018-05-22 16:12:43 · 11437 阅读 · 0 评论 -
数据分析之: 基本文件操作
查看数据和文件基本操作拿到数据后, 我们都会马上打开看看, 最直接的动作就是鼠标点开, 看看都有哪些文件夹, 里面都有哪些数据. 如果数据比较少, 这样简单粗暴的查看方式在时间上还是可以接受的. 但是如果数据文件很多, 特别是文件夹嵌套了很多层, 那这样的方式查看数据就不太明智了. 好在linux和python都提供了很多可以帮助我们快速浏览数据的工具. 例如linux下的cat, tree,...原创 2018-04-06 19:40:35 · 418 阅读 · 0 评论 -
特征工程: 特征, 特征提取和特征选择
文章目录机器学习中的特征特征的重要性特征提取和特征选择去除方差较小的特征单变量特征选择 (Univariate feature selection)F检验与互信息其他特征选择方法重复性特征删除:用模型选择:并入pipeline机器学习中的特征在机器学习和模式识别中,特征是在观测现象中的一种独立、可测量的属性。选择信息量大的、有差别性的、独立的特征是模式识别、分类和回归问题的关键一步。最初的原...原创 2019-04-29 17:22:24 · 5318 阅读 · 0 评论 -
MRI机器学习工具箱nilearn: masker
masker 对象的概念对于任何基于神经影像的研究来说, 第一步都是要加载数据. 由于通常MRI是3D的, fmri加上时间这个轴, 是4D的, 对于机器学习模型来说, 这种4D的数据结构不便于分析. nilearn中 masking data 本质上是将4D的fmri数据变形成2D(voxel * timepoints). 但是如何将4D数据转为2D的数据, 对于不同的问题来说, 要选择的脑...原创 2019-04-25 12:15:13 · 2570 阅读 · 0 评论