9 训练工具-再谈机器学习第三步
在实际工作中,除了最有技术含量的建模以外, 还有些事情没啥技术,但是也必 不可少, 俗称脏活。 而像输入的数据的整理, 非法数据的剔除都属于这一类脏活。
一个输入数据, 通常被数字化以后, 会被存放在计算机的存储设备中。 有的时 候,为了存取简单,会使用文件的形式存放的, 有的时候,为了存取高效,会用专业 的数据库软件来存放。 因为当前大量的数据是通过文本文件存放的, 所以,我们先以 普通的文本文件为例, 介绍一些输入数据处理的工具软件。
9 训练工具-再谈机器学习第三步
在实际工作中,除了最有技术含量的建模以外, 还有些事情没啥技术,但是也必 不可少, 俗称脏活。 而像输入的数据的整理, 非法数据的剔除都属于这一类脏活。
一个输入数据, 通常被数字化以后, 会被存放在计算机的存储设备中。 有的时 候,为了存取简单,会使用文件的形式存放的, 有的时候,为了存取高效,会用专业 的数据库软件来存放。 因为当前大量的数据是通过文本文件存放的, 所以,我们先以 普通的文本文件为例, 介绍一些输入数据处理的工具软件。