1 结构化:是指数据本身有着明确的数据结构及其含义,最常见的就是一般的数据库表中的数据。
2半结构化:我们经常会看到,HTML文档属于一种半结构化网页文档,这是因为,在网页文档中,有些数据字段,比如<title>******</title>标签对内的内容为字符串,含义为网页菜单标题。但是有些标签对如<table></table>内的数据,其数据类型和数据含义必须视具体的实际情况而言,才能说得清楚。
3非结构化:数据本身完全没有任何特征、规律。比如:你胡乱敲击键盘打出来的内容,数据类型可以看做是字符串,但是含义也无法表达清楚。