相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。
字段可根据需要扩充,即字段数目不定,可称为半结构化数据,例如Exchange存储的数据。
非结构化数据库
在信息社会,信息可以划分为两大类。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。结构化数据属于非结构化数据,是非结构化数据的特例。
随着网络技术的发展,特别是Internet和Intranet技术的飞快发展,使得非结构化数据的数量日趋增大。这时,主要用于管理结构化数据的关系 数据库的局限性暴露地越来越明显。因而,数据库技术相应地进入了“后关系数据库时代”,发展进入基于网络应用的非结构化数据库时代。所谓非结构化数据库, 是指数据库的变长纪录由若干不可重复和可重复的字段组成,而每个字段又可由若干不可重复和可重复的子字段组成。简单地说,非结构化数据库就是字段可变的数 据库。
所谓结构化问题,是指将逐渐积累起来的知识加以归纳和整理,使之条理化、纲领化,能做到纲举目张的问题。
知识是逐渐积累的,但在头脑中不应该是堆积的。
心理学研究已发现,优生和差生的知识组织存在明显差异。
优生头脑中的知识是有组织、有系统的,知识点按层次排列,而且知识点之间有内在联系,具有结构层次性。而差生头脑中的知识则水平排列,是零散和孤立的。结构化问题对知识学习具有重要作用,因为当知识以一种层次网络结构的方式进行储存时,可以大大提高知识应用时的检索效率。