1.1. Данные и модели данных
Данные и информация - понятия, на обыденном уровне, тождественные, но в информатике под данными понимаются факты реального мира или идеи, пред­ставленные в формализованном виде. Следует обратить внимание на требование формализации, которое означает, что произвольные «куски» информации данны­ми не являются. Информация практически есть некоторое приращение наших знаний, получаемое при анализе имеющихся данных. Естественно, что это опре­деление информации не является формальным и не может использоваться в рам­ках формальной теории. Но определение помогает понять, что сами по себе дан­ные не обеспечивают никакой информации, поскольку необходимо понимать, что означает та или иная совокупность данных. Так, например, совокупность двоич­ных знаков «00000100» может означать или число «4», или, например, символ с кодом «4». В то же время, число «4» может означать «4 книги», «4 компьютера» и т.д. Процесс получения информации из данных обычно называется их интерпре­тацией, но интерпретация данных требует привлечения дополнительного инстру­ментария.

Модель данных - это интеллектуальное средство, позволяющее реализовы­вать интерпретацию данных и таким образом способствовать получению инфор­мации из данных.

Формализуем данное понятие. Как правило, данные отражают свойства (ха­рактеристики) объектов реального мира. Данные, представляющие одно и тоже свойство различных объектов объединяются в так называемые именованные кате­гории. Например, рост, вес или фамилия - суть именованные категории для дан­ных, описывающих объекты класса “человек”.

Совокупность именованных категорий для однотипных объектов образуют модель плоских файлов (иначе, модель инвертированных файлов).

Приведем пример данной модели.

Ф.И.О.

Рост

Вес

Иванов Иван Иванович

180

75

Петров Пётр Петрович

190

100

 

Модель плоских файлов является простейшей моделью данных. В более сложных случаях совокупность именованных категорий, их свойств и связей меж­ду ними, а также ограничения на допустимые данные образуют схему данных. А совокупность данных, структура и значение которых соответствуют конкретной схеме, называют базой данных (БД).

Модель данных (М) с формальной точки зрения определяется, как тройка

M = {G, R, 0}

где G - множество правил порождения структур данных (схемы), R - множество правил порождения ограничений целостности, О - множество допустимых опера­ций над данными.

Примечание. Определение порождающих правил, на которые ссылается данное определе­ние, дано в теории формальных языков и формальных грамматик [42].

Управление БД на ЭВМ осуществляется с помощью специальных программ­ных средств - систем управления базами данных (СУБД), которые в идеале долж­ны содержать язык определения данных (ЯОД), язык определения ограничений целостности (ЯООЦ), и обеспечивает выполнение операций над данными с помо­щью языка манипулирования данными (ЯМД).

Рассмотрим подробнее подходы к определению каждой из составляющих модели данных.