1. Системы управления базами данных
Системы управления базами данных (СУБД) – это специализированные программные продукты, позволяющие:
1) постоянно хранить сколь угодно большие (но не бесконечные) объемы данных;
2) извлекать и изменять эти хранящиеся данные в том или ином аспекте, используя при этом так называемые запросы;
3) создавать новые базы данных, т. е. описывать логические структуры данных и задавать их структуру, т. е. предоставляют интерфейс программирования;
4) обращаться к хранящимся данным со стороны нескольких пользователей одновременно (т. е. предоставляют доступ к механизму управления транзакциями).
Соответственно, базы данных – это наборы данных, находящиеся под контролем систем управления.
Сейчас системы управления базами данных являются наиболее сложными программными продуктами на рынке и составляют его основу. В дальнейшем предполагается вести разработки по сочетанию обычных систем управления базами данных с объектно-ориентированным программированием (ООП) и интернет-технологиями.
Изначально СУБД были основаны на иерархических и сетевых моделях данных, т. е. позволяли работать только с древовидными и графовыми структурами. В процессе развития в 1970 г. появились системы управления базами данных, предложенные Коддом (Codd), основанные на реляционной модели данных.
2. Реляционные базы данных
Термин «реляционный» произошел от английского слова «relation» – «отношение».
В самом общем математическом смысле (как можно помнить из классического курса алгебры множеств) отношение – это множество
R = {(x>1, …, x>n) | x>1∈ A>1,…,x>n∈A>n},
где A>1, …, A>n— множества, образующие декартово произведение. Таким образом, отношение R— это подмножество декартова произведения множеств: A>1 × … × A>n :
Например, рассмотрим бинарные отношения строгого порядка «больше» и «меньше» на множестве упорядоченных пар чисел A>1 = A2 = {3, 4, 5}:
R>> = {(3, 4), (4, 5), (3, 5)} ⊂A>1 × A>2;
R>< = {(5, 4), (4, 3), (5, 3)} ⊂ A>1 × A>2.
Эти же отношения можно представить в виде таблиц.
Отношение «больше» R>>:
Отношение «меньше» R><:
Таким образом, мы видим, что в реляционных базах данных самые различные данные организовываются в виде отношений и могут быть представлены в форме таблиц.
Нужно заметить, что эти два рассмотренных нами отношения R>> и R>< не эквивалентны между собой, другими словами, таблицы, соответствующие этим отношениям, не равны друг другу.
Итак, формы представления данных в реляционных БД могут быть разными. В чем проявляется эта возможность различного представления в нашем случае? Отношения R>> и R>< – это множества, а множество – структура неупорядоченная, значит, в таблицах, соответствующих этим отношениям, строки можно менять между собой местами. Но в то же время элементы этих множеств – это упорядоченные наборы, в нашем случае – упорядоченные пары чисел 3, 4, 5, значит, столбцы менять местами нельзя. Таким образом, мы показали, что представление отношения (в математическом смысле) в виде таблицы с произвольным порядком строк и фиксированным числом столбцов является приемлемой, правильной формой представления отношений.
Но если рассматривать отношения R>> и R>< с точки зрения заложенной в них информации, то понятно, что они эквивалентны. Поэтому в реляционных базах данных понятие «отношение» имеет несколько другой смысл, нежели отношение в общей математике. А именно оно не связано с упорядоченностью по столбцам в табличной форме представления. Вместо этого вводятся так называемые схемы отношений «строка – заголовок столбцов», т. е. каждому столбцу дается заголовок, после чего их можно беспрепятственно менять местами.
Вот как будут выглядеть наши отношения