Home Лаборатория
Назад Оглавление Вперед

1. БАЗЫ ДАННЫХ. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ

1.1. Модели баз данных.

В настоящее время существует три основных модели баз данных: иерархическая, сетевая и реляционная.

Основной принцип иерархической модели - иерархическая структура данных. Это означает, что каждая запись в базе данных может иметь сколько угодно потомков, но только одного родителя. Сетевой принцип организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь только одного предка; в сетевой структуре данных потомок может иметь любое число предков. К недостатком сетевой модели можно отнести низкое быстродействие и высокие требования к памяти.

Широкое распространение получили БД, имеющие табличную структуру. Базы данных, имеющие связанные таблицы, называют также реляционными базами данных. В таких БД все данные хранятся в различных таблицах и физически не связаны между собой. Разработчик должен сам продумать, каким образом объединить эти данные при извлечении их из БД. Координация осуществляется путем установления связей между таблицами. Будущее этого направления представляют объектно-ориентированные базы данных. В объектно-ориентированных БД данные с различными отношениями рассматриваются как единый объект. Поэтому разработчик может не беспокоиться о связывании и разделении данных. В настоящее время БД этого типа распространены сравнительно мало. В Microsoft Access используется реляционная модель данных.

1.2. Основные определения.

Как уже говорилось выше, реляционная база данных состоит из множества таблиц. В этих таблицах столбцы называются полями или атрибутами, а строки - записями или кортежами. Поля образуют структуру базы данных, а записи составляют информацию, которая в ней содержится

Непременным правилом создания таблицы в СУБД является строгое определение содержимого самой таблицы. В ее ячейках может храниться только фактическая, и только неизменяемая информация - в ячейках базовых таблиц принципиально не может быть вычисляемых значений.

Создание базы данных всегда начинается с разработки структуры ее таблиц. Структура должна быть такой, чтобы при работе с базой требовалось вводить в нее как можно меньше данных. Если ввод каких-то данных приходится повторять неоднократно, базу делают из нескольких связанных таблиц. Структуру каждой таблицы разрабатывают отдельно. Если данные в разных записях начинают повторяться, это может говорить о том, что база имеет плохую структуру.

Для того чтобы связи между таблицами работали надежно, и по записи из одной таблицы можно было однозначно найти записи в другой таблице, надо предусмотреть в таблице уникальные поля.

Уникальное поле - это поле, значения в котором не могут повторяться. Если ни одно поле таблицы не приемлемо в качестве уникального, его можно создать искусственно. Кроме этого, существует понятие ключевого поля. При создании структуры таблиц одно поле (или одну комбинацию полей) можно назначить ключевым. С ключевыми полями СУБД работает особо. Она проверяет их уникальность и быстрее выполняет сортировку по таким полям. Ключевое поле - очевидный кандидат для создания связей. Иногда ключевое поле называют первичным ключом.

В реляционных базах данных важную роль играет еще один ключ - внешний ключ. Внешний ключ - это поле одной таблицы, которое ссылается на первичный ключ другой таблицы.

В качестве первичного ключа в таблицах часто используют поле, имеющее тип "Счетчик". Ввести два одинаковых значения в такое поле нельзя по определению, поскольку приращение значения поля производится автоматически. Структура связей между таблицами называется схемой данных.

Во многих случаях первичного ключа оказывается недостаточно для индексации содержимого таблицы, особенно в случаях больших таблиц со множеством полей почти наверняка в процессе работы придется отбирать из них данные и по другим критериям, отличным от простого номера строки в таблице. Таким образом, в определенных случаях возникает потребность в создании так называемых индексов или вторичных ключей. Индекс - это средство автоматической сортировки записей в таблице по значению индексируемого поля. Существует два вида индексов: допускающие и не допускающие повторение значений поля. Почти так же, как и по одному полю, индекс можно составить по двум и более полям. Применение индексов значительно ускоряет просмотр и выборку данных. Недостатки индексов - каждый из них занимает дополнительное место на жестком диске, а также в оперативной памяти. Кроме этого, увеличивается время добавления или удаления записи (особенно если в таблице содержится большое количество записей), поскольку индексы приходится создавать заново. Хотя эффект снижения быстродействия здесь не так важен, как эффект ускорения операций поиска и сортировки, все же следует следить за тем, чтобы не индексировать в таблице слишком много полей.

Назад Оглавление Вперед