Проектування баз даних
4


яких моделюється за допомо­гою БД і використовується для розв'язання різних функціональних задач.

Існує багато різних визначень баз даних. Деякі з них зазначають, що форма подання даних у вигляді бази дає змогу виключити можливість дуб­лювання даних. Насправді ж повністю виключити дублювання даних у базі даних неможливо. Елементи ненадлишкового дублювання є в кожній базі даних і призначені для встановлення зв'язку між окремими файлами, а та­кож для прискорення пошуку під час роботи з даними. Наявність елементів дублювання, можливо, пов'язана як з особливостями моделі подання даних, так і з технологічними цілями, а саме із забезпеченням більш надійного за­хисту чи зменшенням тривалості реакції системи. Але в будь-якому разі елементи дублювання повинні бути відомі адміністраторові бази даних, який повинен мати змогу управляти ними.

БД являє собою інтегроване сховище даних, яке використовується ба­гатьма споживачами і забезпечує незалежність даних від прикладних прог­рам. Зв'язок кінцевих користувачів і прикладних програм з БД відбувається через СУБД, яка виступає інтерфейсом між користувачем і базою даних (рис. 1.1). Користувачами БД можуть бути окремі фізичні особи чи прикла­дні програми.

Рис. 1.1. Схема взаємодії користувачів і прикладних програм з БД

Усі дані, які зберігаються в БД, поділяються на фонд і архів даних, що пов'язано з відмінністю в технологічних режимах використання даних.

Фонд даних — це активні дані, з якими постійно працюють прикладні програми та користувачі, які зберігаються на вінчестері й перебувають без­посередньо під управлінням СУБД.

Архіви — це архівні копії файлів БД, які зберігаються на стримері, і гнучких магнітних дисках, сідеромі чи на вінчестері іншої ЕОМ.

В архівах зберігаються неактивні дані, що вже відпрацювали, але їх необхідно зберігати згідно з нормативними та законодавчими актами до­сить тривало. Прикладом може бути банківська та деякі види облікової інформації, яка згідно із законодавчими актами має зберігатися кілька років. В архівах також зберігаються страхові копії файлів БД, які викорис­товуються для відновлення БД в разі її руйнування при різних збоях.

Особливістю БД і її відмінною рисою є те, що дані та їх опис зберігаються разом. Раніше у файлових системах опис даних зберігався в прикладних програмах. Прикладна програма мала вміщувати повний опис файлів, які вона оброблює, незалежно від кількості полів з того чи іншого файла, що оброблюються в програмі. Використання БД потребує опису в програмі лише тих полів, які вона оброблює; таким чином досягається незалежність опису даних від прикладних програм. Тому опис даних, навіть якщо він зберігається разом із даними, називають метаданими. Іноді опис даних у літературі називається схемою, а та частина баз даних, що викорис­товується якоюсь прикладною програмою, — підсхемою.

У деяких сучасних системах до метаданих належать не лише описи са­мих даних, а й інформація про предметну область, користувачів системи, статистику її роботи та інші відомості. Для централізованого зберігання всієї метаінформації використовується словник даних (СД).

СД дуже важливий, особливо в умовах колективного використання да­них, оскільки він забезпечує розв'язання проблеми достовірності, надлишковості й контролю за раціональним зберіганням і використанням даних.

Словник даних повинен виконувати такі основні функції:

- встановлення зв'язків між користувачами БД;

- виконання простого та ефективного управління елементами даних при введенні в систему як нових елементів, так і при модифікації опису існуючих;

- зменшення надмірності даних;

- запобігання неузгодженості даних;

- централізоване управління даними з метою спрощення процесу проек­тування БД та її розширення.

Словник даних використовується кінцевими користувачами під час ро­боти із системою, прикладними програмістами — при написанні програм, системними програмістами— в процесі розширення системи.

Словник даних може вміщувати відомості про джерело інформації, фор­мати і взаємозв'язок між даними, відомості про частоту виникнення і харак­тер використання даних, терміни коригування і осіб, відповідальних за це, і т.д. Отже, він являє собою базу даних про дані як особливий вид ресурсу.

Одне з основних призначень СД є документування даних. Нагромад­ження, інформації про дані потрібно починати вже на ранніх стадіях проек­тування. Йому відводиться роль засобу централізованого ведення і упра­вління даними на всіх етапах проектування системи, а також забезпечення ефективної взаємодії між усіма користувачами при розподіленій БД. До СД можна занести інформацію про місце фізичного зберігання даних, а також відомості про обмеження секретного характеру, санкціонованості доступу та інші питання, пов'язані із захистом інформації.

Робота з СД спрощує процес підготовки документації програмістами, забезпечує користувачів інформацією про наявні в системі дані, дозволяє контролювати відповідність у назвах і форматах даних та їх кодах.

Усі питання, пов'язані з веденням СД, будемо розглядати в контексті СУБД і автоматизованою формою його ведення. Але, на жаль, не в усіх СУБД є цей засіб. Наприклад, широко відомі СУБД сім'ї dBASE не мають цього засобу. В такому разі потрібно вести СД вручну чи записувати відповідні програми ведення такого словника. Пакет програм ведення СД може інтегруватися з СУБД чи бути незалежним.