яких моделюється за допомогою БД і використовується для розв'язання різних функціональних задач.
Існує багато різних визначень баз даних. Деякі з них зазначають, що форма подання даних у вигляді бази дає змогу виключити можливість дублювання даних. Насправді ж повністю виключити дублювання даних у базі даних неможливо. Елементи ненадлишкового дублювання є в кожній базі даних і призначені для встановлення зв'язку між окремими файлами, а також для прискорення пошуку під час роботи з даними. Наявність елементів дублювання, можливо, пов'язана як з особливостями моделі подання даних, так і з технологічними цілями, а саме із забезпеченням більш надійного захисту чи зменшенням тривалості реакції системи. Але в будь-якому разі елементи дублювання повинні бути відомі адміністраторові бази даних, який повинен мати змогу управляти ними.
БД являє собою інтегроване сховище даних, яке використовується багатьма споживачами і забезпечує незалежність даних від прикладних програм. Зв'язок кінцевих користувачів і прикладних програм з БД відбувається через СУБД, яка виступає інтерфейсом між користувачем і базою даних (рис. 1.1). Користувачами БД можуть бути окремі фізичні особи чи прикладні програми.
Рис. 1.1. Схема взаємодії користувачів і прикладних програм з БД
Усі дані, які зберігаються в БД, поділяються на фонд і архів даних, що пов'язано з відмінністю в технологічних режимах використання даних.
Фонд даних — це активні дані, з якими постійно працюють прикладні програми та користувачі, які зберігаються на вінчестері й перебувають безпосередньо під управлінням СУБД.
Архіви — це архівні копії файлів БД, які зберігаються на стримері, і гнучких магнітних дисках, сідеромі чи на вінчестері іншої ЕОМ.
В архівах зберігаються неактивні дані, що вже відпрацювали, але їх необхідно зберігати згідно з нормативними та законодавчими актами досить тривало. Прикладом може бути банківська та деякі види облікової інформації, яка згідно із законодавчими актами має зберігатися кілька років. В архівах також зберігаються страхові копії файлів БД, які використовуються для відновлення БД в разі її руйнування при різних збоях.
Особливістю БД і її відмінною рисою є те, що дані та їх опис зберігаються разом. Раніше у файлових системах опис даних зберігався в прикладних програмах. Прикладна програма мала вміщувати повний опис файлів, які вона оброблює, незалежно від кількості полів з того чи іншого файла, що оброблюються в програмі. Використання БД потребує опису в програмі лише тих полів, які вона оброблює; таким чином досягається незалежність опису даних від прикладних програм. Тому опис даних, навіть якщо він зберігається разом із даними, називають метаданими. Іноді опис даних у літературі називається схемою, а та частина баз даних, що використовується якоюсь прикладною програмою, — підсхемою.
У деяких сучасних системах до метаданих належать не лише описи самих даних, а й інформація про предметну область, користувачів системи, статистику її роботи та інші відомості. Для централізованого зберігання всієї метаінформації використовується словник даних (СД).
СД дуже важливий, особливо в умовах колективного використання даних, оскільки він забезпечує розв'язання проблеми достовірності, надлишковості й контролю за раціональним зберіганням і використанням даних.
Словник даних повинен виконувати такі основні функції:
- встановлення зв'язків між користувачами БД;
- виконання простого та ефективного управління елементами даних при введенні в систему як нових елементів, так і при модифікації опису існуючих;
- зменшення надмірності даних;
- запобігання неузгодженості даних;
- централізоване управління даними з метою спрощення процесу проектування БД та її розширення.
Словник даних використовується кінцевими користувачами під час роботи із системою, прикладними програмістами — при написанні програм, системними програмістами— в процесі розширення системи.
Словник даних може вміщувати відомості про джерело інформації, формати і взаємозв'язок між даними, відомості про частоту виникнення і характер використання даних, терміни коригування і осіб, відповідальних за це, і т.д. Отже, він являє собою базу даних про дані як особливий вид ресурсу.
Одне з основних призначень СД є документування даних. Нагромадження, інформації про дані потрібно починати вже на ранніх стадіях проектування. Йому відводиться роль засобу централізованого ведення і управління даними на всіх етапах проектування системи, а також забезпечення ефективної взаємодії між усіма користувачами при розподіленій БД. До СД можна занести інформацію про місце фізичного зберігання даних, а також відомості про обмеження секретного характеру, санкціонованості доступу та інші питання, пов'язані із захистом інформації.
Робота з СД спрощує процес підготовки документації програмістами, забезпечує користувачів інформацією про наявні в системі дані, дозволяє контролювати відповідність у назвах і форматах даних та їх кодах.
Усі питання, пов'язані з веденням СД, будемо розглядати в контексті СУБД і автоматизованою формою його ведення. Але, на жаль, не в усіх СУБД є цей засіб. Наприклад, широко відомі СУБД сім'ї dBASE не мають цього засобу. В такому разі потрібно вести СД вручну чи записувати відповідні програми ведення такого словника. Пакет програм ведення СД може інтегруватися з СУБД чи бути незалежним.