Главная страница
Навигация по странице:

ОтветыБД. 1 Определение информационной системы, способы структурирования информации. Определения база данных, субд, транзакция, согласованность данных. История развития субд. Функции и назначение субд. Технологии доступа к данным


Скачать 0.54 Mb.
Название 1 Определение информационной системы, способы структурирования информации. Определения база данных, субд, транзакция, согласованность данных. История развития субд. Функции и назначение субд. Технологии доступа к данным
Анкор ОтветыБД.doc
Дата 02.05.2017
Размер 0.54 Mb.
Формат файла doc
Имя файла ОтветыБД.doc
Тип Документы
#6064
страница 1 из 6
  1   2   3   4   5   6

1.1. Определение информационной системы, способы структурирования информации. Определения: база данных, СУБД, транзакция, согласованность данных. История развития СУБД. Функции и назначение СУБД. Технологии доступа к данным.
Информационная система (ИС) взаимосвязанная совокупность средств, методов и персонала, используемая для хранения, обработки и представления информации.

К функциям ИС относятся: ●хранение информации; ●ввод и редактирование информации; ●просмотр и поиск информации; ●выборка информации по заданным критериям; ●подготовка отчётов; ●контроль правильности информации

Структурирование информации – введение каких-либо соглашений о способах представления данных.

Первоначально проблема структурирования информации решалась путём построения файловой системы, каждый элемент которой являлся ответственным за хранение определённого вида информации. Однако файловые системы обеспечивают хранение слабо структурированной информации, оставляя дальнейшую структуризацию прикладным программам

Конечному пользователю не нужно знать:

  • о физическом размещении в памяти данных и их описаний

  • об особенностях реализации механизмов поиска запрашиваемых данных

  • о способах разрешения конфликтов, возникающих при одновременном запросе одних и тех же данных многими пользователями

  • Об организации защиты данных от некорректных обновлений или несанкционированного доступа

  • о механизмах поддержания баз данных в актуальном состоянии.


Определения:

База данных - это совокупность сведений о конкретных объектах реального мира в какой-либо предметной области.

Система управления базами данных (СУБД) – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации. Если же модификация данных в этих файлах – то это СУБД

Транзакция – последовательность операций над БД, рассматриваемых СУБД как единое целое.

Согласованность данных (ссылочная целостность):

Связи между данными, хранимыми в разных отношениях, в реляционной БД устанавливаются с помощью использования внешних ключей — для установления связи между кортежем из отношения A с определённым кортежем отношения B в предусмотренные для этого атрибуты кортежа отношения A записывается значение первичного ключа (а в общем случае значение потенциального ключа) целевого кортежа отношения B. Таким образом, всегда имеется возможность выполнить две операции:

1) определить, с каким кортежем в отношении B связан определённый кортеж отношения A;

2) найти все кортежи отношения A, имеющие связи с определённым кортежем отношения B.

Благодаря наличию связей в реляционной БД можно хранить без избыточного дублирования, т.е. в нормализованном виде. 

Ссылочная целостность может быть проиллюстрирована следующим образом: Дана пара отношений A и B, связанных внешним ключом. Первичный ключ отношения B — атрибут B.key. Внешний ключ отношения A, ссылающийся на B — атрибут A.b. Ссылочная целостность для пары отношений A и B имеет место тогда, когда выполняется условие: для каждого кортежа отношения A существует соответствующий кортеж отношения B, то есть кортеж, у которого (B.key = A.b).

База данных обладает свойством ссылочной целостности, когда для любой пары связанных внешним ключом отношений в ней условие ссылочной целостности выполняется.

Если вышеприведённое условие не выполняется, говорят, что в базе данных нарушена ссылочная целостность. Такая БД не может нормально эксплуатироваться, так как в ней разорваны логические связи между зависимыми друг от друга фактами. Непосредственным результатом нарушения ссылочной целостности становится то, что корректным запросом не всегда удаётся получить корректный результат.

История развития СУБД

Предшественниками СУБД были файловые системы (ФС), однако появление СУБД не привело их к полному исчезновению. В середине 60 годов в корпорации IBM совместно с фирмой NAA разработали первую СУБД – иерархическую систему IMS, она является самой первой из коммерческих СУБД. Она и до сих пор остается основной иерархической СУБД используемой на большинстве мейнфреймов. Другим заметным достижение середины 60 г. Было появление системы IDS. Развитие этой системы привело к созданию нового типа систем управления БД – сетевых СУБД. Сетевая схема – это логическая организация всех баз данных, которая включает в себя: определение имени БД, типа каждой записи и компонентов каждого типа. Подсхема – это часть БД, видимая конкретными пользователями или приложениями. Язык управления данными – инструмент для определения характеристик и структуры данных, а также для управления ими. 

Группа DBSG – предложила стандартизировать три различных языка: 1)язык определения данных DDL, который позволит АБД описать её; 2)язык определения данных для подсхемы который позволит определять в приложениях те части БД, доступ к которым будет необходим; 3)язык манипулирования данными DML, предназначенный для управления данными. 
CODASYL – СУБД первого поколения.

 Недостатки:
1. Даже для выполнения простых запросов с использованием переходов и доступом к определенным записям необходимо создавать сложные программы.

2. Независимость от данных существует лишь в min степени.

3. Отсутствуют теоретические основы.

В 1970 г. Э.Ф. Кодд работавший в корпорации IBM опубликовал статью о реляционный модели данных, позволяющих устранить недостатки прежних моделей.

Проект System R – первый коммерческий проект. На основе этого проекта были получены важнейшие результаты.
• Был разработан структурированный язык запросов (SQL) который стал стандартный языком любых реляционных СУБД.
• В 80 г. Были созданы различный коммерческие реляционные СУБД. SQL/DS компании IBM. Корпорация Oracle. 

Назначение СУБД: 1)должна воспринимать и обрабатывать команды пользователей и приложений на выборку, изменение, добавление или удаление данных из баз данных.

2)должна иметь возможность принимать данные в исходной форме из различных по своей природе источников и преобразовывать их в форму, соответствующую собственным объектам.

3)должна иметь функции по обеспечению безопасности, целостности, а в случае повреждения и по восстановлению хранящейся в базе данных информации.

4)желательно, чтобы в СУБД были реализованы механизмы оптимизации выполнения перечисленных выше операций.

Функции СУБД:

1)Непосредственное управление данными во внешней памяти.

2)Управление буферами оперативной памяти (собственный набор буферов и протоколов буферизации данных)

3)Управление транзакциями

4)Журнализация (способность восстановить последнее согласованное состояние БД после любого аппаратного или программного сбоя)

5)Поддержка языков баз данных





Технологии доступа к БД:

Централизованная БД хранится в памяти одной вычислительной системы. При этом база данных располагается на одном компьютере. Если для этого компьютера установлена поддержка сети, то множество пользователей с клиентских компьютеров могут одновременно обращаться к информации, хранящейся в центральной базе данных. В локальных сетях чаще всего используется именно такой способ обработки данных.

Распределённая БД состоит из нескольких серверов, хранимых в различных ЭВМ, связанных сетями между собой. В таких БД может храниться пересекающаяся или дублирующаяся информация. Для работы с такой базой данных используется система управления распределёнными базами данных (СУРБД).

Файловый сервер – на одном из компьютеров располагается банк данных – файлы, которые могут совместно обрабатывать несколько различных СУБД пользователей. После обработки на компьютерах клиентов, файлы копируются обратно на сервер.

Технология «клиент-сервер»подразумевает, что помимо хранения базы данных центральный компьютер (сервер базы данных) должен ещё и обеспечивать выполнение основного объёма обработки этих данных. Запрос клиента (программы-клиента) на выполнение какой-либо операции с данными провоцирует на сервере поиск и извлечение данных. Клиентская часть (Front-End) обеспечивает графический интерфейс и находится на компьютере пользователя; серверная часть (Back-End) обеспечивает управление данными, разделение информации, администрирование и безопасность. Примерами являются MS SQL Server, Oracle , IBM DB 2, SyBase .
1.2. Этапы проектирования баз данных. Инфологическая, концептуальная, даталогическая, физическая модели. ER-модели, термины инфологического моделирования. Виды связей между сущностями. Модели данных: иерархическая, сетевая, реляционная, объектно-ориентированная.
Этапы проектирования:

1)Системный анализ и словесное описание информационных объектов предметной области и связей между ними. Как результат формулируется ТЗ на разработку базы данных.

2)Проектирование инфологической модели предметной области в терминах некоторой семантической модели.

3)Выбор конкретной СУБД и даталогическое или логическое проектирование БД. Декомпозиция отношений.

4)Физическое проектирование БД, то есть выбор эффективного размещения БД на внешних носителях и способа доступа к ней.

Инфологическая (внешняя) модель данных – обобщённое, не привязанное к к-л ЭВМ или СУБД описание предметн области.

Концептуальная модель способ логического упорядочения данных.

Даталогическая (внутренняя) описание данных на языке конкретной СУБД.

Физическая модель – описание расположения хранимых данных и методов доступа к ним.

  1. Цель инфологического моделирования (ИМ) – обеспечение наиболее естественных для человека способов сбора и представления той информации, которую предполагается хранить в создаваемой базе данных. Инфологическое моделирование прежде всего связано с попыткой представления семаники предметной области в модели БД.

  2. Основным инструментом разработки инфологических моделей (прежде всего для реляционных баз данных) в настоящий момент являются диаграммы «сущность-связь» (Entity-Relationship). Предложен этот способ моделирования в 1976 г. Питером Пин-Шэн Ченом. В настоящее время используются различные нотации этой модели. Мы будем рассматривать ER-диаграммы в нотации Баркера.

  3. Конструктивные элементы инфологического моделирования:

  4. Сущность (Entity) – объект либо совокупность объектов, имеющих существенное значение для рассматриваемой предметной области, информация о которых подлежит хранению. Сущность имеет имя, уникальное в пределах моделируемой системы. С помощью сущности описывается класс однотипных объектов, т.е. предполагается, что в системе существует множество экземпляров данной сущности. Экземпляры сущности должны иметь некоторые уникальные признаки, позволяющие отличать их друг от друга.

  5. Сущность на диаграммах изображается в виде прямоугольника с наименованием.

  6. Атрибут сущности – этот некоторая характеристика экземпляра сущности, определяющая свойства данного представителя класса. При этом набор атрибутов должен быть таким, чтобы можно было различать конкретные экземпляры сущности. Например, атрибутами сущности «книги» могут являться «название», «количество страниц», «издательство», «цвет обложки».

  7. Атрибуты записываются внутри прямоугольника-сущности, по одному на строку.

  8. Ключ сущности – неизбыточный набор атрибутов, значения которых в совокупности являются уникальными для каждого экземпляра сущности. Неизбыточность заключается в том, что удаление любого атрибута из ключа должно приводить к нарушению его уникальности. Либо так: ключевым называют набор атрибутов, однозначно идентифицирующий конкретный экземпляр сущности.

  9. Атрибуты, входящие в ключ на диаграмме, выделяются подчёркиванием.

  10. Между сущностями могут быть установлены связи (relationship) – бинарные ассоциации, показывающие, каким образом сущности соотносятся или взаимодействуют между собой. Связь может существовать между двумя разными сущностями или между сущностью и ею же самой (рекурсивная связь). Связи всегда именуются.

  11. Связи делятся на три типа по множественности:

  12. - один-к-одному (1:1) – экземпляр одной сущности связан только с одним экземпляром другой сущности;

  13. - один-ко-многим (1:М) – один экземпляр сущности может быть связан с несколькими экземплярами другой сущности;

  14. - многие-ко-многим (М:М) – один экземпляр первой сущности связан с несколькими экземплярами второй сущности, и наоборот, один экземпляр второй сущности связан с несколькими экземплярами первой сущности. Пример – верхняя связь на рисунке: студенты слушают лекции многих преподавателей, и преподаватели читают лекции многим студентам. Следует отметить, что тип «многие ко многим» является временным типом связи, допустимым на ранних этапах разработки инфологической модели. В дальнейшем она заменяется на две связи (1:М) путём создания промежуточной сущности. В нашем случае это может быть сущность «расписание лекций».

  15. Другой пример – сущность «авторы» и сущность «книги». Некоторые книги написаны несколькими авторами, а некоторые авторы написали более одной книги. Для разрешения связи (М:М) необходима дополнительная сущность «титульная страница», содержащая в числе прочих атрибуты «название книги» и «фамилия автора».



  16. Связи также делятся на два типа по модальности: «обязательная» и «возможная». Связь является обязательной, если в ней должен участвовать каждый экземпляр сущности; возможной – если не каждый экземпляр сущности должен участвовать в связи. При этом связь может быть обязательной со стороны одной сущности и возможной со стороны другой. Пример – нижняя связь на рисунке: студент, пишущий диплом, всегда имеет научного руководителя, а преподаватель может иметь одного или несколько дипломников, или вовсе их не иметь.

    1. Модели доступа к данным.

Помимо разделения баз данных по методам обработки, можно классифицировать их по используемой модели (или структуре) данных. С помощью модели данных можно наглядно представить структуру объектов и установленные между ними связи. Модель данных непосредственно определяет наименование СУБД.

Иерархическая модель. БД состоит из упорядоченного набора древовидных структур данных. Организационные структуры, списки материалов, оглавления в книгах, планы проектов и многие другие совокупности данных могут быть представлены в иерархическом виде. При этом автоматически поддерживается целостность ссылок между предками и потомками. Основное правило: никакой потомок не может существовать без своего родителя, причём потомок имеет единственного родителя. Недостатком модели является сложность реорганизации данных и невозможность выполнения «горизонтальных» запросов к данным, не связанных с иерархической структурой.

Иерархическая модель появилась первой среди всех даталогических моделей: именно эту модель поддерживала первая из зарегистрированных промышленных СУБД IMS IBM (1968г). Каждая физическая база описывается набором операторов, определяющих как её логическую структуру, так и структуру хранения баз данных.

Основные термины:

1)Атрибут (элемент данных) – наименованная единица структуры данных. Каждому элементу при описании БД присваивается уникальное имя. Элемент данных часто называют полем.

2)Запись (группа) – именованная совокупность атрибутов. Использование записей позволяет за одно обращение к базе получить некоторую логическую связанную совокупность данных. Именно записи изменяются, добавляются и удаляются. Тип записи определяется составом ее атрибутов. Экземпляр записи – конкретная запись с конкретным значением элементов.

3)Групповое отношение – иерархическое отношение между записями двух типов. Родительская запись (владелец группового отношения) называется исходной записью, а дочерние записи (члены группового отношения) – подчиненными. Иерархическая БД может хранить только такие древовидные структуры.

Сетевая модель. Является расширением иерархической модели. Здесь каждый порождённый элемент (потомок) может иметь более одного порождающего элемента (предка). Сетевая БД может представлять непосредственно все виды связей, присущих данным. По этим данным можно перемещаться, исследовать и запрашивать их всевозможными способами. Однако любой запрос к сетевой БД предполагает выработку собственного механизма навигации по этой базе. При этом автоматически целостность данных СУБД не поддерживается.

Основное отличие:

запись может быть членом более чем одного группового отношения; каждое групповое отношение именуется и проводится различие между его типом и экземпляром; тип группового отношения задается его именем и определяет свойства общие для всех экземпляров данного типа; экземпляр группового отношения представляется записью-владельцем и множеством (возможно пустым) подчиненных записей. При этом имеется следующее ограничение: экземпляр записи не может быть членом 2 экземпляров групповых отношений одного типа.

Характерист. признаки экземпляра группового отношения:

Способ упорядочения произвольных записей:

произвольный, хронологический (очередь),

обратный хронологический (стек), сортированный.

Если запись объявлена подчиненной в нескольких групповых отношениях, то в каждом из них может быть назначен свой способ упорядочивания.

Режим включения подчиненных записей:

автоматический (невозможно занести в БД запись без того, чтобы она была сразу же закреплена за неким владельцем);

ручной (позволяет запомнить в БД подчиненную запись и не включать ее немедленно в экземпляр группового отношения; позже эта операция инициируется пользователем).

Режим исключения. Выделяют 3 класса членства подчиненных записей в групповых отношениях:

фиксированное (подчиненная запись жестко связана с записью владельца и ее можно исключить из группового отношения только удалив);

обязательное (допускается переключение подчиненной записи на др. владельца, невозможно ее существование без владельца);

необязательное (можно искл. запись из группового отношения, но сохранить в БД не прикрепляя к др. владельцу).
  1   2   3   4   5   6
написать администратору сайта