Міністерство охорони здоровя України
львівський Національний медичний університет
Імені данила галицького
« Затверджено »
на методичній нараді
кафедри медичної інформатики .
Завідувач кафедри
________________________
«___»_____________ 2011 р.
Методичні рекомендації
для самостійної роботи студентів
при підготовці до практичного заняття
Навчальна дисципліна
|
Медична інформатика
|
Модуль №1
|
Основи інформаційних технологій в системі охорони здоров’я. Обробка та аналіз медико-біологічних даних
|
Змістовий модуль №2
|
Медичні дані. Методологія обробки та аналізу інформації
|
Тема заняття 4:
|
Кодування та класифікація.
|
Курс:
|
ІІ
|
Факультет:
|
Медичний, стоматологічний
|
Львів - 2011
Актуальність теми.
Використання систем класифікації та кодування — необхідний елемент автоматизованої обробки даних. Класифікація є одним із засобів вивчення природи досліджуваних об’єктів шляхом їх упорядкування і систематизації. Система правил, відповідно до якої здійснюється розбиття множини об’єктів, що вивчаються, на підмножину за значенням тих чи інших характеристик і ознак, та результати, одержувані при їх використанні, називається системою класифікації, а процес ранжування об’єктів за цією системою — класифікуванням.
Багато даних в охороні здоров'я, наприклад, діагнози, історії хвороб, дані медичного огляду, або результати флюорографії, представлені текстом. Це призводить до нескінченного списку можливих висновків. Однак, статистичні перегляди і системи прийняття рішень можуть обробити тільки скінчену кількість таких класів. Правила призначення висновків повинні бути визначені об'єктивними критеріями. Призначення такого висновку для певного класу завжди передбачає зменшення (тобто, втрату інформації) даних, але це – не обов'язково недолік.
Необхідний рівень деталізації і структура системи класифікації залежить від мети, для якої система класифікації розроблена. Класифікація діагнозів для оздоровчої статистики, можливо, потребує категорій, крім класифікацій, і для планування догляду за пацієнтами в лікарні. З іншого боку, має бути можливим представлення всіх допустимих медичних висновків, без зменшення даних.
Багато даних стає доступними в комп'ютерних записах (computer-based patient records – CPRs), стає можливим використання цих даних для інших цілей, крім традиційно можливої архівації і повідомлення. Системи для прийняття рішень, можуть підтримати в прийнятті рішень, основаних на даних CPR. Наприклад, при приписуванні ліків, можна запустити систему підтримки прийняття рішень, яка перевіряє протипоказання або взаємодію з іншими ліками. Така система зможе діяти належним чином, лише у випадку, якщо всі хвороби і симптоми хворого записані стандартизовано і послідовно.
Конкретні цілі заняття
зрозуміти основні принципи класифікації та кодування
ознайомитися з системами класифікації в медицині та особливостями кодування медично-біологічної інформації
вміти класифікувати біомедичну інформацію
-
Базовий рівень підготовки
Назви попередніх дисциплін
|
Отримані навики
|
Елективний курс «Європейський стандарт комп’ютерної грамотності»
|
Володіти навичками роботи з основними складовими програмного забезпечення комп’ютера; запускати на виконання програми і коректно завершувати їх роботу
|
Перелік основних термінів:
Об’єкт (від лат. objectus — предмет) – одиниця даних або один елемент предметної галузі, яка досліджується.
Класифікація – система розподілу об’єктів за класами (групами) відповідно до певних ознак.
Глибина класифікації – кількість рівнів поділу множини об’єктів у ієрархічній класифікації.
Фасет – множина значень, які мають спільну класифікаційну ознаку у фасетній кваліфікації.
Фокус – один елемент фасета.
Дескриптор — це нормалізоване ключове слово або словосполучення.
Тезауруси — це систематизовані списки об’єктів, їх ознак (властивостей) з ключовими словами.
Кодування – процес створення і присвоєння певного умовного позначення (коду) класифікаційному угрупованню і (або) об’єкту класифікації з метою забезпечення зручного та ефективного опрацювання інформації.
Числовий код – формується із цифр.
Мнемонічній код – формується з одного або кількох символів класу.
Послідовні (або ієрархічні) коди формуються, розширюючи існуючий код на один або більшу кількість додаткових символів для кожного додаткового рівня деталізації.
Паралельні коди (або коди зіставлення) – це зіставлені коди, які складаються із частин (сегментів).
Реєстраційне кодування - коди присвоюються послідовно, не потребуючи попередньої класифікації об’єктів.
Системи класифікації в медицині використовується для перетворення словесного формулювання діагнозів хвороб та інших проблем, пов’язаних зі здоров’ям, в цифрові або алфавітно-числові коди, які забезпечують зручність зберігання, пошук та аналіз даних.
Нозологія це наука класифікації хвороб.
Нозографія – це наука про опис хвороб.
МКХ-10 (ICD-10) – Міжнародна статистична класифікація хвороб та проблем, пов'язаних зі здоров'ям (International Statistical Classification of Diseases and Related Health Problems).
ICPC - Міжнародна класифікація первинної допомоги (International Classification for Primary Care).
Система SNOMED – Систематизований облік людської і ветеринарної медицини (Systematized Nomenclature of Human and Veterinary Medicine).
SNOMED СТ - Систематизирована медична номенклатура - Клінічні терміни (SNOMED Clinical Terms)
RCC - Система клінічних кодів Ріда (Read Clinical Codes)
DSM – Діагностичні та статистичні довідники для душевних розладів (Diagnostic and Statistical Manual of mental disorders).
АТХ (АТС) - Анатомо-терапевтична хімічна класифікація (Anatomical Therapeutic Chemical Classification )
Теоретичний матеріал.
1. Класифікація. Основні класифікаційні системи
Класифікація є одним з найважливіших етапів проектування інформаційного забезпечення систем автоматизації; вона також забезпечує основу аналізу і моделювання інформаційних потоків.
Класифікація – система розподілу об’єктів за класами (групами) відповідно до певних ознак.
Сукупність методів і правил класифікації, її результат формують систему класифікації.
Система класифікації згруповує об’єкти та виділяє певні класи, які характеризуються деякими однорідними властивостями. Стосовно до інформації, як об’єкту класифікації, визначені класи (групи) називаються інформаційними об’єктами. Властивості інформаційного об’єкту визначаються інформаційними параметрами, які називаються реквізитами.
Щоб класифікувати об’єкти будь-якої природи, необхідно визначити набір класифікаційних ознак, що визначають підставу розподілу об’єктів. Наприклад, як класифікаційну ознаку при визначенні дозування лікарських препаратів можна вибрати вік пацієнта, яка складається з таких значень: до 5 років, 6-12 років, після 12 років.
Будь-яка класифікація інформації повинна відповідати таким основним вимогам:
забезпечення повноти охоплення об’єктів множини, що вивчається;
неперетинання груп об’єктів, що виділяються;
можливість включення нових груп об’єктів;
лаконічність, чіткість і зрозумілість класифікаційних ознак;
незмінність прийнятої класифікаційної ознаки на всіх рівнях класифікації.
До основних систем класифікації інформації належать ієрархічна, фасетна і змішана.
1.1. Ієрархічна система класифікації
Ієрархічна система класифікації — це система, у якій поділ множини об’єктів на підмножини виконується послідовно згідно із заданими ознаками. Враховуючи жорстку процедуру побудови такої структури класифікації, потрібно насамперед встановити мету її створення, тобто чітко визначити властивості об’єктів, що об’єднуються у відповідні класи. Ці властивості приймаються у подальшому як ознаки класифікації.
Первинна множина об’єктів утворює нульовий рівень. Розділивши її на підмножини, залежно від обраної класифікаційної ознаки, отримаємо класи, які утворюють перший рівень. Далі кожна з підмножин поділяється на групи (підкласи) відповідно до власної класифікаційної ознаки. Складені таким чином підмножини утворюють другий рівень ієрархічної структури. Кожен клас другого рівня аналогічно поділяється на групи, що утворюють третій рівень і т. д.
Між виділеними групами об’єктів встановлюється певна ієрархія. При цьому кожен підклас належить лише одному вищому класу. Для подальшої класифікації в кожному новому класі необхідно задати власні класифікаційні ознаки та їх значення (Рис.1).
Р
ис.1. Приклад ієрархічної система класифікації
В ієрархічній системі класифікації кожен об’єкт на будь-якому рівні повинен бути віднесеним до одного класу, який характеризується конкретним значенням обраної класифікаційної ознаки.
Кількість рівнів класифікації, що відповідає обраній кількості ознак називається глибиною класифікації.
Ієрархічній системі класифікації притаманні простота, наочність, логічність побудови, використання незалежних класифікаційних ознак в різних гілках ієрархічної системи, добра пристосованість до ручного оброблення. Вадами такої системи є жорсткість структури через фіксованість ознак і порядку їх розміщення, складність включення нових ознак, необхідність великого резерву місткості, а також неможливість класифікації об’єктів у випадку заздалегідь непередбачених сполучень ознак.
1.2. Фасетна система класифікації
Фасетна система класифікації полягає в паралельному поділі множини об’єктів на незалежні підмножини (класифікаційні угрупування) — незалежні фасети (facet – рамка). Кожний фасет містить сукупність однорідних значень цієї класифікаційної ознаки. Наприклад, множина термінів, що позначають хвороби нервової системи, утворюють фасет “Хвороби нервової системи”, множина термінів, що позначають різні методи лікування, утворюють фасет “Методи лікування”. Значення ознаки у фасеті розташовується в довільному порядку. Кожна ознака фасета називається фокусом.
Процедура класифікації полягає у присвоєнні кожному об’єкту відповідних значень фасету. При цьому можуть використовуватись не всі фасети. Часто замість фокусів використовуються їх коди. Кожен об’єкт задається у вигляді структурної формули
Оj=(Ф12, Ф21, ... Фni), де Фni – і-й фокус n-го фасету,
При побудові фасетної системи класифікації необхідно, щоб значення, які використовуються в різних фасетах, не повторялись.
Розглянемо приклад класифікації вати медичної гігроскопічної
Ф1 Тип
|
Ф2 Стерильність
|
Ф3 Фасування
|
Ф4 Виробник
|
Ф5 Матеріал упаковки
|
Ф11 гігієнічна
|
Ф21 нестерильна
|
Ф31 25г
|
Ф41 Ватфарм
|
Ф51 ламінований папір.
|
Ф12 хірургічна
|
Ф22 стерильна
|
Ф32 50 г
|
Ф42 Леон-фарм
|
Ф52 поліпропілен.
|
Ф13 офтальмологічна
|
|
Ф33 100 г
|
Ф43 Аріадна
|
Ф53 поліетилен
|
Тоді Ф1, Ф2, Ф3 – фасети, Ф11, Ф12, Ф23 – фокуси.
Кожен об’єкт даної структури може бути віднесений до певного класу, наприклад:
О = Ф12Ф22Ф31Ф43Ф52 означає, що це вата хірургічна, стерильна, фасована по 25г в поліпропіленовій упаковці, виготовлена підприємством «Аріадна».
Перевагами фасетної системи класифікації є можливість використання великої кількості ознак та їх значень для створення відповідних класів інформаційних об’єктів, а також можливість модифікації всієї системи без зміни структури вже існуючих елементів.
До недоліків такої системи можна віднести складність її побудови, пов’язана з необхідністю врахування великої кількості класифікаційних ознак, нетрадиційність і складність її використання в разі ручного оброблення даних, недостатньо повне використання місткості з огляду на те, що багато можливих комбінацій фасет не мають практичного застосування.
1.3. Дескрипторна система класифікації
Дескрипторна система класифікації ґрунтується на застосуванні координарного методу інформування, який передбачає, що зміст документів або показників можна досить повно й точно відобразити за допомогою списку або переліку ключових слів.
Процедура класифікації полягає у відборі ключових слів або словосполучень, що описують певну предметну галузь або сукупність однорідних об’єктів. Серед ключових слів можуть знаходитися синоніми. На наступному кроці обрані ключові слова і словосполучення підлягають нормалізації, коли з сукупності синонімів обирається один або декілька, які зустрічаються найчастіше. Дескриптор — це нормалізоване ключове слово або словосполучення. Дескриптори об’єднуються в словники або тезауруси. Тезауруси — це систематизовані списки об’єктів, їх ознак (властивостей) з ключовими словами.
Дескрипторна система класифікації широко використовується у бібліотечній системі пошуку. Дескриптори групуються в тематичні класи, позаяк одинаковий може одночасно входити в декілька класів. Крім того, дескриптори з їх поясненнями і синонімами, які не є дескрипторами об’єднуються в загальний алфавітний список. Слова, які не є дескрипторами, супроводжуються посиланнями на відповідний дескриптор. Кожному дескриптору ставиться у відповідність певний код, наприклад:
Лімфатична система
анатомія тварин Е66
анатомія людини Е863.6
фізіологія Е915
Кровоносна система див. Серцево-судинна система
2. Кодування
Системи кодування застосовуються для зміни назви об’єктів на певні умовні позначення (код) з метою забезпечення зручного та ефективного опрацювання інформації. Система кодування складається із сукупності знаків і правил для позначення відповідних інформаційних об’єктів.
Процедура присвоєння об’єкту кодового позначення називається кодуванням, а визначення назви об’єкту, що відповідає цьому коду називається декодуванням.
2.1. Способи кодування
Коди бувають числові та мнемонічні.
Числові коди можуть надаватися послідовно. Це означає, що кожен новий клас отримує наступне невикористане число. Перевага в тому, що можуть бути легко додані нові класи. Числові коди можуть надаватися й випадковим чином, щоб уникати наявності будь-якої конкретної інформації, прихованої у коді.
Мнемонічний код формується з одного або кількох символів класу. Це допомагає користувачам запам'ятовувати коди. Однак, для класифікацій з багатьма класами це може привести або до довгих кодів, або до кодів, не схожих з рубриками класу. Таким чином, мнемонічні коди в цілому використовуються для обмежених списків класів. Наприклад, лікарняні відділення часто позначаються мнемонічними кодами.
2.2. Види кодування
Класифікаційне кодування
Класифікаційне кодування проводиться після відповідної класифікації інформаційних об’єктів. Розрізняють послідовне та паралельне кодування.
Послідовні (або ієрархічні) коди формуються, розширюючи існуючий код на один або більшу кількість додаткових символів для кожного додаткового рівня деталізації. Послідовне кодування застосовують для ієрархічної системи класифікації. Послідовний код несе інформацію щодо рівня деталізації спорідненого класу і щодо ієрархічних зв’язків з його родовим (батьківським) класом. При цьому спочатку записується код старшої групи 1-го рівня, потім код групи 2-го рівня, потім код групи 3-го рівня і т.д.
Паралельне кодування застосовують для фасетної системи класифікації. Паралельні коди (або коди зіставлення) – це коди, що складаються із частин (сегментів). Кожен сегмент характеризує пов'язаний з ним клас (фасет). Всі фасети кодуються незалежно один від одного; для значень кожного фасета виділяється певна кількість розрядів коду.
Реєстраційне кодування
Реєстраційне кодування використовується для однозначної ідентифікації інформаційних об’єктів і не потребує попередньої класифікації об’єктів. Розрізняють порядкову і серійно-порядкову систему реєстраційного кодування.
Порядкова система полягає у послідовній нумерації об’єктів числами натурального ряду. Цей метод використовується у випадку невеликої кількості об’єктів, наприклад для кодування студентів у групі.
Серійно-порядкова система кодування передбачає попереднє упорядкування груп, що складають певну серію, а потім у кожній серії проводиться порядкова нумерація об’єктів. Кожна серія має свою порядкову нумерацію. Наприклад, всі студенти залежно від факультету розділяються на різні групи (серії). Всередині кожної групи відбувається упорядкування прізвищ за алфавітом і кожен студент отримує відповідний номер.
3. Системи класифікації в медицині
У традиційній історії хвороби доступні дані в письмовій формі, здебільшого як вільний текст, але іноді також як числові дані (наприклад лабораторні результати аналізів). Історія хвороби, насамперед, використовується безпосередньо для догляду за пацієнтом, для встановлення діагнозу, лікування, прогнозування і ведеться, в основному, рукописом, а інформація часто записується у формі довільного тексту. Відновлення історії хвороби іншим лікарем перешкоджає встановленню реальних фактів, тому що багато медичних термінів можуть бути неточно вказаними або навіть неоднозначно трактуватися. Тому виникає потреба, щоб всі хвороби і симптоми хворого були записані стандартно і послідовно.
Системи класифікації в медицині використовується для перетворення словесного формулювання діагнозів хвороб та інших проблем, пов’язаних зі здоров’ям, в цифрові або алфавітно-числові коди, які забезпечують зручність зберігання, пошук та аналіз даних.
Метою класифікації є створення умов для систематизованої реєстрації, аналізу, інтерпретації і порівняння даних про смертність і захворюваність, одержаних в різних країнах і регіонах і в різний час.
Нозологія визначається як наука класифікації хвороб. Нозологічні дослідження зазвичай включають у вивчення симптомів, синдромів, порушень і ушкоджень, а також самої хвороби. Тому нозологію також трактують як науку класифікації діагностичних умов, тобто, систематику діагностичних умов.
На відміну від нозології, нозографія – це наука про опис хвороб. Різниця між визначенням і описом хвороби полягає в тому, що визначення хвороби дає тільки істотні характеристики хвороби, тоді як опис включає випадкові характеристики, тобто характеристики, що емпірично співвідносяться із сутністю хвороби.
Класифікації хвороб складаються із системи рубрик, в яких конкретні нозологічні одиниці включені у відповідності з прийнятими критеріями.
|