Застосування методів аналізу даних і машинного навчання в медицині на основі ансамблевих моделей

ЦОКОЛЕНКО, Арсен Сергійович
Please use this identifier to cite or link to this item: https://er.chdtu.edu.ua/handle/ChSTU/6737
Title:	Застосування методів аналізу даних і машинного навчання в медицині на основі ансамблевих моделей
Authors:	Федоров, Євген Євгенович ЦОКОЛЕНКО, Арсен Сергійович
Keywords:	МАШИННЕ НАВЧАННЯ, НЕЙРОННІ МЕРЕЖІ, ЗАДАЧА КЛАСИФІКАЦІЇ, ШІ В СФЕРІ ОХОРОНИ ЗДОРОВ’Я, ВЕЛИКІ МОВНІ МОДЕЛІ, ПРОГРАМНИЙ ЗАСТОСУНОК, KNN, НАЇВНИЙ КЛАСИФІКАТОР БАЄСА, ТОЧНІСТЬ МОДЕЛІ;MACHINE LEARNING, NEURAL NETWORKS, CLASSIFICATION PROBLEM, AI IN HEALTHCARE, LARGE LANGUAGE MODELS, SOFTWARE APPLICATION, KNN, NAIVE BAYES CLASSIFIER, MODEL ACCURACY
Issue Date:	18-Dec-2025
Abstract:	Кваліфікаційна робота магістра присвячена застосуванню методів машинного навчання для автоматизованої діагностики захворювань на основі аналізу клінічних даних. Актуальність теми зумовлена активним розвитком інтелектуальних медичних систем і потребою у підвищенні точності та надійності підтримки лікарських рішень. Об’єктом дослідження є процеси аналізу медичних даних, а предметом — баєсівські та метричні моделі класифікації, а також оцінювання ефективності їх програмної реалізації. У роботі розроблено та порівняно моделі машинного навчання для діагностування захворювань, виконано їх програмну імплементацію та проведено оцінювання якості за стандартними метриками. Створене програмне забезпечення може використовуватися як інструмент підтримки прийняття рішень і зменшення кількості діагностичних помилок. Отримані результати апробовано на міжнародній науково-практичній студентській конференції та можуть бути основою для подальших досліджень і розробки інтелектуальних медичних систем. The master’s thesis is devoted to the application of machine learning methods for automated disease diagnosis based on the analysis of clinical data. The relevance of the study is driven by the rapid development of intelligent healthcare systems and the need to improve the accuracy and reliability of decision support tools. The object of the research is the analysis of medical data, while the subject includes Bayesian and metric-based classification models and the evaluation of their software implementation. The work develops and compares several machine learning models for disease classification, implements them in software, and evaluates their performance using standard metrics. The resulting application can be used as a clinical decision support tool to reduce diagnostic errors. The main results were presented at an international scientific and practical student conference and may serve as a basis for further research and development of intelligent medical systems.
URI:	https://er.chdtu.edu.ua/handle/ChSTU/6737
Appears in Collections:	112 Статистика (Аналіз даних (DATA SCIENCE) та комп'ютерна статистика)
Files in This Item:
File	Description	Size	Format
ЦОКОЛЕНКО А.С. Кваліфікаційна робота магістра.pdf Restricted Access		4.68 MB	Adobe PDF	View/Open Request a copy
Show full item record
Extracted text
 
 
 
2 
РЕФЕРАТ 
Кваліфікаційна робота магістра “Застосування методів аналізу даних і 
машинного навчання в медицині на основі баєсівського та метричного 
підходів” Магістерська кваліфікаційна робота складається зі вступу, чотирьох 
розділів, висновків, списку використаних джерел та додатків. Обсяг роботи 
становить 75 сторінок основного тексту, містить 45 рисунків, 22 найменування 
у списку використаних джерел і 4 додатки. 
Актуальність теми зумовлена стрімким розвитком систем на базі машинного 
навчання в сфері охорони здоров’я, та перспективами, що може надати 
застосування подібних методів. 
Об’єктом дослідження є процеси аналізу клінічних даних та діагностика 
пацієнтів з використанням методів машинного навчання на основі Баєсівського та 
метричних підходів. 
Предметом дослідження є методи та алгоритми машинного навчання, 
зокрема на базі Баєсівського та метричного підходів для вирішення задачі 
класифікації захворювань, а також ефективність їхньої програмної реалізації.
Метою дослідження є розробка моделей машинного навчання для діагностування 
захворювань, порівняння якості роботи цих моделей, та розробка програмного 
забезпечення з імплементацією розроблених моделей. 
Під час написання роботи використовувались такі методи досліджень, як 
аналіз наукової літератури та джерел, дослідження існуючих рішень для подібних 
задач, порівняльний аналіз, методи машинного навчання та методи оцінки 
ефективності. 
Практичне значення одержаних результатів полягає в можливості 
використання розробленого програмного застосунку для мінімізації кількості 
помилок, що допускаються під час діагностування пацієнтів. Також проведені 
дослідження можуть слугувати базою для майбутніх розробок подібних 
застосунків. 
Основні положення проведеного дослідження були апробовані на ІІ 
міжнародній науково-практичній студентській конференції “IT простір сьогодення: 
тенденції, інновації та перспективи розвитку”. 
Ключові слова: машинне навчання; нейронні мережі; задача класифікації; ШІ 
в сфері охорони здоров’я; великі мовні моделі; програмний застосунок; KNN; 
Наївний класифікатор баєса; точність моделі. 
3 
ABSTRACT 
Master's Qualification Thesis: "Application of Data Analysis and Machine 
Learning Methods in Medicine Based on Bayesian and Metric Approaches" 
The Master's qualification thesis consists of an introduction, four chapters, 
conclusions, a list of references, and appendices. The main text of the thesis comprises 
75 pages, includes 45 figures, 22 items in the list of references, and 4 appendices. 
The relevance of the topic is determined by the rapid development of machine 
learning-based systems in the healthcare sector and the prospects that the application of 
such methods can provide. The object of the study is the processes of clinical 
data analysis and patient diagnosis using machine learning methods based on Bayesian 
and metric approaches. 
The subject of the study is the machine learning methods and algorithms, 
particularly those based on Bayesian and metric approaches, for solving the problem of 
disease classification, as well as the effectiveness of their software implementation. 
The goal of the study is the development of machine learning models for diagnosing 
diseases, comparison of the performance quality of these models, and the development 
of software with the implementation of the developed models. 
The following research methods were used during the writing of the thesis: analysis 
of scientific literature and sources, investigation of existing solutions for similar tasks, 
comparative analysis, machine learning methods, and performance evaluation methods. 
The practical significance of the obtained results lies in the possibility of using 
the developed software application to minimize the number of errors made during 
patient diagnosis. Furthermore, the conducted research can serve as a basis for future 
developments of similar applications. 
The main provisions of the conducted research were approved at the II International 
Scientific and Practical Student Conference "IT Space of Today: Trends, Innovations, 
and Development Prospects." 
Key words: machine learning; neural networks; classification problem; AI in 
healthcare; large language models; software application; KNN; Naive Bayes classifier; 
model accuracy. 
4 
 
ВСТУП ............................................................................................................................. 6 
1.МАШИННЕ НАВЧАННЯ У СФЕРІ МЕДИЦИНИ ............................................ 9 
1.1. Доцільність використання машинного навчання та нейромереж в 
медичній сфері................................................................................................................9 
1.1.1 Перспективи розвитку використання ШІ та методів 
машинного навчання в сфері медицини................................................................... 9 
1.1.2 Проблеми, що створює використання ШІ в медицині ............... 12 
1.2. Успішні приклади та результати результати застосування методів 
машинного навчання і нейромереж у сфері медицини.........................................14 
1.2.1. Чатботи для діагностики захворювань ........................................ 14 
1.2.2. Діагностика захворювань за допомогою комп’ютерного зору 17 
1.2.3. Використання алгоритмів глибинного навчання для 
діагностування надрідкісних захворювань ............................................................ 18 
Висновки до розділу 1..........................................................................................22 
2. МОДЕЛІ І МЕТОДИ МАШИННОГО НАВЧАННЯ В МЕДИЧНОМУ 
КОНТЕКСТІ................................................................................................................. 24 
2.1. Загальний аналіз моделей машинного навчання та нейромереж для 
застосування в медичній сфері..................................................................................24 
2.1.1. Модель Random forest ...................................................................... 24 
2.1.2. Модель наївного класифікатора Баєса......................................... 27 
2.1.3. Модель KNN ....................................................................................... 30 
2.1.4. Нейронні мережі ................................................................................ 34 
2.1.5. Модель логістичної регресії ............................................................ 38 
2.2. Вплив LLM на прийняття соціумом використання машинного 
навчання і нейромереж в медицині..........................................................................40 
2.3. Дослідження якості традиційного медичного діагностування, 
створення критерій, яким повинні відповідати запропоновані методи 
аналізу............................................................................................................................44 
2.4. Підбір і аналіз моделей, що можуть бути застосовані для вирішення 
задачі діагностування захворювань.........................................................................48 
2.4.1. Переваги моделі наївного класифікатора Баєса ........................ 48 
2.4.2. Переваги моделі градієнтного підсилювання на базі дерев 
рішень ............................................................................................................................ 49 
2.4.3. Переваги моделі випадкового лісу ................................................ 49 
5 
 
2.4.4. Переваги моделі логістичної регресії ............................................ 50 
2.4.5. Переваги моделі KNN ....................................................................... 51 
2.4.6. Переваги нейронних мереж ............................................................ 51 
Висновки до розділу 2..........................................................................................53 
3. ПОРІВНЯЛЬНИЙ АНАЛІЗ КЛАСИФІКАЦІЙНИХ МОДЕЛЕЙ В 
КОНТЕКСТІ МЕДИЦИНИ ....................................................................................... 54 
3.1. Розробка класифікаційних моделей для діагностування 
захворювань..................................................................................................................54 
3.1.1 Розробка моделі класифікатора наївного Баєса .......................... 54 
3.1.2 Розробка моделі логістичної регресії ............................................. 56 
3.1.3 Навчання моделі випадкового лісу ................................................ 58 
3.1.4 Навчання моделі градієнтного підсилення на базі дерев 
рішень............................................................................................................................59 
3.1.5 Навчання моделі нейронної мережі ............................................... 60 
3.1.6 Розробка моделі KNN ........................................................................ 61 
3.1.7. Статистична метамодель ................................................................ 62 
3.2. Аналіз точності моделей, та перевірка на відповідність вимогам.......64 
Висновки до розділу 3..........................................................................................67 
4.РОЗРОБКА ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ............................................. 68 
4.1. Створення бази даних і інструментарію для робти програми.............68 
4.2. Створення графічної оболонки програми, та загальна оптимізація 
роботи програми..........................................................................................................73 
4.3. Тестування роботи програми.....................................................................76 
Висновки до розділу 4.........................................................................................79 
ВИСНОВКИ ................................................................................................................. 80 
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ................................................................ 82 
ДОДАТОК А Специфікація ...................................................................................... 84 
ДОДАТОК Б Інструкція користувача .................................................................... 86 
ДОДАТОК В Опис датасету ...................................................................................... 90 
ДОДАТОК Г Текст програми.................................................................................120 
 
 
6 
 
ВСТУП 
В умовах постійного розвитку інформаційних технологій та появи новітніх 
підходів до вирішень класичних задач постає питання доцільності впровадження 
цих підходів до вже існуючі галузі. Поява штучного інтелекту та популяризація 
машинного навчання, їх вплив на всі існуючі галузі змушує розробляти та 
впроваджувати нові рішення, що базуються на цих технологіях. Проте чи в усі 
галузі можна впровадити алгоритми машинного навчання і нейромереж? Як 
подібна модернізація може вплинути на вже існуючі галузі? Чи стане такий підхід 
революційним? Пропонується розглянути ці питання через призму сфери охорони 
здоров’я, шляхом аналізу ефективності застосування моделей машинного навчання 
в медичній діагностиці. 
Актуальність теми. Тема є актуальною, оскільки в сферу охорони здоров’я, 
впродовж останніх років, активно впроваджуються технології, що використовують 
алгоритми машинного навчання. Створюються новітні підходи для вирішення 
складних проблем, за допомогою алгоритмів машинного навчання досліджують 
нові закономірності між симптомами та хворобами, практикують раннє виявлення 
паталогй, та досліджують надскладні генетичні і органічні структури. 
Впровадження технологій машинного навчання спрощує значну кількість 
медичних задач, та допомагає підвищувати якість рівня медицини, що є критичним, 
особливо в наш час, коли якість медицини значно відрізняється між розвиненими 
країнами, країнами що розвиваються, та країнами третього світу. Новітні методи з 
використанням алгоритмів можуть мінімізувати цю нерівність, що позитивно 
вплине на людство загалом. 
В процесі цифровізації медицини також з’являється велика кількість нових 
медичних даних, застосування яких є логічним вектором розвитку сфери, тим 
більше в епоху, коли інформація стала новою найціннішою сировиною. 
Також варто зазначити, що впровадження методів машинного навчання у 
сферу охорони здоров’я – відносно новий підхід, потенціал розвитку якого досі 
7 
 
невідомий, адже окрім проблеми ефективності існує ще проблема соціального 
сприйняття подібних технологій. 
Об’єкт дослідження. Об’єктом дослідження є процеси аналізу клінічних 
даних та діагностика пацієнтів з використанням методів машинного навчання на 
основі Баєсівського та метричних підходів. 
Предмет дослідження. Предметом дослідження є методи та алгоритми 
машинного навчання, зокрема на базі Баєсівського та метричного підходів для 
вирішення задачі класифікації захворювань, а також ефективність їхньої 
програмної реалізації. 
Мета дослідження. Мета кваліфікаційної роботи полягає у створенні 
програмного застосунку з впровадженням моделей машинного навчання на базі 
Баєсівського та метричних підходів, для діагностування захворювань пацієнтів. 
Також метою є аналіз моделей на предмет якості аналізу та доцільності 
використання подібних методів в сфері охорони здоров’я. 
Відповідно до зазначеної мети сформульовано такі завдання дослідження: 
1) Розглянути та дослідити існуючі приклади застосування 
алгоритмів машинного навчання в медицині. 
2) Розглянути перспективні методи машинного навчання для їх 
подальшого використання. 
3) Реалізувати обрані моделі, провести порівняльний аналіз 
створених моделей, та сформувати висновки, щодо якості їх роботи. 
4) Розробити програмний застосунок з інтеграцією всіх успішно 
створених моделей для їх зручного застосування.  
Методи дослідження. В роботі використовувались теоретичні, емпіричні та 
комп’ютерні методи досліджень. Аналіз наукової літератури та джерел, 
використовувався для дослідження існуючих рішень подібних задач. Метод 
порівняльного аналізу, використовувався для порівняння розроблених рішень. 
Методи машинного навчання, використовувалися для реалізації програмного 
застосунку. Методи оцінки ефективності, для оцінювання якості кожній моделі. 
8 
 
  Наукова новизна полягає в реалізації комбінованого, або ансамблевого 
методу діагностики захворювань і компілюванні їх результатів. 
 Практичне значення отриманих результатів полягає у можливому 
застосуванні розробленого програмного застосунку для спрощення і прискорення 
медичного діагностичного процесу в закладах охорони здоров’я. Також 
запропонований підхід до медичної діагностики може бути використаний для 
покращення сфери охорони здоров’я в країнах третього світу, та в країнах, що 
розвиваються. 
Апробація результатів. Основні положення проведеного дослідження були 
апробовані на ІІ міжнародній науково-практичній студентській конференції “IT 
простір сьогодення: тенденції, інновації та перспективи розвитку”. 
  
 
  
9 
 
1.МАШИННЕ НАВЧАННЯ У СФЕРІ МЕДИЦИНИ 
Цей розділ присвячено загальному аналізу використання технологій 
машинного навчання у сфері охорони здоров’я. Тут будуть проаналізовані 
переваги,  може надати використання технологій машинного навчання, та 
розглянемо наявні приклади застосування цих методів в сфері медицини.  
1.1. Доцільність використання машинного навчання та нейромереж в 
медичній сфері 
1.1.1 Перспективи розвитку використання ШІ та методів машинного 
навчання в сфері медицини 
В сфері охорони здоров’я машинне навчання має невичерпний потенціал, 
адже в глобалізованому світі, де дані стали найціннішим ресурсом, а їхній якісний, 
швидкий і дешевий аналіз- це ключ до прискорення розвитку сфери в рази. ШІ 
може допомогти медикам аналізувати тенденції захворюваності, зпобігати 
епідеміям. Аналіз даних за допомогою ШІ може прискорити тестування 
медикаментів та виявляти приховані кореляції, що дасть змогу швидше відкидати 
неефективні методики і приймати на озброєння ті, що показують дійсно гарні 
результати. 
Одна з головних проблем сфери охорони здоров’я – це доступність. 
Дослідження нових препаратів і методик це багаторічна робота спеціалістів, яка, 
до того ж, може принести негативний результат. Для якісної діагностики, що є 
основою якісного лікування, також потрібні висококласні фахівці, до того ж, при 
виникненні нетипових патологій діагностування може тривати роки. Медицина 
вимагає величезних ресурсів для свого розвитку і це одна з тих проблем, яку ШІ і 
методи машинного навчання можуть мінімізувати, зробивши медицину 
доступнішою, а життя людей якісно кращим. 
Відсутність персоналізованої медицини є одним з основних чинників 
підбору неправильного, або неоптимального плану лікування, що особливо 
10 
 
критично у випадках виникнення ракових патологій, ендометріозу і інших 
особливих видів захворювань. Ми вже маємо успішні приклади персоналізації в 
сфері охорони здоров’я, програмний застосунок для мобільних пристроїв “FLO” 
став порятунком для здоров’я тисяч жінок. Людина не може перебувати тривалий 
час під цілодобовим наглядом лікарів, але людина може встановити собі на 
смартфон додаток і нотувати свій щоденний стан там, це повинно значно 
покращити моніторинг за станом здоров’я людини. Персоналізований аналіз 
генетичної інформації людини разом з регулярним аналізом наявної симптоматики 
може попереджувати прогресію хронічних хвороб та виявляти паталогії на ранніх 
етапах. 
Скорочення витрат на такі дослідження, як аналіз генетичної інформації, 
аналіз структур білків, молекулярні взаємодії, вплив зміни структури хімічного 
препарату на його дію позитивно впливає як на актуальність препаратів, так і на їх 
доступність. Крім того, аналіз за допомогою машинного навчання може виявити 
нові методи застосування вже існуючих терапевтичних сполук. 
Використання ШІ та суміжних технологій дасть змогу підвищити 
оперативну ефективність закладів охорони здоров’я, та зменшити витрати без 
шкоди для людей. Нестача медичного персоналу під час підвищеного попиту на 
медичні послуги – дуже типова проблема медичних закладів, прогнозування на 
основі відкритих даних дасть змогу оптимізувати управління персоналом і 
мінімізувати подібні ситуації. Також ШІ може значно розвантажити медичний 
персонал в питаннях догляду за пацієнтами. 
Адміністрування медичних закладів також може бути частково 
автоматизоване, особливо в задачах планувань прийомів, виставлення рахунків та 
управління пацієнтами, виконання цих задач людьми займає дуже багато часу, до 
того ж людина помиляється значно більше, аніж машини. 
Ще одни аспектом, у якому машинне навчання та ШІ зможе підвищити 
ефективність наявної системи є логістика, це стосується не тільки медичної сфери, 
але все ж, розрахунок потреби кожного окремого медичного закладу, це також 
потребує багато зайвих витрат часу і ресурсів. Прогнозування попиту на матеріали, 
11 
 
аналіз запасів і управління ризиками – це завдання, які ШІ здатний виконувати 
якісно і швидко. ШІ також може керувати потоком пацієнтів, враховуючи 
демографічні показники, схеми госпіталізації та вузькі місця кожного окремого 
закладу, що покращить швидкість надання медичних послуг, та, знову ж таки, їх 
доступність. 
Отже, штучний інтелект, та машинне навчання можуть стати ключем до 
прориву у сфері медичного обслуговування, та в медицині загалом. Ця тенденція 
підтверджується ринковими показниками. За даними аналітичної консалтингової 
компанії Precedence Research обсяг ринку ШІ технологій у медичній сфері в період 
з 2021 року до 2025 року зріс більш ніж утричі, та продовжить подальше зростання 
(рисунок 1.1 і 1.2). 
 
Рисунок 1.1.1 = Прогнозовані дані зростання ринку генеративних ШІ технологій в 
медичній сфері [3] 
12 
 
 
Рисунок 1.1.2 – Прогнозовані дані зростання ринку ШІ технологій в медичній 
сфері [2] 
1.1.2 Проблеми, що створює використання ШІ в медицині 
Впровадження технологій штучного інтелекту та машинного навчання в 
будь-яку сферу приносить з собою як безліч плюсів, так і безліч нових викликів, 
тож виникає питання, чи є ці проблеми критичними, аби відмовитись від 
можливого прориву у сфері охорони здоров’я? 
Проблема конфіденційності є однією з найважливіших, адже при 
впровадженні прошарку інформаційних технологій у взаємодію між пацієнтами і 
лікарями виникає проблема захисту даних клієнта і загроза для принципу медичної 
таємниці. Там, де є бази даних, з’являються люди, що бажають викрасти і 
використати ці дані як компрометуючу інформацію, або з іншою метою. У розділі 
1.1.1. ми згадували застосунок FLO, бази даних якого неодноразово були 
скомпрометовані та викрадені кіберзлочинцями. Боротись з цією проблемою 
можна лише одним методом – впровадженням надійних систем кібербезпеки, проте 
це все одно не надає стовідсоткової гарантії цілісності і конфіденційності даних. 
Існує також проблема вартості впровадження ШІ інструментів в медичну 
сферу, однак ця проблема вважається некритичною, адже інтегрування таких 
технологій спрацьовує, як інвестиція, яка через короткий час дозволяє значно 
скоротити витрати, завдяки чому вартість перекривається вигодою. 
13 
 
Проблема надмірної залежності від штучного інтелекту також є однією з  
надважливих. Ця проблема є переважно соціологічною, вирішити це можна 
виключно освітньою діяльністю і пропагандою відповідального використання 
технологій. Людям важко пояснити, що LLM такі як чат GPT, або Gemini не є 
спеціалізованим медичним програмним забезпеченням. Також неправильне і 
надмірне використання LLM фахівцями в навчальних цілях може погіршувати 
якість отриманих знань. Варто також зазначити, що з плином часу великі мовні 
моделі покращують свою точність аналізу і рекомендацій в різних медичних 
напрямах. На сторінках наукового онлайн видання MDPI можна знайти 
дослідження на цю тему, які показують, що на момент 2025 року LLM chat GPT 
демонструє стабільно задовільні результаті у сферах психології та дерматології, 
проте якість аналізу у сферах неврології, серцево-судинних захворювань та 
онкології є мінливою (рисунок 1.2.3 та 1.2.4) 
 
Рисунок 1.2.3 – Оцінка точності та стабільності медичного аналізу у різних 
сферах, продемонстрована великою мовною моделлю “chat GPT” [4] 
14 
 
 
Рисунок 1.2.4 – Частота досліджень медичних напрямків з розподілом за оцінкою 
результатів цих досліджень. [4] 
1.2. Успішні приклади та результати результати застосування методів 
машинного навчання і нейромереж у сфері медицини 
1.2.1. Чатботи для діагностики захворювань 
Розглянемо приклад британського стартапу чатбота “Babylon Health”, 
зображено на рисунку 1.2.1. Британський стартап Babylon Health — це сервіс 
медичного обслуговування на основі передплати, який розробив чатбота для 
профілактики та діагностики захворювань. 
За повідомленнями, чат-бот, використовуючи розпізнавання мовлення, 
порівнюватиме симптоми, отримані від користувача, з базою даних захворювань. 
У відповідь він рекомендує відповідний курс дій на основі поєднання 
зареєстрованих симптомів, історії хвороби пацієнта та його обставин. Наприклад, 
відповіддю застосунку на опис симптомів грипу може бути рекомендація відвідати 
аптеку за безрецептурними ліками. Натомість якщо користувач повідомляє про 
серйозніші симптоми, застосунок може рекомендувати зателефонувати на екстрену 
гарячу лінію або звернутися безпосередньо до лікарні. 
15 
 
Окрім функції діагностики, додаток також здатний інтегрувати дані 
пацієнтів з портативних пристроїв для моніторингу життєво важливих показників, 
таких як частота серцевих скорочень та рівень холестерину. 
Чатбот був запропонований для тестування групі з 21 500 пацієнтів у двох 
лікарнях. Стартап отримав реєстрації від 10 відсотків цих пацієнтів для тестування 
застосунку. Повідомляється, що в обох лікарнях Ессекса час очікування пацієнтів 
скоротився з моменту, коли Babylon вперше став доступним безкоштовно для їхніх 
пацієнтів у квітні 2015 року. Однак, незрозуміло, наскільки скоротився час 
очікування. 
Незважаючи на відносний успіх, у 2022 році компанія скоротила понад 
половину співробітників, після чого була продана компанії Higi. Причинами 
провалу стало те, що люди користувалися застосунком занадто рідко, приблизно 
сім разів на рік, замість, як мінімум, щотижневих доповнень до моніторингу свого 
стану. До того вже існували великі мовні моделі, що з точки зору користувачів 
виконували ту ж саму функцію, можна сказати, що для запуску стартапу обрали не 
той час і не до кінця пояснили користувачам приференції від використання 
продукту. 
 
Рисунок 1.2.1 – Ілюстрація до чатботу Babylon Health [5] 
16 
 
Також в контексті використання ЛЛМ для медичного діагностування варто 
звернути увагу на метааналіз точності найпопулярнішого сьогодні ЛЛМ-чатбота 
чат GPT версій 3.5 і 4.0, опублікованому в науковому онлайн ресурсі PMC. 
ChatGPT, розроблений OpenAI, є значним етапом в еволюції розмовного 
штучного інтелекту. Спочатку випущений у листопаді 2022 року та заснований на 
архітектурі GPT-3.5, ChatGPT швидко продемонстрував свої можливості у 
генеруванні узгоджених та контекстуально релевантних відповідей у різних 
областях. Модель навчалася на великих наборах даних, що дозволило їй 
виконувати такі завдання, як генерація коду, підсумовування тексту та вирішення 
складних проблем з надзвичайною точністю. Крім того, ChatGPT може допомогти 
у створенні медичної документації, наданні точної та ефективної інформації про 
пацієнтів і навіть у діагностичних процесах, аналізуючи дані пацієнтів та 
пропонуючи можливі діагнози. Більше того, здатність ChatGPT швидко та точно 
обробляти великі обсяги даних робить його цінним інструментом для оптимізації 
робочих процесів та підвищення загальної ефективності охорони здоров'я. 
Висновки PMC узгоджуються з висновками Хіросави, які виявили високу 
діагностичну точність 93,3% для ChatGPT 3.5 у списках диференціальної 
діагностики, що свідчить про те, що чат-боти зі штучним інтелектом можуть 
генерувати точні списки діагнозів для поширених скарг. Автори метааналізу також 
повідомили про загальну точність для ChatGPT на рівні 71,7%, з найвищою 
продуктивністю в остаточній діагностиці та найнижчою в початковій 
диференціальній діагностиці. 
Мехнен зазначили, що ChatGPT 4 вимагає більше рекомендацій для 
вирішення рідкісних захворювань порівняно з поширеними випадками, що 
узгоджується з висновками PMC щодо змінної діагностичної ефективності. 
Дослідники також виявили, що GPT-3.5 досяг 84% точності у визначенні пацієнтів 
з вищою гостротою захворювання. 
Результати показують, що ChatGPT, особливо версія 4.0, має потенціал для 
покращення точності сортування та зменшення кількості небезпечних рішень у 
надзвичайних ситуаціях. Однак, варіабельність досліджень підкреслює 
17 
 
необхідність подальшої оцінки та вдосконалення. Дослідники застерігають від 
неконтрольованого використання ChatGPT для тріажу без підвищення точності та 
клінічної валідації, також припускають, що ChatGPT може допомогти медичним 
працівникам покращити сортування пацієнтів. 
1.2.2. Діагностика захворювань за допомогою комп’ютерного зору 
Дослідники Стенфордського університету навчили алгоритм діагностики 
раку шкіри за допомогою глибокого навчання, зокрема глибоких згорткових 
нейронних мереж (CNN). Алгоритм навчався  виявляти рак шкіри або меланому за 
допомогою 130 000 зображень уражень шкіри, що представляють понад 2000 
різних захворювань. 
У США щороку діагностується приблизно 5,4 мільйона нових випадків раку 
шкіри, і раннє виявлення має вирішальне значення для підвищення рівня 
виживання пацієнтів. Наприклад, раннє виявлення корелює з 97-відсотковим 
п'ятирічним рівнем виживання, але різко знижується на пізніших стадіях, 
досягаючи 15-20 відсотків на 4 стадії. 
Для контексту, візуальний огляд є першим кроком у діагностиці раку шкіри, 
і дерматолог оглядає ураження, що цікавить, за допомогою дерматоскопа , або 
ручного мікроскопа. Якщо дерматолог вважає, що ураження справді є раковим, або 
якщо початкове обстеження не дало остаточних результатів, проводиться біопсія. 
Алгоритм глибокого навчання Стенфорда був протестований на 21 
сертифікованому дерматологу, їм було запропоновано переглянути 370 зображень 
та визначити, чи продовжать вони біопсію та лікування, чи заспокоять пацієнта на 
основі кожного зображення. Результати показали, що алгоритм мав таку ж 
здатність, як і 21 дерматолог, визначати найкращий курс дій на всіх зображеннях. 
Це багатообіцяючі результати, проте дослідницька група визнає, що перед 
інтеграцією алгоритму в клінічну практику потрібні додаткові ретельні 
випробування. 
18 
 
Дане дослідження було проведено в 2017 році, тоді модель мала точність 
близьку до точності “живих” лікарів, тобто приблизно 75%. Алгоритм 
покращували і вже в 2025 році повідомили про досягнення точності в 81,5%[6], що, 
в контексті досліджуваної хвороби є критично важливою перевагою над 
традиційним діагностуванням. 
1.2.3. Використання алгоритмів глибинного навчання для 
діагностування надрідкісних захворювань 
Знедавна, вірніше з часів ШІ буму і початку домінування машинного 
навчання на ринку, все більше науковців звертаються до алгоритмів машинного 
навчання для вирішення надскладних задач, таких як діагностування надрідкісних 
хвороб, що, при виявленні на пізніх етапах, є майже невиліковними. Чудовим 
прикладом такого дослідження є робота китайських вчених вчених “Розробка та 
валідація алгоритмів мультимодального глибокого навчання для виявлення 
легеневої гіпертензії” 
Легенева гіпертензія – це небезпечне для життя захворювання, що 
характеризується прогресуючим ремоделюванням легеневих судин, що призводить 
до правобічної серцевої недостатності та, зрештою, смерті. Вона вражає приблизно 
1% населення світу та до 10% осіб віком >65 років, має поганий прогноз та низький 
5-річний рівень виживання, що підкреслює критичну необхідність раннього 
виявлення 
Традиційно, для діагностики легеневої артерії потрібна катетеризація 
правих відділів серця для вимірювання середнього тиску в легеневій артерії з 
діагностичним порогом понад 20 мм рт. ст. Хоча катетеризація правих відділів 
серця є золотим стандартом, вона є інвазивною, складною та дорогою, що робить її 
непридатною для широкомасштабного скринінгу, особливо в умовах первинної 
медичної допомоги. Наприклад, у Китаї лише 6,9% лікарень оснащені для 
проведення катетеризації правих відділів серця, що ще більше обмежує доступність 
остаточного діагнозу Трансторакальна ехокардіографія є основним неінвазивним 
19 
 
інструментом скринінгу, який забезпечує оцінку систолічного тиску в легеневій 
артерії Однак трансторакальна ехокардіографія має обмежену чутливість (0,88) та 
специфічність (0,56), що призводить до потенційних хибнонегативних та 
хибнопозитивних результатів, що може затримати діагностику або спонукати до 
непотрібних катетерізацій правих відділів серця. Його точність додатково 
знижується такими факторами, як відсутність швидкості струменя тристулкової 
регургітації, зміщення доплерівського променя, тяжка тристулкова регургітація, 
стеноз легеневої артерії, стани високого серцевого викиду та аритмії. 
Щоб подолати ці проблеми, потрібен неінвазивний та високоточний метод 
скринінгу. Були докладені зусилля для розробки таких методів. Наприклад, 
Шрайбер та ін.12 - 25 мм рт. ст. як поріг mPAP та запропонували модель, що 
використовує оксиметрію та тести легеневої функції, яка показала чутливість 0,90 
та специфічність 0,29 для легеневої гіпертензії. Алгоритм DETECT, що інтегрує 
клінічні дані, дані легеневої функції, електрокардіограму та трансторакальна 
ехокардіографія, покращив виявлення легеневої гіпертензії у пацієнтів із 
системним склерозом, рекомендуючи катетеризацію правих відділів серці у 62% 
випадків та пропускаючи лише 4% діагнозів. 
Сучасні підходи спираються на одномодальні дані, які не інтегрують різні 
типи даних, такі як зображення та текстова інформація. Точність цих підходів часто 
недостатня для задоволення клінічних вимог, і їм бракує широкої валідації в різних 
популяціях. Дослідження показали, що поєднання кількох джерел клінічної 
інформації може підвищити точність діагностики. 
На рисунку 1.2.2 показано структуру MMF-PH, адаптовану науковцями для 
виявлення легеневої гіпертензії за даними, зібраними в кількох медичних центрах. 
Верхній рівень ( a ) показує фазу збору даних, з наборами даних, зібраними з трьох 
центрів, які лікують пацієнтів з підозрою на легеневу гіпертензію, які пройшли 
RHC, золотий стандарт для оцінки легеневої гіпертензії. Ці набори даних містять 
табличні дані (демографічні дані, клінічні особливості, історії хвороби, лабораторні 
результати), текстові дані (нотатки з CXR, електрокардіографії та ехокардіографії) 
та дані візуалізації з CXR. 
20 
 
 
Рисунок 1.2.2 – Структура MMF-PH для виявлення легеневої гіпертензії за 
збірними даними [7] 
Середній рівень ( b ) окреслює фазу попередньої обробки даних та 
вилучення ознак. Тут табличні дані перетворюються трансформаторним кодером, 
текстові дані - BERT, а дані візуалізації - ViT, кожен з яких вилучає відповідні 
ознаки для створення вбудовувань - стандартизованого формату для подальшого 
аналізу.  
Останній рівень ( c ) представляє фазу об'єднання та побудови моделі. 
Вбудовування з різних джерел об'єднуються за допомогою механізму 
самоуважності, що є центральним у процесі мультимодального об'єднання MMF-
PH. Ця комплексна інтеграція призводить до формулювання MMF-PH. Передньо-
задній AP, представлення двонаправленого енкодеру BERT від Transformers, 
рентген грудної клітки CXR, мультимодальна модель злиття MMF-PH для 
21 
 
скринінгу легеневої гіпертензії, багатошаровий перцептрон MLP, катетеризація 
правих відділів серця RHC, трансформатор ViT Vision. 
 
Рисунок 1.2.3 – Продуктивність моделі на різних наборах даних [7] 
На рисунку 1.2.3 підсумовано ефективність MMF-PH для різних тестових 
наборів даних. Як показано на рис. 1.2.3, b, значення площі під кривою робочої 
характеристики приймача (AUROC) становили 0,965 (95% довірчий інтервал: 
0,940–0,983) у ретроспективному тестовому наборі даних, 0,939 (95% довірчий 
інтервал: 0,894–0,971) у проспективному тестовому наборі даних та 0,814 (95% 
довірчий інтервал: 0,669–0,947) у зовнішньому наборі даних. Значення площі під 
кривою точності та повноти (AUPRC) становили 0,997 (95% довірчий іниервал: 
0,995–0,999) у ретроспективному тестовому наборі даних, 0,991 (95% довірчий 
інтервал: 0,981–0,997) у проспективному тестовому наборі даних та 0,867 (95% 
довірчий інтервал: 0,716–0,960) у зовнішньому наборі даних 
22 
 
В результаті дослідження група вчених створила модель, що має дійсно 
високу точність, більше 90%, що, за умови якщо модель пройде повний цикл 
клінічних досліджень і доведе свою ефективність, надасть змогу мінімізувати 
шкоду від легеневої гіпертензії, дозволить точніше визначати наявність 
захворювання на ранніх станах і подовжити життя хворих.  
1.3. Висновки до розділу 1 
Тож, зважаючи на всі приведені дослідження можна стверджувати, що на 
момент 2025 року моделі машинного навчання, та нейромережі вже широко 
використовуються в сфері медицини, при чому не лише просто як прототипи 
рішень, а й як реальні системи. 
Точність таких моделей часто є вищою, ніж у випадку класичної 
діагностики, також діагностування за допомогою штучного інтелекту, або моделей 
машинного навчання є значно швидшим, що важливо, коли мова йде про важкі 
захворювання, що є складними для раннього виявлення, але раннє виявлення яких 
є необхідним для підвищення шансу на виживання пацієнтів. ЛЛМ, в свою чергу 
демонструє велику варіацію точності, в залежності від сфери звхворювання, що, 
безумовно, становить ризики для людей, які використовують ЛЛМ для 
самодіагностики. 
Питання про готовність соціуму до подібного діагностування залишається 
невизначеним, хоча і оглянуті дані є трохи застарілими, та все ж, зрозуміло, що для 
дійсно якісної роботи системи з медичної діагностики на базі машинного навчання 
потрібне регулярне оновлення даних користувача. Приклад спроби впровадження 
в систему охорони здоров’я застосунку Babylon Health є показовим і надважливим, 
адже провал цієї ініціативи демонструє слабкі сторони цього підходу і дає змогу 
спеціалістам вирішити, або обійти ці проблеми для повноцінного впровадження 
подібних технологій. 
Перспективи цього підходу є неосяжними, адже точність діагностування, 
яку вдалося досягти розробникам є часто вищою, ніж при традиційній діагностиці 
23 
 
і, зважаючи на результат алгоритму глибокого навчання Стенфорда, точність 
діагностування висока, проте не гранична і може бути покращена. 
Якщо говорити про проблеми даного підходу, то вони досі залишаються 
суттєвими, але переваги, що надає використання таких систем, всеж, перекриває 
всі недоліки, про що можна судити з аналізу розвитку ринку машинного навчання 
і нейромереж в сфері медицини, проведеного Precedence research. 
  
24 
 
2. МОДЕЛІ І МЕТОДИ МАШИННОГО НАВЧАННЯ В 
МЕДИЧНОМУ КОНТЕКСТІ 
В даному розділі будуть розглянуті математичні моделі машинного 
навчання, що можуть бути використані у розробці програмного забезпечення для 
діагностики захворювань. Діагностика захворювань в тому виді, в якому ми будемо 
її реалізовувати відноситься до задач класифікації, тому саме моделі, що 
використовуються в вирішенні цих задач будуть розглянуті далі. 
2.1. Загальний аналіз моделей машинного навчання та нейромереж для 
застосування в медичній сфері 
2.1.1. Модель Random forest 
Випадкові ліси – це популярний та потужний алгоритм машинного 
навчання, який використовується в аналізі медичної візуалізації. По суті, 
випадковий ліс – це ансамбль окремих дерев рішень, які працюють разом для 
створення прогнозів. Кожне дерево рішень у випадковому лісі будується шляхом 
випадкового вибору підмножини ознак та навчання дерева на підмножині 
навчальних даних. Ця випадковість допомагає запобігти перенавчанню та 
покращує узагальнення, роблячи випадкові ліси надійними та стійкими для завдань 
медичної візуалізації. 
Однією з ключових переваг випадкових лісів в аналізі медичних зображень 
та медичної діагностики є їхня здатність обробляти багатовимірні та складні дані.  
Основним напрямом використання випадкового лісу в медицині є аналіз 
зображень. Медичні зображення часто містять величезну кількість інформації, 
такої як рівні інтенсивності, текстура, форма та просторові відносини. Традиційні 
алгоритми машинного навчання можуть мати труднощі з ефективним вилученням 
та використанням цього багатства інформації. Однак, випадкові ліси чудово 
справляються з цим завданням, оскільки вони можуть обробляти кілька ознак 
одночасно, визначаючи найбільш дискримінаційні для оптимальної класифікації та 
25 
 
сегментації. Такий комплексний підхід значно підвищує точність та ефективність 
аналізу медичних зображень, що призводить до покращення діагностичних 
результатів та кращого догляду за пацієнтами. Саме здатність цього методу до 
обробки багатьох ознак одночасно може бути ключем, для отримання високих 
результатів на великих наборах даних з великою кількісттю ознак, тобто саме для 
нашої задачі діагностики. 
Вибір ознак відіграє вирішальну роль у застосуванні випадкових лісів в 
аналізі медичних зображень. Мета полягає в зменшенні розмірності даних без 
шкоди для точності результатів класифікації або сегментації. Вибираючи найбільш 
релевантні ознаки, випадкові ліси можуть ефективно виявляти закономірності та 
взаємозв'язки в медичних зображеннях, що призводить до покращення точності 
діагностики та планування лікування. Цей процес не тільки підвищує ефективність 
аналізу, але й зменшує обчислювальну складність, що робить застосування 
випадкових лісів більш можливим у клінічних умовах реального часу. 
Випадкові ліси продемонстрували значні перспективи у виявленні пухлин 
завдяки своїй здатності обробляти великі, складні набори даних та робити надійні 
прогнози. Поєднуючи кілька дерев рішень, випадкові ліси можуть ефективно 
аналізувати різні ознаки, отримані з медичних зображень, що дозволяє 
ідентифікувати аномальні закономірності, які можуть вказувати на наявність 
пухлин. Крім того, випадковий характер алгоритму допомагає зменшити 
перенавчання та забезпечити надійні результати. 
Завдяки своїй здатності обробляти складність та мінливість даних медичної 
візуалізації, випадкові ліси мають великий потенціал для революціонізування 
виявлення пухлин та покращення результатів лікування пацієнтів. Також варто 
згадати про модифікацію методу випадкового лісу, розроблнгу у 2014 році Тенчі 
Дженом(T. Chen), до моделі було додане градієнтне підсилювання, що мало б 
збільшити точність в задачах мультикласової класифікацції, та полегшити модель. 
Випадкові ліси стали потужним інструментом для підвищення точності та 
ефективності класифікації та сегментації в медичній візуалізації. Використовуючи 
переваги кількох дерев рішень, випадкові ліси можуть вирішувати проблеми 
26 
 
складності та мінливості медичних даних, що призводить до покращеного аналізу 
та інтерпретації. Однією з ключових переваг випадкових лісів є їхня здатність 
обробляти багатовимірні простори ознак у медичній візуалізації. З великою 
кількістю ознак, отриманих з медичних зображень, традиційні алгоритми 
класифікації та сегментації можуть мати труднощі з ефективним захопленням та 
використанням усієї відповідної інформації. Випадкові ліси чудово справляються з 
вибором ознак, дозволяючи ідентифікувати найбільш дискримінативні ознаки, які 
сприяють точній класифікації та сегментації. Це не тільки підвищує 
продуктивність аналізу медичної візуалізації, але й зменшує обчислювальну 
складність, що робить їх ідеальним вибором для практичного застосування в 
клінічних умовах. 
Однак, Випадкові Ліси мають деякі проблеми та обмеження. Однією з 
основних проблем є потенціал перенавчання , коли модель стає занадто складною 
та не може добре узагальнюватися на нові дані. Щоб пом'якшити це, можна 
налаштувати гіперпараметри Випадкового Лісу, такі як кількість дерев та 
максимальна глибина кожного дерева, а також використовувати ансамблеві 
методи, такі як пакетування, для подальшого зменшення перенавчання та 
підвищення стійкості моделі. Ще одним обмеженням є інтерпретованість 
Випадкових Лісів у медичній візуалізації. Хоча вони є дуже точними у створенні 
прогнозів, може бути важко зрозуміти основні причини, що лежать в основі цих 
прогнозів. Щоб усунути це обмеження, було запропоновано різні методи, такі як 
ранжування важливості ознак та графіки часткової залежності, які дають уявлення 
про внесок різних ознак у процес прийняття рішень. Ці методи інтерпретованості 
можуть допомогти зміцнити довіру та прийняття серед медичних працівників, що 
дозволить широко впровадити Випадкові Ліси в клінічній практиці. 
Однією з ключових областей, де можна інтегрувати випадкові ліси, 
є системи автоматизованої діагностики. Ці системи мають на меті допомогти 
медичним працівникам в інтерпретації медичних зображень, та анамнезу для 
постановки точних діагнозів. Завдяки інтеграції алгоритмів випадкових лісів у 
системи САПР, потенціал для підвищення точності та ефективності діагностики 
27 
 
стає очевидним. Використовуючи комбінацію дерев рішень та ансамблевого 
навчання, випадкові ліси можуть ефективно аналізувати складні дані медичної 
візуалізації та надавати цінну інформацію для допомоги в діагностиці та 
плануванні лікування. 
Алгоритм випадкового лісу є розширенням методу випадкового дерева, 
оскільки він використовує як пакетування, так і випадковість ознак для створення 
некорельованого лісу дерев рішень. Випадковість ознак генерує випадкову 
підмножину ознак, що забезпечує низьку кореляцію між деревами рішень. Це 
ключова відмінність між деревами рішень та випадковими лісами. У той час як 
дерева рішень враховують усі можливі розбиття ознак, випадкові ліси вибирають 
лише підмножину цих ознак, приблизний вигляд мережі випадкового лісу показано 
на рисунку 2.1.1. 
 
Рисунок 2.1.1 – Візуалізація мережі методу випадкового лісу. [9] 
2.1.2. Модель наївного класифікатора Баєса 
Баєсівська теорія названа на честь британського математика 18 
століття Томаса Баєса. Баєсівська логіка може передбачити або визначити 
28 
 
ймовірність виявлення захворювання. Баєсівська теорія передбачає, що теорему 
Баєса можна використовувати як правило для висновку або оновлення рівня довіри 
у світлі нової інформації. Баєсівські мережі можна розглядати як заміну моделям 
логістичної регресії, де ми можемо формулювати залежність або незалежність 
змінних. 
Рисунок 2.1.2 – Демонстрація мережі наївного класифікатора Баєса[10] 
Класифікатор наївного Баєса складається лише з одного батьківського та 
кількох дочірніх вузлів, як показано на рисунку 2.1.2, і це базується на теоремі 
Байєса в машинному навчанні.  
Нехай ми матимемо навчальний набір даних. Кожен окремий об’єкт бази 
даних представлена вектором атрибутів довжиною ‘n’ незалежних атрибутів 
( x1 , x2 , …, xn ). Припустимо, що існує ‘m’ класів, таких як c1 , c2 , …, cm , тоді 
класифікація полягає в отриманні максимального p(ci | x) . Це можна вивести з 
��(��|�� )��(����)
теореми Байєса як рівняння 1: ��(����|��) = ��  
��(��)
Структуру наївного класифікатора Баєса можна показати за допомогою 
орієнтованого ациклічного графа, який показано на рисунку 2.1.2, де вузли 
представляють змінні, а ребра між вузлами показують залежність між змінними. У 
межах вузла змінна може приймати багато різних значень, кожне з яких має певну 
ймовірність. Однією з головних проблем цієї моделі є те, що кореневий вузол 
29 
 
мережі має зв'язок з усіма прогнозними змінними та не залежить від жодних інших 
змінних. 
У наївному класифікаторі Баєса між різними змінними ознак немає 
взаємозалежності. Таким чином, вони вважаються умовно незалежними, звідси й 
визначення “наївні”. 
Дослідження PMC було розроблено для проведення комплексного огляду 
наївної байєсівської мережі та її використання для прогнозування захворювань. 
Метою цього дослідження було переглянути опубліковані докази використання 
наївних класифікаторів Баєса для прогнозування захворювань, щоб показати 
потужність цього методу в порівнянні з іншими методами. Більше того, наскільки 
нам відомо, це перше дослідження, яке безпосередньо порівнює наївні 
класифікатори Баєса з іншими моделями для прогнозування захворювань. 
Використанням наївних класифікаторів Баєса прагнуть покращити 
лікування захворювань, а також їх діагностику на ранніх стадіях для швидшого та 
якіснішого лікування.  
Під час аналізу PMC обрали статті, та дослідження, що були написані до 
2015 року, в яких показано перевагу класифікатора баєса, над іншими алгоритмами 
класифікації. Згідно з отриманими результатами наївний класифікатор Баєса 
демонструє точність на рівні 80-82%, регресія часткових найменших квадратів 
показала точність на рівні 71%, метод опорних векторів показав точність 83% 
частина таблиці PMC продемонстрована на рисунку 2.1.3. 
30 
 
 
Рисунок 2.1.3 – Компіляція досліджень точності різних алгоритмів машинного 
навчання в сфері медичної діагностики, зібрана дослідниками з PMC [10] 
Якщо ж звернути увагу на нові дослідження, для прикладу стаття Гаурава 
Сінгха Негі “Система медичних рекомендацій на основі машинного навчання для 
раннього прогнозування захворювань та персоналізованого лікування”, то можна 
зробити висновки, про потенціал збільшення точності моделі наївного Баєса, що, 
за даними цієї статті, досягла точності у 96%[11]. Зважаючи на такі переваги 
наївних класифікаторів Баєса, як відсутність проблеми перенавчання і здатність 
моделі працювати з величезними обсягами даних – такий стрибок у точності і не є 
дивним, адже при правильній підготовці даних, їх нормалізації, та великих об’ємах 
наївний класифікатор Баєса дійсно може досягати неабиякої точності. 
2.1.3. Модель KNN 
Алгоритм k -найближчих сусідів (KNN) – це алгоритм машинного навчання 
з учителем, який переважно використовується для цілей класифікації. Він широко 
використовується для прогнозування захворювань. Як правило, алгоритм KNN 
здатний класифікувати набори даних, використовуючи навчальну модель, подібну 
31 
 
до тестового запиту, враховуючи k найближчих точок навчальних даних, тобто 
сусідів, які є найближчими до тестованого запиту. Нарешті, алгоритм використовує 
правило голосування більшості, щоб класифікувати об’єкт. Серед усіх алгоритмів 
машинного навчання алгоритм KNN є однією з найпростіших форм і широко 
використовується в задачах класифікації, оскільки він має дуже адаптивну та 
зрозумілу конструкцію.  Алгоритм відомий своїм використанням у вирішенні задач 
регресії та класифікації для даних різного розміру, кількості міток, рівнів шуму, 
діапазонів та контекстів. 
Алгоритм є простим у своїй роботі та обчисленнях. Він надає можливості 
модифікації в різних аспектах, щоб зменшити свої обмеження та проблеми, а також 
підвищити свою точність і застосовність для використання в ширшому спектрі 
наборів даних. Класичний алгоритм KNN страждає від різних обмежень, які 
знижують його класифікаційні здібності, таких як неупередженість до всіх своїх 
залежних від класифікації сусідів, відсутність ознак розрахунку відстані між 
точками даних та врахування непотрібних ознак набору даних. Однак, оскільки 
KNN адаптується до численних модифікацій, це призводить до появи різних форм 
або варіантів KNN. Варіанти KNN відрізняються різними алгоритмічними 
аспектами, такими як оптимізація параметра k , покращення розрахунків відстані, 
додавання ваги до різних точок даних та скорочення навчальних наборів даних для 
вирішення проблем, згаданих раніше. Приклад візуалізації роботи алгоритму 
представлений на рисунку 2.1.4. 
32 
 
 
Рисунок 2.1.4 – Візуалізація класифікатора KNN [11] 
Алгоритм не використовується широко в задачах медичної діагностики. 
Дослідження його застосування обмежені на момент 2022 року немає великої 
кількості розроблених і якісних прикладів застосування, мета дослідження  PMC на 
цю тему демонструє декілька моделей, розоблених для прогнозування ризиків 
серцевого нападу, ризиків ускладнень, ранньої діагностики хвороб нирок, діабету, 
та серцевої недостатності. Таблиця точності різних моделей KNN на різних наборах 
даних представлений на рисунках  2.1.5 і 2.1.6. Короткий опис надорів даних для 
навчання описаний на рисунку 2.1.7. 
33 
 
 
Рисунок 2.1.5 – Точність різних підходів класифікаторів KNN на декількох 
медичних наборах даних[11] 
 
Рисунок 2.1.6 – Точність різних підходів класифікаторів KNN на декількох 
медичних наборах даних з різними метриками[11] 
34 
 
 
Рисунок 2.1.7 – Опис наборів даних для навчання моделей KNN [11] 
З отриманих результатів видно, що в деяких випадках алгоритм к 
найближчих сусідів може демонструвати високу точність, однак набори даних, на 
яких навчалась модель є невеликими, до того ж ідсутня пряма кореляція методу і 
точності, тобто від чого саме залежить якість моделі залишається невідомим. 
2.1.4. Нейронні мережі 
Глибоке навчання революціонізувало аналіз медичних зображень, 
пропонуючи можливість автоматизованих, ефективних та високоточних 
діагностичних рішень. Використання візуалізації для діагностики в охороні 
здоров'я є значним і становить близько 100 мільярдів доларів США на рік у світі. 
Зростаючий тиск на заклади охорони здоров'я та ринок візуалізації призвів до 
зростання вимог до діагностичної якості в клінічних умовах через зростання 
35 
 
кількості клінічних зображень, більшу складність зображень та швидші результати, 
яких вимагають клініцисти. 
Глибоке навчання – це підгалузь машинного навчання, яка використовує 
архітектуру нейронних мереж для отримання знань з великих наборів даних та 
виконання складних операцій. Однією з головних переваг методів глибокого 
навчання є їхня здатність імітувати складність обробки інформації людським 
мозком. Ця галузь вивчається з 1980-х років, але набула популярності тільки 
нещодавно. Це пов'язано з доступом до великих наборів даних для навчання 
моделей, покращеною розробкою алгоритмів та підвищеною обчислювальною 
потужністю мікропроцесорів. Структура нейронної мережі – це взаємозв'язок 
вузлів, або нейронів, який може охоплювати до кількох шарів, залежно від 
складності завдань та можливостей апаратних ресурсів. Кожен вузол збирає 
інформацію з попереднього шару, а потім передає її наступному шару на основі 
налаштованих характеристик та встановлених параметрів. Значення 
використовуваних параметрів зазвичай спочатку рандомізуються, але потім 
ітеративно оновлюються під час навчання на основі встановленої швидкості 
навчання. 
Глибоке навчання знайшло широке застосування в аналізі медичних 
зображень. Воно використовувалося для різних методів медичної візуалізації, 
включаючи рентгенівські знімки, комп'ютерну томографію, ультразвукові 
дослідження та магнітно-резонансні томографії, для забезпечення прогнозної 
діагностики та лікування. Тонкі та складні закономірності, представлені на рисунку 
2.1.8, ефективно ідентифікуються за допомогою адаптованого підходу глибокого 
навчання, тим самим забезпечуючи засоби для автоматизації процесу вилучення 
ознак. Вилучення або вибір ознак зображення – це процес, який може виконуватися 
вручну кваліфікованим спеціалістом, але це може бути трудомістким та 
суб'єктивним. Коли моделі глибокого навчання належним чином навчені, вони 
здатні точно ідентифікувати ураження або пухлини, досліджувати мембрани та 
тканини на наявність відмінностей та виконувати різноманітні завдання, пов'язані 
з медициною, тим самим забезпечуючи прискорені діагностичні результати 
36 
 
 
Рисунок 2.1.8 – Демонстрація схеми використання нейронних мереж в сфері 
медицини[13] 
Незважаючи на значний прогрес та можливості методів глибокого навчання 
в аналізі медичних зображень, існують певні обмеження та проблеми в їх 
впровадженні та прийнятті. Наприклад, більшості алгоритмів глибокого навчання 
часто бракує пояснимості, тобто важко передбачити процес навчання, а на великих 
нейронних мережах майже неможливо, спеціалісти інколи жартома порівнюють це 
з магією. У медичній галузі, де для діагностики та призначення лікування потрібні 
процеси прийняття рішень, метод глибокого навчання згорткових нейронних 
мереж, наприклад, не дає розуміння того, як було прийнято рішення. 
Також існує проблема перенавчання під час навчання. Перенавчання 
призводить до низької точності під час навчання глибоких штучних нейронних 
мереж у розпізнаванні зображень, які не включені до їхнього навчального набору 
даних, навіть якщо зображення в навчальному наборі могли бути правильно 
розпізнані. Це має кілька можливих причин, включаючи недостатню кількість 
навчальних прикладів для забезпечення адекватного узагальнення та надмірні 
параметри моделі для архітектури 
Ще виникає проблема анотації зображень. Багато алгоритмів глибокого 
навчання є контрольованими, тобто вони вимагають маркування зображень із 
зазначенням їхніх категорій під час фази навчання. Маркування вимагає анотації 
зображень кваліфікованими лікарями. Оскільки глибоке навчання вимагає великих 
37 
 
наборів даних для навчання, цей процес може бути проблематичним через брак 
потрібної кількості спеціалістів і великими об’ємами роботи 
Складність обміну даними та малі набори даних. Медичних даних, зібраних 
однією установою, може бути недостатньо для ефективного навчання алгоритмів 
глибокого навчання, тому потрібен буде обмін між багатьма установами. Однак це 
може бути складним через регуляторні, технічні та конфіденційні проблеми, а 
також фінансові та часові обмеження. 
Згорткові нейронні мережі були домінуючою методикою аналізу медичних 
зображень для діагностичних, приклад згорткової нейронної мережі показано на 
рисунку 1.2.9. 
 
Рисунок 1.2.9 – Ілюстрація структури згорткової нейронної мережі. 
Концепція згортання – це просто математична операція, де фільтр, також 
відомий як ядро, застосовується до вхідного зображення для вилучення ознак. Коли 
алгоритм згорткової нейронної мережі використовується для цілей класифікації, 
він поєднується з іншими шарами, такими як шари активації, шар об'єднання та 
шар повного зв'язку. Потім шар об'єднання застосовується до виходу шарів 
активації. Ефект операції об'єднання полягає у зменшенні просторових розмірів, 
отриманих в результаті операції згортки, і таким чином допомагає мережі 
38 
 
фіксувати невеликі переміщення в наборі даних. Цей процес також допомагає 
зменшити обчислювальну складність мережі.  
Науковці з PulmoNet розробили модель CNN для розрізнення доброякісних 
та злоякісних пухлин за допомогою зображень радіального ендобронхіального 
ультразвуку. Загалом 769 зображень було зібрано з лікарень Тайваню для навчання 
моделі та внутрішньої валідації, а також 300 та 92 зображення з двох інших 
лікарень, використані для зовнішньої валідації. Модель була навчена методами 
доповнення зображень для підвищення її надійності. Внутрішня валідація показала 
високу продуктивність з 88% точності. Таблиця з демонстрацією отриманої 
точності моделі зображено на рисунку 2.1.10. Загалом, модель виявилася 
перспективною для сприяння діагностиці раку легень. 
 
Рисунок 2.1.10 – Таблиця точності моделі згорткової нейронної мережі, 
розробленої спеціалістами PulmoNet для діагностики раку легень.[14] 
Отож, нейронні мережі в сфері медицини активно застосовуються вже 
протягом тривалого часу, їх використання зумовлене високою точністю, та 
ефективністю, однак і вони не позбавлені проблем, як от перенавчання і висока 
потреба в трудових і фінансових ресурсах для навчання. Сфера їх використання 
часто зводиться до аналізу зображень та діагностика на основі цього аналізу. 
2.1.5. Модель логістичної регресії 
Логістична регресія це одна з основоположних моделей машинного 
навчання для сфери медецини. Логістична регресія здатна добре обробляти складні 
39 
 
взаємозв’язки факторних даних і саме здатність логістичної регресії обробляти 
нелінійні дані, а медицина це, майже завжди, нелінійні дані, робить її важливою в 
медичній діагностиці. 
Логістична регресія, зазвичай використовується в задачах з дихотомічним 
результатом, тобто задачі з можливими відповіддями “так”, або “ні”, в нашому 
випадку “хворий”, або “здоровий”, однак існує модифікація логістичної регресії 
“софтмакс”, або мультиномінальна логістична регресія. Софтмакс модифікація 
дозволяє використовуати логістичну регресію для мультикласового аналізу, для 
прикладу для діагностування великої кількості хвороб. 
Дослідники з PMC, розробили декілька моделей на основі логістичної 
регресії. Модель TREAT метою якої було прогнозування раку легень у пацієнтів з 
невизначеними легеневими вузликами, які звернулися до клініки торакальної 
хірургії, що входить до групи населення з високою поширеністю раку легень. 
Модель клініки Mayo має ту саму мету – прогнозування раку легень при легеневих 
вузликах; однак вона була розроблена для пацієнтів, які звернулися до будь-якої 
амбулаторної клініки з легеневими вузликами, що входить до групи населення з 
нижчою поширеністю раку легень (40%) порівняно з тією, що оцінюється 
хірургами (66%). Обидві моделі мають переваги як прогностичні моделі, але вони 
узагальнюються для різних клінічних умов та контекстів. Точність створених 
моделей продемонстровано на рисунку 2.1.11. 
Моделі логістичної регресії часто використовуються в медецині і 
демонструють непогані результати. Вони використовуються для дихотомічних 
задач діагностики і прийняття рішень, однак існують модифікації цього метода, що 
можуть розкрити його потенціал ще і в задачах мультикласової класифікації. 
40 
 
 
Рисунок 2.1.11 – Демонстрація точності моделей логістичнох регресії для 
діагностування раку на ранніх стадіях [15] 
2.2. Вплив LLM на прийняття соціумом використання машинного 
навчання і нейромереж в медицині 
Технологічний прогрес завжди викликає невдоволеність у певних груп 
людей. Під час промислової революції представники робітничого класу 
побоювалисьЮ що парові машини зроблять їх роботу непотрібною, однак 
насправді той прорив створив сотні нових ніш і дав можливість кратно збільшити 
41 
 
економіку країн, що використали цю можливість, однак з ШІ та нейромережами в 
контексті медицини все інакше. Люди використовують ЛЛМ, як персональних 
психологів, розповідають ШІ про свої найпотаємніші проблеми і дослухаються до 
його слів, незважаючи на постійне галюцинування і можливу упередженість, про 
які, мабуть кожен знає, однак продовжує використовувати ШІ для самодіагностики.  
Дослідження ШІ ринку в сфері медицини від компанії “Vention” вказують 
на поширене використання ЛЛМ лікарями в США <Дванадцять відсотків дорослих 
у США кажуть, що їхні медичні працівники наразі використовують штучний 
інтелект для діагностики, лікування або спілкування з пацієнтами, але 66 відсотків 
очікують, що штучний інтелект відіграватиме більшу роль в охороні здоров'я 
протягом наступних п'яти років>[16]. Те ж дослідження вказує на те, що 80% 
американців вважають, що використання штучного інтелекту може значно 
покращити сферу медичного обслуговування, ба більше 25% американців не 
звернулися б до медичного спеціаліста, що не використовує штучний інтелект, 
дослідження проводилось 2023 року, результати 2022 року кардинально 
відрізняються від результатів 2023 року, адже тоді 60% опитуваних респондентів 
навпаки не довіряли б лікареві, що використовує штучний інтелект, також в 
дослідженні 2022 року більшість респондентів вважали, що штучний інтелект буде 
мати незначний вплив, при впровадженні його у сферу охорони здоров’я. В 
дослідженні 2025 року, що демонструє для чого найчастіше люди використовують 
штучний інтелект, на першому місті знаходтья психологічна терапія,тобто 
використання великих мовних моделей, як психологів, а медичні консультації 
опинилия на 26 місці, що на два пункти вище, ніж минулого року[17], рейтинг 
популярних тем запитів для штучного інтелекту показано на рисунку 2.2.1. Це дцже 
цікава статистика, адже до появи великих мовних моделей люди також часто 
використовували інтернет технології для самодіагностики, однак раніше це були 
пошукові системи. Більше 70% користувачів мережі інтернет використовували 
“гугл доктора” для самодіагностики, проте довіри до такого діагностичного методу 
було небагато. В часи до появи великих мовних моделей самодіагностика за 
допомогою інтернет бравзерів призводила до появи у людей тривожності, через 
42 
 
невиправдано негативний результат, до прикладу задавши запит “біль у горлі” ви 
могли отримати статті про рак горла. За дослідженнями PMC 64% людей, що 
вдавались до подібної діагностики отримували як результат пошуку інформацію 
про невиліковні хвороби, що і спричиняло виникнення тривожності. 
 
Рисунок 2.2.1 – Топ 100 тем, які обговорюють користувачі з великими мовними 
моделями в 2025 році, порівняно з 2024[17]. 
Тож, що могло стати причиною тотальної довіри людей до використання 
великих мовних моделей, як засобу медичної діагностики, самолікування і 
психологічної допомоги? Основна причина це гуманізація, тобто в той час, коли 
інтернет бравзер за запитом видає список найбільш клікабельних запитів, що часто 
є “канцерогенними”, Велика мовна модель створює ілюзію емпатичного, живого 
спілкування з гуманізованим аналізом проблеми з гарно сформульованим 
43 
 
діагнозом і набором пропозицій, що в свою чергу значно знижує когнітивне 
навантаження на користувача, тобто великі мовні моделі в сценарії використання 
для медичного аналізу є комфортними для користувача. 
Комфорт у використанні великих мовних моделей, як спосіб медичної 
діагностики пояснює чому саме найчастіше люди використовують його для 
психологічної самодопомоги. Відсутність соціального і будь якого іншого тиску на 
користувача, з тієї причини, що в такій діагностиці просто немає іншої людини, при 
цьому емпатичні і гуманізовані відповіді і створюють цю довіру до штучного 
інтелекту в найінтимніших питаннях, пов’язаих з особистим здоров’ям. 
Зростання довіри до великих мовних моделей в питаннях самодіагностики 
створює прямі клінічні ризики. Штучний інтелект може помилково заспокоїти 
користувача, що може призвести до несвоєчасного звернення до лікаря по 
кваліфіковану допомого, особливо це є критичним, коли користувач знаходиться в 
гострому станів, однак з кожною новою версією великих мовних моделей в них 
вшиваються обмежувачі, що в контексті самодіагностики завжди будуть радити 
звернутись за кваліфікованою допомогою до лікаря, що, теоретично, може 
мінімізувати подібні негативні випадки. 
Легітимізація використання штучного інтелекту в медицині в соціальному 
контексті, можна вважати, що вже сталась, однак в регуляторному контексті лише 
почали розробляти норми і обмеження для застосування штучного інтелекту і 
великих мовних моделей в сфері охорони здоров’я. Європейське агенство з 
лікарських засобів (EMA) вже зараз реалізовує програму розробки рекомендацій та 
обмежень на використання штучного інтелекту в сфері охорони здоров’я[19], 
програму планують завершити в 2028 році. 
Отже, великі мовні моделі мають безпосередній вплив на прийняття 
соціумом використання нейромереж, щтучного інтелекту, великих мовних моделей 
та методів машинного навчання в сфері охорони здоров’я. Основними причинами 
такого впливу є здатність великих мовних моделей мімікрувати гуманізоване, 
емпатичне, та безпечне спілкування, змога демонструвати непогані результати 
діагностики і надавати якісні поради, що часто допомагають людям, особливо в 
44 
 
контексті психологічних проблем. Питання інтеграції та соціальної довіри до 
використання штучного інтелекту в сфері медицини є проблематичним, однак вже 
розробляються механізми регуляції, що дозволяє стверджувати про незворотність 
процесу цих технологій в сферу охорони здоров’я. 
2.3. Дослідження якості традиційного медичного діагностування, 
створення критерій, яким повинні відповідати запропоновані методи аналізу 
Точність, або якість медичної діагностики це основа для якісного лікування, 
а отже основне джерело довіри пацієнтів. В цьому розділі ми пропонуємо 
розглянути наявну стасистику клінічних помилок, для розуміння того, наскільки 
якісно живі лікарі проводять діагностику пацієнтів і зрозуміти яка точність 
необхідна моделям машинного навчання для того, щоб був сенс їх застосування. 
Складність подібного аналізу полягає в тому, що медичні заклади часто 
приховують дані по точності діагностики, щоб запобігти репутаційних втрат, однак 
2015 року вийшло дослідження від “NIH”, яке узагальнено аналізує показники 
точності діагностування в США. В дослідженні виділяють чотири основні види 
помилок: діагностична помилка, лікувальна помилка, профілактична помилка і вид 
помилок “інша помилка”. Визначення діагностичної помилки формується, як: 
«діагноз, який був ненавмисно затриманий (раніше було доступно достатньо 
інформації), неправильний (інший діагноз був поставлений раніше за правильний) 
або пропущений (діагноз так і не був поставлений), судячи з остаточного 
оцінювання більш точної інформації»[20].  При чому діагностичні помилки 
поділяються на 2 класи, перший клас це помилки, що безпосередньо вплинули на 
процес лікування і призвели до незворотніх наслідків і другий тип це, грубо кажучи 
несерйозні помилки, що вплинули на лікування пацієнта не критичним чином. 
 Проведення досліджень патологоанатомічних випадків дозволяє приблизно 
оцінити відсоткову кількість помилок першого та другого класу в діагностуванні 
лікарів США, при діагностиці важко хворих пацієнтів. Посмертні дослідження 
були описані як важливий метод виявлення діагностичних помилок. У своєму 
45 
 
огляді даних посмертного дослідження дослідники дійшли висновку, що «розтин 
продовжує виявляти важливі помилки в клінічній діагностиці». У середньому 10 
відсотків посмертних досліджень були пов'язані з діагностичними помилками, які 
могли вплинути на результати лікування пацієнтів, тобто помилки першого класу. 
Вони оцінили, що поширеність основних помилок, тобто помилок I та II класу, 
пов'язаних з основним діагнозом або причиною смерті, становила 25 відсотків. 
Деякі випадкові знахідки, виявлені під час посмертного дослідження, не слід 
класифікувати як діагностичні помилки; першочергове значення має виявлення 
діагностичних помилок, які сприяли смерті пацієнта (помилки I класу). Вчені 
зазначили, що деяка упередженість відбору відображається в цій оцінці, оскільки 
випадки, в яких була більша невизначеність щодо діагнозу, мали більшу 
ймовірність пройти посмертне дослідження. Систематичний огляд діагностичних 
помилок у відділенні інтенсивної терапії показав, що 8 відсотків посмертних 
досліджень виявили помилку I класу, а 28 відсотків виявили принаймні одну 
діагностичну помилку. На основі своїх висновків вони підрахували, що серед 850 
000 осіб, які помирають у лікарнях США щороку, приблизно 8,4 відсотка (71 400 
смертей) мають серйозний діагноз, який залишається невиявленим.[20] 
В іншому дослідженні 2012 року, замість того, щоб зосереджуватися 
виключно на побічних ефектах, дослідники попросили чотирьох терапевтів 
переглянути 247 медичних карток пацієнтів із симптомами задишки. Оглядачі 
використовували анкету для виявлення недоліків у діагностичному мисленні, 
діагностичних помилок та шкоди. Вони виявили, що недоліки в діагностичному 
мисленні траплялися у 66% випадків, діагностичні помилки – у 13,8% усіх 
випадків, а пацієнту було завдано шкоди – у 11,3% випадків. Хоча у випадках з 
діагностичними помилками та шкодою для пацієнта було більше недоліків у 
діагностичному мисленні, у 4% випадків діагностичні помилки траплялися за 
відсутності недоліків у діагностичному мисленні.[20] 
У сфері якості та безпеки покращення у вимірюванні як процесів, так і 
результатів якості стали можливими завдяки ширшому використанню медичних 
інформаційних технологій та баз даних про страхові виплати медичного 
46 
 
страхування протягом останніх кількох десятиліть. Наприклад, бази даних про 
страхові виплати медичного страхування, пов'язані з перевіреними федеральними 
реєстрами смертей, зробили можливим вимірювання 30-денної смертності від 
гострого інфаркту міокарда, серцевої недостатності та пневмонії, які вважаються 
результатами якості медичного обслуговування. Подібні бази даних забезпечують 
основу для вимірювання показників якості процесу медичного діагностування. Є 
кілька прикладів використання цих даних для дослідження діагностичних 
помилок. Дослідник Ньюман Такер та його команда в 2012 році виявили пацієнтів, 
які були госпіталізовані з діагнозом інсульту, які протягом попередніх 30 днів 
лікувалися та виписувалися з відділення невідкладної допомоги через симптоми, 
що відповідають інсульту. Вони виявили, що 12,7% госпіталізацій з приводу 
інсульту відображали потенційно пропущені діагнози інсульту, а 1,2% – ймовірні 
пропущені діагнози. Ці показники свідчать про те, що у Сполучених Штатах 
щорічно пропускається від 15 000 до 165 000 випадків інсульту, причому ризик 
пропущених діагнозів вищий серед молодших жінок, пацієнтів та білих пацієнтів. 
Дослідники зазначають, що їхні оцінки діагностичної помилки є скоріше 
припущеннями, ніж підтвердженням через брак клінічних деталей у заявах на 
медичне страхування.[20] 
Слід врахувати ще загальну якість системи охорони здоров’я в Сполучених 
штатах, адже, за даними “Global Health Security Index 2019” якість медицини в 
США знаходиться на першому місця в рейтингу, рейтинг країн за якісттю 
медичного обслуговування продемонстровано на рисунку 2.3.1. 
47 
 
 
Рисунок 2.3.1 – Рейтинг якості медичного обслуговування в країнах світу[21]. 
Зважаючи на результати дослідження можна зробити висновок про 
необхідність покращення медичної діагностики. Зменшення кількості 
діагностичних помилок дозволить мінімізувати витрати, спричинені судовими 
позовами, та, що найголовніше, зберегти життя пацієнтів. Оцінюючі наведені дані 
досліджень можна визначити максимально допустиму похибку в діагностуванні на 
рівні 25% і цільову, яка повинна складати більше 10%, що допоможе наблизити 
менш розвинуті країни в медичній сфері до еталонних систем охорони здоров’я 
світу. 
48 
 
2.4. Підбір і аналіз моделей, що можуть бути застосовані для вирішення 
задачі діагностування захворювань 
2.4.1. Переваги моделі наївного класифікатора Баєса 
Метод класифікації “наївний Баєс” базується на теоремі Баєса і вважає, що 
всі ознаки є незалежними один від одних, приклад зображено на рисунку 2.4.1., що 
надає як переваги, так і недоліки. До переваг цієї моделі можна віднести швидкодію 
як в навчанні моделі, так і в прогнозуванні. Наступною перевагою можна вважати 
відсутність проблеми перенавчання, що важливо для задачі, яку ми розв’язуєм, 
також обраний набір даних не є збалансованим, що також не є перепоною для 
методу наївного Баєса. До недоліків можна віднести саме незалежність ознак, адже 
часто діагностика це аналіз загальної картини та пошук патернів у взаємозв’язках 
між симптомами. 
Зважаючи на дослідження у підрозділі 2.1.2. в питаннях діагностики 
захворювань модел наївного Баєса демонструє високу точність, що підходить під 
наші вимоги. Алгоритм наївного Баєса вже використовували в подібних задачах до 
нашої, отже у разі використання цього алгоритму ми можемо отримати хороші 
результати. Також в подібних дослідженнях метод наївного Баєса демонструє 
потенціал до збільшення точності. Варто зазначити, що результати використання 
цього методу часто вирізнються вищою точністтю, ніж у порівнюваних методів. 
  
49 
 
 
Рисунок 2.4.1 – Теорема Баєса, що використовується в класифікаторі 
наївного Баєса[22] 
2.4.2. Переваги моделі градієнтного підсилювання на базі дерев рішень 
Модель градієнтного підсилення на базі дерев рішень повинна 
демонструвати вищу точність, ніж модель випадкового лісу, особливо на простих 
табличних даних. Ця модель є ансамблевою, вона створює групу дерев рішень, які 
коригують результати один одного, що допомагає краще працювати зі складними, 
нелінійними даними. До переваг методу також можна віднести кращу швидкодію, 
та простішу архітектуру, в порівнянні з методом випадкового лісу, що повинно 
мати позитивний вплив на розмір моделі. 
Знайти якісне дослідження використання цього методу на симілятивних 
задачах до нашої не вдалось, однак опис моделі та її можливі переваги, на нашу 
думку, є достатнім аргументом для її звстосування. 
2.4.3. Переваги моделі випадкового лісу 
Модель випадкового лісу є розширенням методу дерева рішень і 
відноситься до ансамблевих методів, тобто таких, що утворюють складну систему 
з багатьох простих систем, які входять в цю структуру, візуалізація моделі 
продемонстрована на рисунку 2.4.2. Модель випадкового лісу являє собою декілька 
50 
 
дерев рішень, кожне з яких будується на підмножині з множини навчальних даних, 
всі результати яких узгоджуються між собою для прийняття більш виваженого і 
збалансованого рішення. На відміну від дерева рішень цей метод є стійким, тобто 
у випадку повторного навчання з розширеними навчальними даними шанс того, що 
модель втратить свою точність є низькою. Плюсом цієї моделі також є її 
пристосованість до обробки великих наборів даних з великою кількістю ознак, 
тобто цей метод може дуже добре підійти для вирішення саме нашої задачі. До 
недоліків методу випадкового лісу однозначно можна віднести швидкодію роботи 
моделі і її розмір, що при розробці програмного забезпечення може негативно 
вплинути на зручність користування програмою, однак в цій темі, всеж, головним 
фактором є точність і надійнісь. Також існує проблема упередженості моделі, вона 
може ігнорувати ознаки, що рідко зустрічаються і навпаки, занадто сильно звертати 
увагу на ознаки, що трапляються найчастіше, що може критично вплинути на 
точність моделі в питаннях діагностики рідкісних випадків захворювань. 
 Зважаючи на попередні дослідження можна помітити, що в 
багатокласовому аналізі ці моделі майже не використовуються, однак вони 
використовуються в складній медичній діагностиці, також їх здатність працювати 
з великими масивами даних створює імовірність, що його використання для задачі 
мультикласового аналізу може бути персективним. 
 
Рисунок 2.4.2 – Візуалізація методу випадкового лісу[22] 
2.4.4. Переваги моделі логістичної регресії 
Логістична регресія це модель, що використовує для прогнозування 
ймовірностей бінарні дані та логістичну функцію для моделювання результату в 
51 
 
1
межах від [0, 1], тобто: �� =  (�� +�� �� +⋯ ) , навчання моделі полягає в підборі 
1+�� 0 1 1
коефіцієнтів ���� досягнення максимальної правдоподібності результату. 
Використовувати в роботі ми будемо модифіковану, мультиномінальну версію 
логістичної регресії, що, по суті є ансамблевим методом, так як вона складається з 
декількох логістичних регресій, точніше по одній для кожного класу, кожна модель 
обраховує імовірність появи кожного з класів, на основі чого найбільш імовірний 
клас буде результатом. Перевагою такої моделі є те, що вона чудово підходить для 
роботи з бінарними даними, а також її швидкодія, що на відміну від інших 
ансамблевих моделей є високою. Мінусом виступає те, що модель припускає 
незалежність кожного аналізу, що може негативно вплинути на прогнозування у 
випадку наявності симптоматично схожих хвороб. 
Попередні дослідження показують, що логістична регресія широко 
використовується в медичній діагностиці і може демонструвати непогані 
результати. Також наявність мультиномінальної модифікації надає нам 
перспективну можливість застосування цієї моделі для поставленої задачі. 
2.4.5. Переваги моделі KNN 
Метод KNN є простим для інтерпретування прийнятих рішень, що при 
створенні точної моделі може допомогти в пошуку нових закономірностей в сфері 
медичного діагностування. Метод KNN чудово пристосований для обробки 
нелінійних даних, також він є швидким у навчанні, що, у разі створення якісної і 
точної моделі надасть змогу швидко і ефективно її покращувати. Метод підходить 
для мультикласових задач, однак потрібно приділити увагу попередньому підбору 
параметрів для навчання. 
Попередні дослідження показують, що метод KNN здатен досягати високої 
точності на невеликих наборах даних, однак на великих наборах медичної 
інформації його не навчали, або ж таких досліджень знайдено не було. 
52 
 
2.4.6. Переваги нейронних мереж 
Нейронні мережі є найбільш гнучким і точним класом моделей сьогодення. 
Нейронні мережі складаються з шарів, вхідного, прихованих і вихідного, 
продемонстровано на рисунку 2.4.3. Вхідний шар приймає в себе дані, приховані 
шари послідовно, шар за шаром змінюють дані, коригують їх за допомогою ваг і 
вихідний шар формує готовий результат. Навчаються нейронні мережі ітераційно, 
за допомогою методу зворотнього поширення помилки, змінюючи ваги 
прихованих шарів з кожною ітерацією, цим самим коригуючи результат. 
  
Рисунок 2.4.3 – Візуальна демонстрація нейронної мережі[22] 
Переваг у використанні нейромереж для нашої задачі багато. Нейронні 
мережі, через свою багатошарову структуру, можуть захоплювати складну 
нелінійність даних, що може надати нам високу точність діагностики. Нейронні 
мережі чудово опрацьовують великі, складні набори даних і демонструють високу 
швидкість роботи. Проте такий підхід має і недоліки, для прикладу так звана 
проблема “чорного ящика”, тобто майже неможливо простежити за навчанням 
моделі і передбачити те, які саме закономірності вона зробить, що може негативно 
вплинути на точність аналізу і до виникнення “галюцинацій”. Також нейронні 
53 
 
мережі мають проблему перенавчання, водночас з потребою у великих наборах 
даних, для створення якісної моделі. 
Попередні дослідження показують, що нейронні мережі широко 
використовуються в медицині, демонструючи дуже високу точність, в порівнянні з 
класичними методами машинного навчання, також нейромережі позитивно 
сприймаються з соціальної точки зору, що може позитивно вплинути на простоту 
використання і впровадження цих методів в сферу охорони здоров’я. 
2.5. Висновки до розділу 2 
В цьому розділі ми провели дослідження використання нейронних мереж і 
алгоритмів машинного навчання в медицині і на реальних прикладах переконалися 
в перспективності цієї технології. Варто відзначити прогрес якості моделей, що був 
досягнутий в зв’язку з збільшенням об’ємів даних, а також швидкість 
прогресування точності моделей, яка зростає щороку. 
Також ми дослідили вплив великих мовних моделей на сприйняття 
соціумом використання технологій машинного навчання в сфері охорони здоров’я. 
Цей вплив важко переоцінити, адже ставлення до подібних технологій в медицині 
поліпшується з неймовірною швидкістю. Всього за рік часу люди мало того, що 
почали менше остерігатись штучного інтелекту, а і навіть почали прагнути 
лікуватись у спеціалістів, що ним користуються. Гуманізація і емпатичність 
великих мовних моделей є основною причиною цього процесу. 
Дослідження якості традиційної медицини було виконано частково, через 
брак даних і відсутність статистики, що надала б нам точну оцінку цього параметру, 
однак, зважаючи на наведену статистику, всеж можна зробити висновок про якість 
класичного підходу. Ми визначили цільову точність діагностування на рівні, як 
мінімум вище 75%, повністю задовільним результатом буде точність вище 90%. 
Підбір методів для виконання поставленої задачі базувався на попередніх 
дослідженнях в суміжній темі до нашої, а також на тому, чи вдалось в наведених 
прикладах досягти потрібної нам точності. 
54 
 
3. ПОРІВНЯЛЬНИЙ АНАЛІЗ КЛАСИФІКАЦІЙНИХ МОДЕЛЕЙ В 
КОНТЕКСТІ МЕДИЦИНИ 
Цей розділ присвячений розробці, та навчанню обраних раніше моделей. В 
результаті розробки ми зможемо оцінити рівень точності моделей, дати відповідь 
на запитання чи вдалось моделям досягти достатньої, або цільової точності, якщо 
ні, то чому не вдалось. Також ми оцінимо швидкодію кожної моделі, та зформуємо 
рейтингові оцінки моделям, базуючись на перерахованих вище критеріях. 
3.1. Розробка класифікаційних моделей для діагностування 
захворювань 
3.1.1 Розробка моделі класифікатора наївного Баєса 
Для розробки моделей був обраний набір даних “Disease-Symptom Dataset”, 
сертифікований “World bank group”, що включає в себе 246000 діагностованих 
клінічних випадків захворювань, 773 унікальні захворювання та 377 унікальних 
симптоми в форматі csv, повний опис набору даних розміщений в додатку Б. Було 
перекладено всі назви симптом та захворювань, закодували їх в числові значення, 
та стандартизували дані, щоб уніфікувати інтерпретацію результату для кожної 
моделі, тобто кожна модель буде навчатись на, загалом, ідентичному наборі даних, 
що спростить розробку та нтерпретацію результатів. 
 
55 
 
 
Рисунок 3.1.1 – Процес розподілу та нормалізації даних для навчання 
моделі класифікатора наївного Баєса. 
Модель класифікатора наївного Баєса не має проблеми перенавчання, при 
чому на її точність впливає кількість даних, тобто більша кількість семплів робить 
імовірнісний розподіл краще зваженим. Модель не має специфічних праметрів, для 
глибокого налаштування. 
 
Рисунок 3.1.2 – Навчання моделі класифікатора наївного Баєса, тестування моделі 
на навчальних даних, збереження моделі. 
56 
 
У результаті ми отримали точність діагностування на рівні 0.8674, якщо 
аналізувати найімовірніший прогноз і 0.9625, якщо аналізувати три найімовірніші 
прогнози.  
3.1.2 Розробка моделі логістичної регресії 
Для розробки моделі логістичної регресії було використано ті самі дані, 
однак логістична регресія вже має проблему перенавчання, тому дані було 
розділено на тренувальний і тестовий набір з співвідношенням 4:1. В наборі даних 
виникла проблема, адже деякі класи зустрічаються лише один раз, видалити ці дані 
ми не можем, адже це негативно вплине на користь програмного забезпечення для 
сфери охорони здоров’я, тому ми прийняли рішення провести оверсемплінг даних, 
тобто дублювання поодиноких класів, для запобіганню їх ігнорування моделями і 
усунення проблеми з навчанням. Дублювання може призвести до проблеми 
перенавчання, однак, зважаючи на розмір набору даних і на кількість 
продубльованих семплів, застосування техніки оверсемплінгу не повинно 
критично вплинути на точність, до того ж перевірка точності буде проходити на 
відокремленому наборі даних, що допоможе мінімізувати ризик перенавчання 
моделі. 
57 
 
 
Рисунок 3.1.3 – Розділення стандартизованих даних та застосування 
оверсемплінгу. 
 Для навчання моделі були використані параметри балансування класів, тобто 
не залежно від того скільки окремих семплів кожного класу буде містити 
навчальний набір даних, модель буде зважати на кожен окремий клас. 
Максимальну кількість проходів зважування, за допомогою сигмоїдної функції 
було встановлено на рівні 500, модель вимагає велику кількість проходів, для 
досягнення збіжності, через велику кількість класів. 
58 
 
 
Рисунок 3.1.4 – Навчання та тестування точності моделі логістичної регресії 
У результаті навчання модель показала точність діагностування на рівні 
0.8698, якщо аналізувати найімовірніший прогноз і 0.9634, якщо аналізувати три 
найімовірніші прогнози. 
3.1.3 Навчання моделі випадкового лісу 
Модель випадкового лісу є стійкою до перенавчання, однак ризики всеж є, 
тож ми виконали розділення даних, ідентичним чином, як і під час навчання моделі 
логістичної регресії. 
Емпіричним шляхом було обрано кількість дерев, у розмірі 20, адже 
збільшення кількості майже не мало впливу на точність, проте значно збільшувало 
складність і розмір моделі. Також ми обмежили мінімальну кількість семплів у 
вузлі до 20, це також не вплинуло на точність прогнозів моделі, але значно 
зменшило її розміри і складність. Ваги класів також були збалансовані, через вже 
описану проблему нерівномірносі класів. 
59 
 
 
Рисунок 3.1.5 – Навчання та тестування точності моделі випадкового лісу. 
 У результаті навчання модель показала точність діагностування на рівні 
0.8839, якщо аналізувати найімовірніший прогноз і 0.9728, якщо аналізувати три 
найімовірніші прогнози. 
3.1.4 Навчання моделі градієнтного підсилення на базі дерев рішень 
Для моделі градієнтногоо підсилення на базі дерев рішень було встановлено 
обмеження на максимальну кількість дерев в 500 одиниць, що при класифікації з 
великою кількістю класів має забезпечити високу точність. Контроль помилки був 
встановлений на рівні 0.05, значення низьке, навчання вимагатиме більше ітерацій, 
однак це мінімізує проблему перенавчання. Глибина дерев була обмежена до 6, 
адже для нашої задачі це є оптимальним обмеженням, по тій причині, що зі 
збільшенням глибини точність не зростає відчутно. Алгоритм побудови дерев 
використовує гістограми для вибору точок розділення семплів, цей алгоритм 
високоефективний саме для великих наборів даних, що підходить для нашого 
випадку. Також був обраний параметр ранньої зупинки, якщо точність суттєво не 
покращується протягом десяти операцій 
60 
 
 
Рисунок 3.1.6 – Навчання та тестування точності моделі градієнтного підсилення 
на базі дерев рішень. 
 У результаті навчання модель показала точність діагностування на рівні 0.91, 
якщо аналізувати найімовірніший прогноз і 0.9828, якщо аналізувати три 
найімовірніші прогнози. 
3.1.5 Навчання моделі нейронної мережі 
Для розробки була обрана архітектура згорткової нейронної мережі, адже 
емпіричним шляхом було доведено, що типова нейронна мережа з ідентичною 
кількістю нейронів в кожному шарі є менш точною і складнішою, при цьому 
демонструє меншу точність. Архітектурно модель складається з семи шарів. 
Вхідний шар має розмірність 377 нейронів, що дорівнює вектору ознак, тобто 
симптомів, в нашому випадку. Перший прихований шар складається з 1024 
нейронів з нелінійним активатором “Relu” для вивчення складних залежностей. 
Наступний шар проріджування, для запобіганню перенавчанню, встановлений на 
рівні 30%, тобто цей шар вимикає 30% нейронів попереднього шару, що змушує 
нейромережу менше покладптись на конкретний нейрон. Наступні два шари 
містять у собі 512 і 256 нейронів, відповідно, функція активатор також “Relu” і так 
само після кожного шару наявний шар проріджування. Вихідний шар складається 
з 773 нейронів, що дорівнює кількості класів, тобто захворювань із активаційною 
функцією “Softmax” для виведення нормалізованого вектору ймовірнісного 
розподілу. Алгоритм, що керує навчанням був обраний “Adam”, він має низьку 
61 
 
швидкість навчання, що робить його стабільнішим та дозволяє мережі точніше 
визначати глобальний мінімум. Для функції втрат була обрана метрика “Loss”, її 
зручно використовувати для оцінки мультикласової класифікації. Також ми 
оцінювали топ-3 точність, тобто як часто правильний діагноз опинявся серед трьох 
найбільш імовірних. Кількість епох 30, емпіричним шляхом було визначено, що 30 
є оптимальним параметром. Під час навчання дані були також розділені на 
тренувальні і тестові. 
 
Рисунок 3.1.7 – Навчання і архітектура нейронної мережі. 
У результаті навчання модель показала точність діагностування на рівні 
0.8623, якщо аналізувати найімовірніший прогноз і 0.9606, якщо аналізувати три 
найімовірніші прогнози. 
3.1.6 Розробка моделі KNN 
Для навчання моделі KNN дані так само були розподілені на навчальні і 
тренувальні, щоб мінімізувати шанс перенавчання. Емпіричним шляхом було 
встановлено, що класифікація по п’ятнадцяти “сусідах” є оптимальною. Також 
встановлений метод зважцування сусідів, що надає перевагу тим точкам, які 
знаходяться найближче. Через велику розмірність даних, зменшити яку не вдалося, 
62 
 
адже це сильно вплине на класифікацію рідкісних захворювань, що є неприпустимо 
в задачах подібного типу, в якості структури даних був обраний метод кульового 
дерева, що дає змогу значно прискорити обрахунок відстані, сама відстань 
рахується за класичним методом напряму, що також позитивно вплинуло на 
точність. 
 
Рисунок 3.1.8 – Навчання моделі KNN. 
У результаті навчання модель показала точність діагностування на рівні 
0.81, якщо аналізувати найімовірніший прогноз і 0.88, якщо аналізувати три 
найімовірніші прогнози. 
3.1.7. Статистична метамодель 
Через складність інтерпретації результатів було також прийняте рішення 
реалізувати “ ансамблеву метааналітичну” модель, яка буде навченою логістичною 
регресією на результатах прогнозу попередніх моделей, однак така модель вимагає 
високої обчислювальної потужності, та не може продемонструвати високу 
точність, навпаки її точність є нижчою, ніж в деяких інших моделей. Через описані 
вище недоліки було прийняте рішення створити статистичну компіляцію 
результатів всіх моделей, для спрощення інтерпретації результатів. Ця 
“метамодель” збирає імовірності передбачень всіх інших моделей і нормує їх за 
63 
 
значимістю, значимість кожної моделі дорівнює точності її прогнозування на рівні 
“Top 1”. 
 
Рисунок 3.1.9 – Реалізація “метамоделі”.  
64 
 
3.2 Аналіз точності моделей, та перевірка на відповідність вимогам 
Раніше ми визначили цільову точність класифікаційних моделей на рівні 
0.9, та мінімально необхідну на рівні 0.75, результати розробки показують, що всі 
моделі є достатньо якісними для застосування, адже всі моделі перетнули межу у 
0.75, також лише одна модель досягла цільової точності вище 0.9, як показано на 
рисунку 3.2.1. 
 
Рисунок 3.2.1 – Таблиця точностей навчених моделей 
Класифікатор наївного Баєса продемонстрував точність на рівні з моделями 
логістичної регресії, та нейронної мережі, також модель виявилась вищою за 
точністю, ніж метрична модель KNN. Варто зазничити, що серед всіх моделей 
наївний Баєс є найпростішою моделлю, та найменш вибагливим до 
обчислювальних ресурсів. Модель на рівні “Top 1” перетнула необхідну межу 
точності, а на рівні “Top 3” досягла цільового рівня точності. 
Логістична регресія за точністю трохи випереджає модель наївного Баєса, 
однак, при навчанні моделі виникала проблема нерівномірного розподілу даних, 
що могло негативно вплинути на підсумкову точність моделі. Для більш якісного 
навчання необхідне розширення набору даних реальними прикладами, та 
балансування класів, що може значно покращити точність. Модель також 
демонструє гарну швидкодію і не вимагає для роботи серйозних обчислювальних 
65 
 
ресурсів. Модель на рівні “Top 1” перетнула необхідну межу точності, а на рівні 
“Top 3” досягла цільового рівня точності. 
Модель випадкового лісу демонструє найвищу точність серед усіх 
класичних моделей машинного навчання. Модель є стійкою до перенавчаня і має 
велику кількість параметрів для оптимізації, також модель має великий потенціал 
до покращення архітектури і підвищення точності. Так само, як і логістична 
регресія модел має потенціал, обмежений недостатньо збалансованим набором 
даних. Попри найвищу точність у своєму класі модель, одночасно, є і “найважчою”, 
в контексті вимог до апаратного забезпечення, що обмежує її потенційну точність. 
Модель на рівні “Top 1” перетнула необхідну межу точності, а на рівні “Top 3” 
досягла цільового рівня точності. 
Градієнтне підсилення на базі дерев рішень є модифікацією моделі 
випадкового лісу, однак випереджає базову модель в кожному аспекті. Модель 
градієнтного підсилення на базі дерев рішень продемонструвала найвищу точність, 
серед усіх досліджуваних моделей. Також модель не вимагає надмірних 
обчислювальних потужностей. Так само, як і модель випадкового лісу модель має 
потенціал до підвищення точності шляхом розширення і балансування навчального 
набору даних. Модель на рівні “Top 1” досягла цільового рівня точності, а на рівні 
“Top 3” продемонструвала майже ідеальний результат. 
Згорткова нейронна мережа продемонструвала точність на рівні класичних 
моделей машинного навчання, чи навіть поступається їм. Причиною такого 
результату могла стати недостатня обробка навчального набору даних і недостатні 
дослідження архітектурних моделей. Зазвичай нейронні мережі демонструють 
значно вищу точність в порівнянні з моделями машинного навчання, однак і 
вимагають детальнішого підбору параметрів, та є більш вибагливими до 
обчислювальних ресурсів. Модель на рівні “Top 1” перетнула необхідну межу 
точності, а на рівні “Top 3” досягла цільового рівня точності. 
KNN продемонструвала найнижчі показники точності, серед усіх навчених 
моделей. Причиною цього може бути, знову ж таки, дизбаланс класів в 
навчальному наборі даних, а також розмірність навчального набору даних, 
66 
 
зменшити який неможливо, адже кожен сиптом є критично важливим для реальної 
медичної діагностики. Модель на рівні “Top 1” перетнула необхідну межу точності, 
а на рівні “Top 3” не змогла досягти цільового рівня точності. 
При практичному застосуванні “метамодель” цілком виконує свою 
функцію, спрощуючи інтерпретацію результатів формуванням нормованого 
списку можливих діагнозів. 
Підбиваючи підсумки, можна стверджувати, що модель градієнтного 
підсилення, та модель випадкового лісу демонструють найвищу точність при 
діагностуванні захворювань. Моделі наївного Баєса та логістичної регресії є 
найменш вибагливими до обчислювальних потужностей, використання нейронних 
мереж потребує більш комплексного підходу до навчання і створення архітектури, 
а модель KNN є непридатною до використання для цієї задачі. Підсумкова оцінка 
кожної моделі показана на рисунку 3.2.2. 
 
Рисунок 3.2.2 – Підсумкова оцінка всіх моделей. 
  
67 
 
3.3. Висновки до розділу 3 
В цьому розділі було проведено розробку та порівняльний аналіз шести 
класифікаційних моделей машинного навчання для діагностування захворювань на 
основі симптоматики пацієнтів. Було продемонстровано підготовку навчальних 
даних під час якої враховувались особливості кожної моделі. Емпіричним шляхом 
було підібрано параметри для кожної з моделей машинного навчання, та 
розроблена архітектура нейронної мережі. 
У результаті всі моделі досягли необхідної точності. Найточнішими 
виявились моделі градієнтного підсилення на основі випадкового лісу, та, власне 
модель випадкового лісу. З точки зору швидкодії найкращими виявились модель 
наївного Баєса, та модель логістичної регресії. Нейронна мережа та модель KNN 
показали себе негативно як з точки зору точності, так і з точки зору швидкодії. Ми 
також визначили можливі проблеми, що завадили моделям продемонструвати весь 
свій потенціал. Також, на основі проведених досліджень ми створили 
“метамодель”, яка виконує задачу спрощення інтерпретації результатів. 
  
68 
 
4. РОЗРОБКА ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ  
4.1 . Створення бази даних і інструментарію для робти програми 
Для повноцінного функціонування застосунку необхідно створити просту 
та ефективну базу даних, яка буде виконувати функції збереження, доступу і 
модифікації даних умовних пацієнтів. Ми прийняли рішення розробити базу даних 
на основі csv файлу, такий підхід є компромісним. Обраний формат бази даних 
зможе задовільнити всі вимоги на даному етапі розробки. Ми створили шість 
функцій, для роботи програми, функції додавання нового пацієнта, додавання 
нового симптома пацієнту, видалення пацієнта, знаходження симптом пацієнта за 
ключем, отримання списку пацієнтів і функцію, що векторизує симптоми пацієнтів 
для роботи моделей. 
Функція векторизації приймає симптоми обраного пацієнта і повертає їх у 
вигляді підготовленого вектора, для застосування моделей, функція ігнорує 
виникнення колізій, реалізація функції показана на рисунку 4.1.1. 
 
Рисунок 4.1.1 – Функція “Vector_Maker” 
 Функція додавання нового пацієнта приймає в себе ім’я нового пацієнта, 
перевіряє базу даних пацієнтів на наявність ідентичного імені, для запобіганню 
колізії, у разі, якщо пацієнта з ідентичним іменем не знайдено, вносить його ім’я в 
новий рядок файлу CSV реалізація функції показана на рисунку 4.1.2. 
69 
 
 
Рисунок 4.1.2 – Функція “Add_New_Patient” 
 Функція отримання даних всіх пацієнтів є допоміжною функцією для роботи 
інших функцій, вона повертає всі дані, що зберігаються в файлі CSV, реалізація 
функції продемонстрована на рисунку 4.1.3. 
 
Рисунок 4.1.3 – Функція “Get_All_Patient” 
 Функція видалення пацієнта за ключем, тобто за іменем, проводить пошук по 
всій базі даних і, у разі виявленя збігу, видаляє рядок, з конкретним пацієнтом, 
реалізація функції продемонстрована на рисунку 4.3.4. 
70 
 
 
Рисунок 4.3.4 – Функція “Delete_Patient” 
 Функція оновлення інформації про пацієнта проводить пошук потрібного 
пацієнта за ключем і додає до його симптомів новий симптом, реалізація функції 
продемонстрована на рисунку 4.1.4. 
 
Рисунок 4.1.4 – Функція “Uppdate_Patient” 
71 
 
 Функція отриманн імен всіх пацієнтів, потрібна для комфортного вибору 
пацієнта в графічній оболонці програми, повертає сортований за алфавітом список 
імен усіх пацієнтів, реалізація функції продемонстрована на рисунку 4.1.5. 
 
Рисунок 4.1.5 – Функція “Get_All_Patients_Names” 
 Функція отримання усіх симптомів пацієнта за ключем, ця функція виконує 
пошук потрібного пацієнта і формує список його симптом, для подальшого 
перетворення в вектор симптом, або для виведення на екран симптом пацієнта, 
реалізація функції показана на рисунку 4.1.6. 
72 
 
 
Рисунок 4.1.6 – Функція “Get_All_Patient_Sympthoms_Raw” 
 Під час тестування роботи функцій не було помічено жодних критичних 
вразливостей, розробка цих функцій задовільняє всі необхідні вимоги до 
модифікації бази даних, та дає змогу отримувати доступ до бази даних. 
  
73 
 
4.2 Створення графічної оболонки програми, та загальна оптимізація 
роботи програми 
Для реалізації графічної оболонки програми ми вирішили використати 
бібліотеку “Tkinter”. Tkinter це стандартна вбудована бібліотека python для 
створення графічного інтерфейсу користувача. Бібліотека дозволяє створювати 
текстові поля, кнопки, та багато інших віджетів, чого цілком достатньо для 
розробки нашої програми. Бібліотека має вбудований менеджер геометрії “Grid”, 
який чудово підійде для розташування всіх елементів програми. 
Ми Хочемо розбити вікно програми умовно на два блоки, в першому блоці 
користувач буде мати змогу модифікувати базу даних, тобто додавати пацієнта, 
видаляти, модифікувати, та демонструвати інформацію, також знизу має бути поле 
з підсумованою інформацією, за допомогою “метамоделі”, в іншому блоці будуть 
текстові поля, для виведення результатів класифікацій моделей Приблизна схема 
проблами продемонстрована на рисунку 4.2.1. Також, ми помітили, що 
завантаження деяких моделей триває доволі довго, тому завантажувати всі моделі 
ми будемо на початку запуску програми, додавши для зручності стартове вікно з 
шкалою прогресії, що буде поступово заповнюватись після завантаження кожної 
моделі.  
Логіка використання програми буде простою, користувач обирає зі списку 
потрібного пацієнта, або створює нового, за потреби, викликає функцію, що 
демонструє симптоматику пацієнта, форматує симптоми, що також будуть 
міститись у випадаючомусписку, обраний симптом можна буде натисканням 
відповідної кнопки додати до симптомів пацієнта, після проведення всіх 
підготовчих маніпуляцій користувач натискає кнопку “Аналізувати”, яка заповнює 
текстові поля результатами аналізу моделей, в полі для метааналізу компонуються 
результати всіх моделей і виводяться у форматі списку з імовірностями кожного 
діагнозу. 
74 
 
 
Рисунок 4.2.1 – Схематичне зображення цільового виду графічного інтерфейсу. 
Для початку ми розробили вікно з завантажуванням моделей, як і 
планувалось. Вікно демонструє прогрес підготовки всіх навчених раніше моделей 
до роботи. Зовнішній вигляд вікна продемонстрований на рисунку 4.2.2. 
75 
 
 
Рисунок 4.2.2 – Демонстрація роботи завантажувального вікна програми з 
візуалізацією прогресу. 
 Основне вікно програми ми рзділили на чотири стовбці і шість рядків, 
використовуючи “gridnet”, всі рядки мають однакову вагу, як і три перші стовбці, 
четвертий має збільшену вагу, для коректного відображення інформації в 
текстових полях. Перші чотири рядки і два стовбці складаються з інструментарія 
для маніпуляції даними, реалізовано два випадаючі списки з пацієнтами і 
симптомами, також там розташовані два текстових поля для демонстрації симптом 
пацієнта і для введення імені нового пацієнта, біля кожного поля розташована 
кнопка дії з вказаною дією в форматі надпису всередині кнопки. В двох нижніх 
рядках першого та другого стовбця розташоване поле, для виводу скомпільованої 
інформації  “метамоделі” і кнопка аналізу пацієнта. В третьому стовбці 
розташовані інформативні ярлики, що вказують яке саме поле заповнює кожна 
модель. Четвертий стовбець містить в собі шість полів, для виводу результатів 
аналізу кожної моделі, вигляд програми продемонстровано на рисунку 4.2.3, 
лістинг коду програми представлений в додатку В, інструкція користувача 
представлена в додатку А. 
76 
 
 
Рисунок 4.2.3 – Зовнішній вигляд створеного інтерфейсу. 
4.3. Тестування роботи програми 
Тестування програмного забезпечення буде проходити в декілька етапів. 
Перший етап має на меті перевірити роботу модифікації даних, другий етап – це 
перевірка аналітичної частини, та швидкодії програмного забезпечення і третій 
етап – перевірка аналітичних результатів. Тестувальна методика – метод чорної 
скриньки, тобто ми будемо перевіряти лише функціонал самого застосунку, 
людина, що буде проводити тестування не буде мати доступ до внутрішнього коду 
програми. Також варто зазначити, що тестувальником є фаховий фармацепт, та 
студентка Одеського національного медичного університету. 
При проведені першого етапу тестування не було виявлено критичних 
проблем, всі елементи працюють без збоїв. Ми додали декілька пацієнтів, 
доповнили їх симптоми, успішно видалили обраних пацієнтів та мали доступ до 
77 
 
всієї необхідної інформації. Під час тестування виникла проблема повтору 
симптомів, тобто користувач може додати декілька ідентичних симптомів, однак 
це ніяк не вплине на роботу застосунку, лише створить певні незручності у 
користуванні. 
Другий етап перевірки продемонстрував задовільну швидкодію проведення 
аналізу пацієнта, кожен елемент програми працює так, як і повинен. Щодо 
споживання програмою обчислювальних ресурсів, все також в межах норми, 
програма використовує три гігабайти оперативної пам’яті, що є цілком нормальним 
показником. Під час виконання аналізу програма використовує 3% – 5% ресурсів 
центрального процесора Intel core I7 9750h. Загалом мінімальні систмні вимоги для 
використання розробленого програмного забезпечення знаходяться на рівні восьми 
гігабайт оперативної пам’яті, та центрального процесору, що вийшов не раніше 
2012 року. 
При проведенні третього етапу перевірки було проведено три тестових 
аналіза, на трьох пацієнтах з симптомами застуди, діабету та сифілісу,  в усіх трьох 
випадках цільові хвороби були присутні в списку, до того ж імовірність їх появи 
знаходилась на рівні трьох найімовірніших діагнозів, однак було помічено, що 
модель випадкового лісу має проблему, що проявляється в класифікації надто 
неправдоподібних класів, це свідчить про недостатню стійкість моделі. 
Тестувальник також зауважила, що отримані в результаті аналізу дані дозволяють 
глибше проаналізувати симптоми пацієнта, та звернути увагу на менш імовірні, 
проте досить реалістичні діагнози. Приклад роботи програми продемонстрований 
на рисунку 4.2.1. 
78 
 
 
Рисунок 4.2.1 – Застосування програми при спробі діагностики застуди. 
 У підсумку можна стверджувати, що нам вдалось розробити стабільне та 
ресурсоефективне програмне забезпечення. Було виявлено проблему стакінгу 
однакових симптом, що не впливає на роботу програми і проблему “галюцинацій” 
моделі випадкового лісу, що потребує додаткових досліджень. З точки зору 
зручності користування програма показала себе посередньо, інтерфейс не до кінця 
інтуїтивний, однак при короткотривалому ознайомлені використовувати його 
можна буде з комфортом. Дизайн програмного застосунку невиразний і потребує 
роботи над оформленням.  
79 
 
4.4. Висновки до розділу 4 
В даному розділі ми розробили програмний застосунок для практичного 
застосування вже навчених моделей машинного навчання та нейронної мережі. 
Було розроблено просту систему бази даних, та реалізували для неї функції 
ствронення нового пацієнта, видалення пацієнта, додавання симптомів до пацієнта 
та виводу інформації про пацієнта, також була реалізована функція перетворення 
списку симптом пацієнта на вектор для аналізу моделями.  
Розроблений нами графічний інтерфейс повністю відповідає очікуванням та 
попередньому плануванню. Реалізована програма зручно розділена на декілька 
робочих зон для зручного використання. Програма продемонструвала помірну 
зручність використання, також під час тестування було виявлено один не 
серйозний баг, однак критичних багів виявлено не було. Розроблений застосунок 
демонструє високий рівень продуктивності та має невисокі вимоги для 
використання. 
Тестування точності на декількох зовнішніх прикладах показало, що модель 
випадкового лісу є нестійкою, тобто може демонструвати нереалістичний 
результат, що потребує додаткових досліджень, однак наявність метааналітичної 
моделі частково нівелює цю проблему. Загалом всі моделі продемонстрували 
хороший результат на аналізі зовнішніх даних, адже змогли надати доволі точні 
класифікації при аналізі з використанням зовнішніх даних. 
  
80 
 
ВИСНОВКИ 
У результаті проведених досліджень можна стверджувати, що методи 
машинного навчання на базі Баєсівського, та метричного підходів можуть 
застосовуватись, та приносити практичну цінність в сфері охорони здоров’я. 
Методи машинного навчання є ефективним інструментом в галузі медичної 
діагностики, що підтверджується їх застосуванням в діагностиці складних 
клінічних випадків. Також проведене дослідження соціального аспекту 
використання методів машинного навчання в медицині і зроблено висновки про 
позитивне сприйняття соціумом подібних практик. 
Були розглянуті перспективні методи машинного навчання, для 
використання у вирішенні поставленої задачі. Проведено дослідження їх 
ефективності в задачі класифікації захворювань. 
Розроблено та реалізовано шість методів машинного навчання, що 
вирішують задачу імовірнісної класифікації захворювань, мпираючись на 
симптоми пацієнта. Проведений аналіз точності моделей, та їх оцінка на 
відповідність мінімальним вимогам, а також чи досягають вони цільових 
показників. Також була створена метааналітична модель, для спрощення 
інтерпретації результатів. 
Було успішно спроектовано, реалізовано, та досліджено ефективність  
програмного продукту для медичної діагностики захворювань. Можна 
стверджувати, що отримані результати є перспективними, однак застосунок 
потребує модифікацій для більш якісного аналізу. 
Наукова новизна полягає у використанні багатомодельного ансамблевого 
підходу у вирішенні задачі медичної діагностики. Практична цінніть отриманих 
результатів полягає у підтвердженні ефективності використання ансамблевого, 
багатомодельного підходу до вирішення проблеми медичної діагностики 
захворювань. Також в процесі роботи було проведене дослідження якості 
традиційної медичної діагностики, встановлено необхідний і цільовий показники 
рівнів якості роботи моделей. 
81 
 
Можна вважати отримані результати якості роботи моделей коректними, 
адже під час тестування на зовнішніх даних кожна модель продемонструвала 
реалістичні класифікаційні висновки. Показники точності розроблених моделей 
подібні до показників точності в наведених дослідженнях. Висновки щодо 
доцільності використання методів машинного навчання узгоджено з 
статистичними і метааналітичними дослідженнями в цій галузі. 
Подальше покращення додатку є перспективним, адже зі збільшенням 
кількості і якості даних можна буде підвищити якість моделей, також інтерфейс 
потребує покращень. Дослідження в сфері використання машинного навчання у 
медичній діагностиці проводятьс все частіше, а прогнозоване зростання галузі 
дозволяє зробити висновок, що штучний інтелект і машинне навчання можуть 
стати основним драйвером на шляху до покращення сфери охорони здоров’я в 
планетарних масштабах. 
82 
 
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 
1. Машинне навчання в охороні здоров’я: використання, переваги та піонери в цій 
галузі URL: https://eithealth.eu/news-article/machine-learning-in-healthcare-uses-
benefits-and-pioneers-in-the-field/  (дата звернення: 10.11.2025) 
2. Алекс Ш. Машинне навчання в охороні здоров’я: як це працює URL: 
https://chisw.com/blog/machine-learning-projects-in-healthcare/ (дата звернення: 
10.11.2025) 
3. Санкет Г., Адіті Ш. Розмір, частка та тенденції ринку генеративного штучного 
інтелекту в охороні здоров’я з 2025 по 2034 рік URL: 
https://www.precedenceresearch.com/generative-ai-in-healthcare-market (дата 
звернення: 10.11.2025) 
4. Мохаммед Б., Еддін І.Т., Алабуд Х., Алмалайша М. Оцінка надійності ChatGPT 
для питань, пов’язаних зі здоров’ям: систематичний огляд URL:  
https://www.mdpi.com/2227-9709/12/1/9 (дата звернення: 10.11.2025) 
5. Фагелла Д. Машинне навчання для медичної діагностики – 4 сучасні 
застосування URL:  https://emerj.com/machine-learning-medical-diagnostics-4-
current-applications/ (дата звернення: 10.11.2025) 
6. Лінос Е. Штучний інтелект покращує точність діагностики раку шкіри у 
дослідженні Стендфордської медицини URL:  
https://news.stanford.edu/stories/2024/04/ai-skin-diagnosis (дата звернення: 
11.11.2025) 
7. Чжао В., Хуан Ч., Дяо С., Ян. Ч. Розробка та валідація алгоритмів 
мультимодального глибокого навчання для виявлння легеневої гіпертензії URL:  
https://www.nature.com/articles/s41746-025-01593-3 (дата звернення: 11.11.2025) 
8. Кабоуді Н., Хагані Л., Морадзаде З., Халадж Ф., Мохаммаді З. Діагностика 
точності ChatGPT для сортування пацієнтів, систематичний огляд та метааналіз 
URL:  https://pmc.ncbi.nlm.nih.gov/articles/PMC11407534/ (дата звернення: 
12.11.2025) 
9. Кавлакоглу Е. Що таке випадковий ліс? URL:  
https://www.ibm.com/think/topics/random-forest (дата звернення: 12.11.2025) 
10. Лангарізаде М., Могбелі Ф. Застосування наївних баєсівських мереж для 
прогнозування засворювань: систематичний огляд URL:  
https://pmc.ncbi.nlm.nih.gov/articles/PMC5203736/ (дата звернення: 15.11.2025) 
 
 
83 
 
11. Уддін Ш., Хак І., Лу Х., Алі Моні М., Гіде Е. Порівняльний аналіз алгоритму 
К-найближчих сусідів та його варіантів для прогнозування захворювань URL:  
https://pmc.ncbi.nlm.nih.gov/articles/PMC9012855/ (дата звернення: 15.11.2025) 
12. Індонезійський журнал комп’ютерних наук 14.04.2024 ISSN 2549-7286 
13. Шобайо О., Саатчі Р. Розробки в методах глибокого навчання штучних 
нейронних мереж для аналізу та інтерпретації медичних зображень  URL:  
https://pmc.ncbi.nlm.nih.gov/articles/PMC12071792/ (дата звернення: 16.11.2025) 
14. Асів Шах М., Кола Ахмед Ю., Абдулхалі Т. PlumoNet: нова модель виявлення 
легеневих захворювань на основі глибокого навчання URL:  
https://pmc.ncbi.nlm.nih.gov/articles/PMC10903074/ (дата звернення: 16.11.2025) 
15. Марен Шип Е., Фурджа Ф., Гроган Е. Розробка моделей прогнозування для 
клінічного використанні з застосуванням логістичної регресії URL:  
https://pmc.ncbi.nlm.nih.gov/articles/PMC6465431/#sec2 (дата звернення: 
16.11.2025) 
16. Штучний інтелект у статистиці охорони здоров’я URL:  
https://ventionteams.com/healthtech/ai/statistics (дата звернення: 20.11.2025) 
17. Кехоу Б. 100 головних способів використання штучного інтелекту у 2025 
році(і як вони змінилися з 2024 року) URL:  
https://www.qualtrics.com/articles/customer-experience/the-top-100-ways-people-are-
using-ai-2025/ (дата звернення: 10.11.2025) 
18. В.Вайт Р., Горвіц Е. Досвід пошуку в інтернеті з медичних питнь та 
самодіагностики URL:  https://pmc.ncbi.nlm.nih.gov/articles/PMC2815378/ (дата 
звернення: 20.11.2025) 
19. Аналітичний документ про життєвий цикл лікарських засобів у штучному 
інтелекті URL:   https://www.ema.europa.eu/en/about-us/how-we-work/data-
regulation-big-data-other-sources/artificial-intelligence (дата звернення: 10.11.2025) 
20. Ерін П., Браян Т. Покращення діагностики в охороні здоров’я URL:  
https://www.ncbi.nlm.nih.gov/books/NBK338596/ (дата звернення: 28.11.2025) 
21. Global Health Security Index 2019 
22. Освітній онлайн ресурс Medium URL:  https://medium.com/ (дата звернення: 
28.11.2025) 
  
84 
 
ДОДАТОК А 
 
«Затверджую» 
Завідувач кафедри статистики 
та прикладної математики 
____________ Анаіт КАРАПЕТЯН 
«___» ________2025 р. 
 
 
ЗАСТОСУВАННЯ МЕТОДІВ АНАЛІЗУ ДАНИХ І МАШИННОГО 
НАВЧАННЯ В МЕДИЦИНІ НА ОСНОВІ АНСАМБЛЕВИХ МОДЕЛЕЙ  
 
Специфікація 
482.ЧДТУ.5 2437-01 
Листів 2 
Розробник    __________________ Арсен ЦОКОЛЕНКО 
 
Керівник     __________________ Євген ФЕДОРОВ 
 
 
 
 
 
Черкаси - 2025 
85 
 
Позначення Найменування Примітка 
 Документація  
482.ЧДТУ.5 2438-01 34 01 Інструкція користувача  
482.ЧДТУ.5 2438-01 90 01 Структура бази даних  
482.ЧДТУ.5 2438-01 12 01 Текст програми  
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
   
86 
 
 
ДОДАТОК Б 
 
 
 
 
 
ЗАСТОСУВАННЯ МЕТОДІВ АНАЛІЗУ ДАНИХ І МАШИННОГО 
НАВЧАННЯ В МЕДИЦИНІ НА ОСНОВІ БАЄСІВСЬКОГО ТА 
МЕТРИЧНОГО ПІДХОДІВ  
Інструкція користувача 
482.ЧДТУ.5 2438-01 34 01-1 
 
Листів 5 
Розробник    ____________________  Арсен ЦОКОЛЕНКО 
 
 
 
 
 
 
 
 
 
 
Черкаси - 2025  
87 
 
Створення нового пацієнта 
Для створення нового пацієнта потрібно вписати його ім’я в поле, що на 
рисунку 1 виділено червоним контуром, після чого натиснути на кнопку “додати 
пацієнта”, що виділена зеленим контуром. 
 
Рисунок Б1 – Створення нового пацієнта 
Додавання симптомів пацієнту 
Для того, щоб додати симптом існуючому пацієнту ви повинні обрати 
пацієнта з випадаючиго списку в полі, що виділено червоним контуром на рисунку 
2, після чого обрати симптом з випадаючого списку в полі, що виділене 
помаранчевим кольором, після чого натиснути кнопку “додати симптом”, що 
виділена зеленим контуром. 
 
Рисунок Б2 – Додавання симптому до пацієнта 
88 
 
Видалення даних про пацієнта 
Щоб видалити пацієнта ви повинні обрати існуючого пацієнта з 
випадаючого списку в полі, що виділене червоним контуром і натиснути кнопку 
“видалити пацієнта”, що виділена зеленим контуром на рисунку 3. 
 
Рисунок Б3 – Видалення даних пацієнта 
Демонстрація симптомів пацієнта 
Для того, щоб побачити список симптом пацієнта необхідно обрати пацієнта 
з випадаючого списку в полі, що виділене чероним кольором на рисунку 4, після 
чого натиснути кнопку “показати симптоми”, що виділена зеленим кольором. У 
разі, якщо після проведених операцій поле з симптомами, виділено синім контуром, 
залишається порожнім – пацієнт ще не має записаних симптом. 
 
Рисунок Б4 – Демонстрація симптом пацієнта 
 
89 
 
Аналіз пацієнта 
Для проведення аналізу пацієнта необхідно обрати пацієнта з випадаючого 
списку в полі, що виділене червоним кольором, натиснути кнопку “показати 
симптоми”, що виділена зеленим контуром, після чого натиснути кнопку 
“аналізувати пацієнта”, виділену синім кольором, як показано на рисунку 5 
 
Рисунок Б5 – Аналіз пацієнта 
Результати аналізу будуть виведені в поля, що на рисунку 6 виділені 
жовтим кольором. Метааналіз, тобто компіляція результатів аналізу всіх моделей, 
буде виведено в поле, що виділене синім контуром. Назви моделей зазначені 
лейблами, що стоять кожна навпроти поля своєї моделі, на рисунку виділені сірим 
контуром. 
 
Рисунок Б6 – Результати аналізу 
  
90 
 
ДОДАТОК В 
 
 
 
 
 
 
ЗАСТОСУВАННЯ МЕТОДІВ АНАЛІЗУ ДАНИХ І МАШИННОГО 
НАВЧАННЯ В МЕДИЦИНІ НА ОСНОВІ БАЄСІВСЬКОГО ТА 
МЕТРИЧНОГО ПІДХОДІВ  
Опис датасету 
482.ЧДТУ.5 2438-01 90 01-1 
 
Листів 29 
Розробник    ____________________  Арсен ЦОКОЛЕНКО 
 
 
 
 
 
 
 
 
 
Черкаси – 2025 
  
91 
 
Датасет «Final_Augmented_dataset_Diseases_and_Symptoms» таблиці 
переліку хвороб і симптомів таблиці В.1 і В.2, відповідно. 
Таблиця В.1 – хвороби українською і англійською мовами 
Назва хвороби англійською Назва хвороби українською 
Panic disorder Панічний розлад 
Vocal cord polyp Поліп голосових зв'язок 
Turner syndrome Синдром Тернера 
Cryptorchidism Крипторхізм 
Poisoning due to ethylene glycol Отруєння етиленгліколем 
Atrophic vaginitis Атрофічний вагініт 
Fracture of the hand Перелом руки 
Cellulitis or abscess of mouth Целюліт або абсцес рота 
Eye alignment disorder Порушення вирівнювання очей 
Headache after lumbar puncture Головний біль після люмбальної пункції 
Pyloric stenosis Пілоростеноз 
Salivary gland disorder Порушення слинних залоз 
Osteochondrosis Остеохондроз 
Injury to the knee Травма коліна 
Metabolic disorder Метаболічний розлад 
Vaginitis Вагініт 
Sick sinus syndrome Синдром слабкості синусового вузла 
Tinnitus of unknown cause Шум у вухах невідомої причини 
Glaucoma Глаукома 
Eating disorder Розлад харчової поведінки 
Transient ischemic attack Транзиторна ішемічна атака 
Pyelonephritis Пієлонефрит 
Rotator cuff injury Травма обертальної манжети плеча 
Chronic pain disorder Хронічний больовий розлад 
Problem during pregnancy Проблема під час вагітності 
Liver cancer Рак печінки 
Atelectasis Ателектаз 
Injury to the hand Травма руки 
Choledocholithiasis Холедохолітіаз 
Injury to the hip Травма стегна 
Cirrhosis Цироз 
Thoracic aortic aneurysm Аневризма грудного відділу аорти 
Subdural hemorrhage Субдуральна кровотеча 
92 
 
Diabetic retinopathy Діабетична ретинопатія 
Fibromyalgia Фіброміалгія 
Ischemia of the bowel Ішемія кишечника 
Fetal alcohol syndrome Алкогольний синдром плода 
Peritonitis Перитоніт 
Injury to the abdomen Травма живота 
Acute pancreatitis Гострий панкреатит 
Thrombophlebitis Тромбофлебіт 
Asthma Астма 
Foreign body in the vagina Чужорідне тіло у вагіні 
Restless leg syndrome Синдром неспокійних ніг 
Emphysema Емфізема 
Cysticercosis Цистицеркоз 
Induced abortion Індукований аборт 
Teething syndrome Синдром прорізування зубів 
Infectious gastroenteritis Інфекційний гастроентерит 
Acute sinusitis Гострий синусит 
Substance-related mental disorder Психічний розлад, пов'язаний з вживанням 
речовин 
Postpartum depression Післяпологова депресія 
Coronary atherosclerosis Коронарний атеросклероз 
Spondylitis Спондиліт 
Pituitary adenoma Аденома гіпофізу 
Uterine fibroids Фіброми матки 
Idiopathic nonmenstrual bleeding Ідіопатична неменструальна кровотеча 
Chalazion Халазіон 
Ovarian torsion Торсія яєчника 
Retinopathy due to high blood pressure Ретинопатія через високий кров'яний тиск 
Vaginal yeast infection Вагінальна дріжджова інфекція 
Mastoiditis Мастоїдит 
Lung contusion Контузія легені 
Hypertrophic obstructive cardiomyopathy Гіпертрофічна обструктивна кардіоміопатія 
(HOCM) (ГОКМ) 
Ingrown toe nail Врослий ніготь 
Pulmonary eosinophilia Легенева еозинофілія 
Corneal disorder Порушення рогівки 
Foreign body in the gastrointestinal tract Чужорідне тіло в шлунково-кишковому тракті 
Endophthalmitis Ендофтальміт 
Intestinal malabsorption Кишкове порушення всмоктування 
93 
 
Viral warts Вірусні бородавки 
Hyperhidrosis Гіпергідроз 
Stroke Інсульт 
Pilonidal cyst Пілонідальна кіста 
Crushing injury Розчавлююча травма 
Normal pressure hydrocephalus Нормотензивна гідроцефалія 
Alopecia Алопеція 
Hashimoto thyroiditis Тиреоїдит Хашимото 
Flat feet Плоскостопість 
Nonalcoholic liver disease (NASH) Неалкогольна жирова хвороба печінки 
(НАЖХП) 
Hemarthrosis Гемартроз 
Pelvic organ prolapse Пролапс органів малого таза 
Fracture of the arm Перелом руки 
Coagulation (bleeding) disorder Порушення згортання крові 
Intracranial hemorrhage Внутрішньочерепна кровотеча 
Hyperkalemia Гіперкаліємія 
Cornea infection Інфекція рогівки 
Abscess of the lung Абсцес легені 
Dengue fever Лихоманка денге 
Chronic sinusitis Хронічний синусит 
Cholesteatoma Холестеатома 
Volvulus Заворот кишок 
Injury to the finger Травма пальця 
Poisoning due to analgesics Отруєння анальгетиками 
Atrial fibrillation Фібриляція передсердь 
Pinworm infection Інфекція гостриками 
Urethral valves Клапани уретри 
Open wound of the neck Відкрита рана шиї 
Achalasia Ахалазія 
Conductive hearing loss Кондуктивна втрата слуху 
Abdominal hernia Грижа живота 
Cerebral palsy Церебральний параліч 
Marijuana abuse Зловживання марихуаною 
Cryptococcosis Криптококоз 
Obesity Ожиріння 
Indigestion Розлад травлення 
Bursitis Бурсит 
94 
 
Esophageal cancer Рак стравоходу 
Pulmonary congestion Легенева застій 
Juvenile rheumatoid arthritis Ювенільний ревматоїдний артрит 
Actinic keratosis Актинічний кератоз 
Acute otitis media Гострий середній отит 
Astigmatism Астигматизм 
Tuberous sclerosis Туберозний склероз 
Empyema Емпієма 
Presbyacusis Пресбіакузіс 
Neonatal jaundice Неонатальна жовтяниця 
Chronic obstructive pulmonary disease Хронічне обструктивне захворювання легень 
(COPD) (ХОЗЛ) 
Dislocation of the elbow Вивих ліктя 
Spondylosis Спондилоз 
Herpangina Герпангіна 
Injury to the shoulder Травма плеча 
Poisoning due to antidepressants Отруєння антидепресантами 
Infection of open wound Інфекція відкритої рани 
Deep vein thrombosis (DVT) Тромбоз глибоких вен (ТГВ) 
Protein deficiency Білкова недостатність 
Myoclonus Міоклонус 
Bone spur of the calcaneus Кістковий шпора п'яткової кістки 
Von Willebrand disease Хвороба фон Віллебранда 
Open wound of the back Відкрита рана спини 
Heart block Серцева блокада 
Colonic polyp Поліп ободової кишки 
Magnesium deficiency Магнієва недостатність 
Female infertility of unknown cause Жіноче безпліддя невідомої причини 
Pericarditis Перикардит 
Attention deficit hyperactivity disorder Синдром дефіциту уваги з гіперактивністю 
(ADHD) (СДУГ) 
Pulmonic valve disease Захворювання легеневого клапана 
Tietze syndrome Синдром Тітце 
Cranial nerve palsy Параліч черепного нерва 
Injury to the arm Травма руки 
Conversion disorder Розлад конверсії 
Complex regional pain syndrome Комплексний регіональний больовий синдром 
Otosclerosis Ото склероз 
Injury to the trunk Травма тулуба 
95 
 
Hypothyroidism Гіпотиреоз 
Primary insomnia Первинне безсоння 
Lice Воші 
Vitamin B12 deficiency Недостатність вітаміну B12 
Diabetes Діабет 
Vulvodynia Вульводинія 
Endometriosis Ендометріоз 
Vasculitis Васкуліт 
Concussion Струс мозку 
Oral leukoplakia Оральний лейкоплакія 
Chronic kidney disease Хронічна хвороба нирок 
Bladder disorder Порушення сечового міхура 
Chorioretinitis Хоріоретиніт 
Priapism Приапізм 
Myositis Міозит 
Mononucleosis Мононуклеоз 
Neuralgia Невралгія 
Polycystic kidney disease Полікістозна хвороба нирок 
Bipolar disorder Біполярний розлад 
Amyloidosis Амилоїдоз 
Chronic inflammatory demyelinating Хронічна запальна демієлінізуюча 
polyneuropathy (CIDP) полінейропатія (ХЗДП) 
Gastroesophageal reflux disease (GERD) Гастроезофагеальна рефлюксна хвороба 
(ГЕРХ) 
Vitreous hemorrhage Склоподібна кровотеча 
Poisoning due to antimicrobial drugs Отруєння через антимікробні препарати 
Open wound of the mouth Відкрита рана рота 
Scleroderma Склеродермія 
Myasthenia gravis Міастенія гравіс 
Hypoglycemia Гіпоглікемія 
Idiopathic absence of menstruation Ідіопатична відсутність менструації 
Dislocation of the ankle Вивих щиколотки 
Carbon monoxide poisoning Отруєння чадним газом 
Panic attack Панічна атака 
Plantar fasciitis Підошовний фасциїт 
Hyperopia Далекозорість 
Poisoning due to sedatives Отруєння через седативи 
Pemphigus Пемфігус 
Peyronie disease Хвороба Пейроні 
96 
 
Hiatal hernia Грижа стравохідного отвору діафрагми 
Extrapyramidal effect of drugs Екстрапірамідний ефект препаратів 
Meniere disease Хвороба Меньєра 
Anal fissure Анальна тріщина 
Allergy Алергія 
Chronic otitis media Хронічний середній отит 
Fracture of the finger Перелом пальця 
Hirschsprung disease Хвороба Гіршпрунга 
Polymyalgia rheumatica Поліміалгія ревматична 
Lymphedema Лімфедема 
Bladder cancer Рак сечового міхура 
Acute bronchospasm Гострий бронхоспазм 
Acute glaucoma Гостра глаукома 
Open wound of the chest Відкрита рана грудної клітини 
Dislocation of the patella Вивих надколінника 
Sciatica Ішіас 
Hypercalcemia Гіперкальціємія 
Stress incontinence Стресове нетримання сечі 
Varicose veins Варикозні вени 
Benign kidney cyst Доброякісна киста нирки 
Hydrocele of the testicle Гідроцеле яєчка 
Degenerative disc disease Дегенеративне захворювання дисків 
Hirsutism Гірсутизм 
Dislocation of the foot Вивих стопи 
Hydronephrosis Гідронефроз 
Diverticulosis Дивертикульоз 
Pain after an operation Біль після операції 
Huntington disease Хвороба Гантінгтона 
Lymphoma Лімфома 
Dermatitis due to sun exposure Дерматит через сонячне випромінювання 
Anemia due to chronic kidney disease Анемія через хронічну хворобу нирок 
Injury to internal organ Травма внутрішнього органу 
Scleritis Склерит 
Pterygium Птерігіум 
Fungal infection of the skin Грибкова інфекція шкіри 
Insulin overdose Передозування інсуліну 
Syndrome of inappropriate secretion of ADH Синдром неадекватної секреції АДГ 
(SIADH) (СНСАДГ) 
97 
 
Foreign body in the ear Чужорідне тіло у вусі 
Premenstrual tension syndrome Передменструальний напруження синдром 
Orbital cellulitis Орбітальний целюліт 
Injury to the leg Травма ноги 
Hepatic encephalopathy Печінкова енцефалопатія 
Bone cancer Рак кісток 
Syringomyelia Сирингомієлія 
Pulmonary fibrosis Легеневий фіброз 
Mitral valve disease Захворювання мітрального клапана 
Parkinson disease Хвороба Паркінсона 
Gout Подагра 
Otitis media Середній отит 
Drug abuse (opioids) Зловживання наркотиками (опіоїди) 
Myelodysplastic syndrome Мієлодиспластичний синдром 
Fracture of the shoulder Перелом плеча 
Acute kidney injury Гостра травма нирки 
Threatened pregnancy Загроза вагітності 
Intracranial abscess Внутрішньочерепний абсцес 
Gum disease Захворювання ясен 
Open wound from surgical incision Відкрита рана від хірургічного розрізу 
Gastrointestinal hemorrhage Шлунково-кишкова кровотеча 
Seborrheic dermatitis Себорейний дерматит 
Drug abuse (methamphetamine) Зловживання наркотиками (метамфетамін) 
Torticollis Тортиколіс 
Poisoning due to antihypertensives Отруєння через антигіпертензивні препарати 
Tension headache Напружений головний біль 
Alcohol intoxication Алкогольне інтоксикація 
Scurvy Цинга 
Narcolepsy Нарколепсія 
Food allergy Харчова алергія 
Labyrinthitis Лабіринтит 
Anxiety Тривога 
Impulse control disorder Розлад контролю імпульсів 
Stenosis of the tear duct Стеноз слізного каналу 
Abscess of nose Абсцес носа 
Omphalitis Омфаліт 
Leukemia Лейкемія 
Bell palsy Параліч Белла 
98 
 
Conjunctivitis due to allergy Алергічний кон'юнктивіт 
Drug reaction Реакція на ліки 
Adrenal cancer Рак надниркової залози 
Myopia Міопія 
Osteoarthritis Остеоартрит 
Thyroid disease Захворювання щитовидної залози 
Pharyngitis Фарингіт 
Chronic rheumatic fever Хронічна ревматична лихоманка 
Hypocalcemia Гіпокальціємія 
Macular degeneration Макулярна дегенерація 
Pneumonia Пневмонія 
Cold sor Герпес 
Premature ventricular contractions (PVCs) Передчасні шлуночкові скорочення 
Testicular cancer Рак яєчка 
Hydrocephalus Гідроцефалія 
Breast cancer Рак молочної залози 
Anemia due to malignancy Анемія через злоякісну пухлину 
Esophageal varices Варикозне розширення вен стравоходу 
Endometrial cancer Рак ендометрія 
Cystic fibrosis Кістозний фіброз 
Intertrigo (skin condition) Інтертриго (стан шкіри) 
Parathyroid adenoma Аденома паращитовидної залози 
Glucocorticoid deficiency Недостатність глюкокортикоїдів 
Temporomandibular joint disorder Порушення скронево-нижньощелепного 
суглоба 
Wilson disease Хвороба Вільсона 
Vesicoureteral reflux Везико-уретеральний рефлюкс 
Vitamin A deficiency Недостатність вітаміну А 
Gonorrhea Гонорея 
Fracture of the rib Перелом ребра 
Ependymoma Епендимома 
Hepatitis due to a toxin Гепатит через токсин 
Vaginal cyst Вагінальна кіста 
Open wound of the shoulder Відкрита рана плеча 
Ectopic pregnancy Позаматкова вагітність 
Chronic knee pain Хронічний біль у коліні 
Pinguecula Пінгекула 
Hypergammaglobulinemia Гіпергаммаглобулінемія 
99 
 
Alcohol abuse Зловживання алкоголем 
Carpal tunnel syndrome Синдром карпального тунелю 
Pituitary disorder Порушення гіпофізу 
Kidney stone Камінь у нирці 
Autism Аутизм 
Cat scratch disease Хвороба котячих подряпин 
Chronic glaucoma Хронічна глаукома 
Retinal detachment Відшарування сітківки 
Aplastic anemia Апластична анемія 
Overflow incontinence Переповнюване нетримання сечі 
Hemolytic anemia Гемолітична анемія 
Lateral epicondylitis (tennis elbow) Латеральний епікондиліт (тенісний лікоть) 
Open wound of the eye Відкрита рана ока 
Syphilis Сифіліс 
Diabetic kidney disease Діабетична хвороба нирок 
Nose disorder Захворювання носа 
Drug withdrawal Відмова від наркотиків 
Dental caries Карієс 
Hypercholesterolemia Гіперхолестеринемія 
Fracture of the patella Перелом надколінника 
Kidney failure Ниркова недостатність 
Fracture of the neck Перелом шиї 
Muscle spasm М'язовий спазм 
Hemophilia Гемофілія 
Hyperosmotic hyperketotic state Гіперосмотичний гіперкетотичний стан 
Peritonsillar abscess Перитонзилярний абсцес 
Gastroparesis Гастропарез 
Itching of unknown cause Свербіж невідомої причини 
Polycythemia vera Поліцитемія вера 
Thrombocytopenia Тромбоцитопенія 
Head and neck cancer Рак голови та шиї 
Pseudohypoparathyroidism Псевдогіпопаратиреоз 
Goiter Зоб 
Urge incontinence Неутримання позиву 
Edward syndrome Синдром Едвардса 
Open wound of the arm Відкрита рана руки 
Muscular dystrophy М'язова дистрофія 
Mittelschmerz Міттельшмерц 
100 
 
Corneal abrasion Відшарування рогівки 
Anemia of chronic disease Анемія хронічного захворювання 
Dysthymic disorder Дистимічний розлад 
Scarlet fever Скарлатина 
Hypertensive heart disease Гіпертонічне серцеве захворювання 
Drug abuse (barbiturates) Зловживання барбітуратами 
Polycystic ovarian syndrome (PCOS) Синдром полікістозних яєчників (СПКЯ) 
Encephalitis Енцефаліт 
Cyst of the eyelid Кіста повіки 
Balanitis Баланіт 
Foreign body in the throat Чужорідне тіло в горлі 
Drug abuse (cocaine) Зловживання кокаїном 
Optic neuritis Оптичний неврит 
Alcohol withdrawal Алкогольна абстиненція 
Premature atrial contractions (PACs) Передчасні скорочення передсердь 
Hemiplegia Геміплегія 
Hammer toe Палець у вигляді молотка 
Open wound of the cheek Відкрита рана щоки 
Joint effusion Накопичення рідини в суглобі 
Open wound of the knee Відкрита рана коліна 
Meningioma Менінгіома 
Brain cancer Рак мозку 
Placental abruption Відшарування плаценти 
Seasonal allergies (hay fever) Сезонні алергії (сінна лихоманка) 
Lung cancer Рак легені 
Primary kidney disease Первинне захворювання нирок 
Uterine cancer Рак матки 
Dry eye of unknown cause Сухе око невідомої причини 
Fibrocystic breast disease Фіброзно-кістозна хвороба молочної залози 
Fungal infection of the hair Грибкова інфекція волосся 
Tooth abscess Абсцес зуба 
Envenomation from spider or animal bite Отруєння від укусу павука або тварини 
VACTERL syndrome Синдром VACTERL 
Vertebrobasilar insufficiency Вертибробазилярна недостатність 
Rectal disorder Ректальний розлад 
Atonic bladder Атонічний сечовий міхур 
Benign paroxysmal positional vertigo (BPPV) Доброякісне пароксизмальне позиційне 
запаморочення (ДППЗ) 
101 
 
Blepharospasm Блефароспазм 
Sarcoidosis Саркоїдоз 
Metastatic cancer Метастатичний рак 
Trigger finger (finger disorder) Триггерний палець (розлад пальця) 
Stye Ячмінь 
Hemochromatosis Гемохроматоз 
Osteochondroma Остеохондрома 
Cushing syndrome Синдром Кушинга 
Typhoid fever Тифозна лихоманка 
Vitreous degeneration Дегенерація склоподібного тіла 
Atrophic skin condition Атрофічний стан шкіри 
Aspergillosis Аспергільоз 
Uterine atony Атонія матки 
Trichinosis Трихіноз 
Whooping cough Кашлюк 
Open wound of the lip Відкрита рана губи 
Subacute thyroiditis Підгострий тиреоїдит 
Oral mucosal lesion Ураження слизової оболонки рота 
Open wound due to trauma Відкрита рана через травму 
Intracerebral hemorrhage Внутрішньомозкова кровотеча 
Alzheimer disease Хвороба Альцгеймера 
Vaginismus Вагінізм 
Systemic lupus erythematosus (SLE) Системний червоний вовчак (СЧВ) 
Premature ovarian failure Передчасна недостатність яєчників 
Thoracic outlet syndrome Синдром верхнього отвору грудної клітки 
Ganglion cyst Гангліозна кіста 
Dislocation of the knee Вивих коліна 
Crohn disease Хвороба Крона 
Postoperative infection Післяопераційна інфекція 
Folate deficiency Недостатність фолатів 
Fluid overload Перевантаження рідиною 
Atrial flutter Тріпотіння передсердь 
Skin disorder Захворювання шкіри 
Floaters Плаваючі помутніння 
Tooth disorder Порушення зубів 
Heart attack Інфаркт міокарда 
Open wound of the abdomen Відкрита рана живота 
Fracture of the leg Перелом ноги 
102 
 
Oral thrush (yeast infection) Кандидоз рота (дріжджова інфекція) 
Pityriasis rosea Лишай Жибера 
Allergy to animals Алергія на тварин 
Orthostatic hypotension Ортостатична гіпотензія 
Obstructive sleep apnea (OSA) Обструктивне апное сну (ОАС) 
Hypokalemia Гіпокаліємія 
Psoriasis Псоріаз 
Dislocation of the shoulder Вивих плеча 
Intussusception Інвагінація 
Cervicitis Цервіцит 
Abscess of the pharynx Абсцес глотки 
Primary thrombocythemia Первинна тромбоцитемія 
Arthritis of the hip Артрит стегна 
Decubitus ulcer Пролежень 
Hypernatremia Гіпернатріємія 
Sensorineural hearing loss Сенсоневральна втрата слуху 
Chronic ulcer Хронічна виразка 
Osteoporosis Остеопороз 
Ileus Кишковий параліч 
Sickle cell crisis Криза при серповидноклітинній анемії 
Urethritis Уретрит 
Prostatitis Простатит 
Otitis externa (swimmer's ear) Зовнішній отит (вухо плавця) 
Poisoning due to anticonvulsants Отруєння антиконвульсантами 
Testicular torsion Торсія яєчка 
Tricuspid valve disease Захворювання трикуспідального клапана 
Urethral stricture Стриктура уретри 
Vitamin D deficiency Недостатність вітаміну D 
Hydatidiform mole Пухлиноподібне розростання трофобласта 
Pain disorder affecting the neck Больовий розлад, що впливає на шию 
Tuberculosis Туберкульоз 
Pelvic fistula Тазова фістула 
Acute bronchiolitis Гострий бронхіоліт 
Presbyopia Пресбіопія 
Dementia Деменція 
Insect bite Укус комахи 
Paroxysmal ventricular tachycardia Пароксизмальна шлуночкова тахікардія 
Congenital heart defect Вроджена вада серця 
103 
 
Connective tissue disorder Розлад сполучної тканини 
Foreign body in the eye Чужорідне тіло в оці 
Poisoning due to gas Отруєння газом 
Pyogenic skin infection Піогенна інфекція шкіри 
Endometrial hyperplasia Гіперплазія ендометрія 
Acanthosis nigricans Чорний акантоз 
Central atherosclerosis Центральний атеросклероз 
Viral exanthem Вірусна екзантема 
Noninfectious gastroenteritis Неінфекційний гастроентерит 
Benign prostatic hyperplasia (BPH) Доброякісна гіперплазія простати (ДГП) 
Menopause Менопауза 
Primary immunodeficiency Первинна імунодефіцит 
Ovarian cancer Рак яєчника 
Cataract Катаракта 
Dislocation of the hip Вивих стегна 
 
Spinal stenosis Стеноз хребта 
Intestinal obstruction Кишкова непрохідність 
Heart contusion Контузія серця 
Congenital malformation syndrome Синдром вроджених вад 
Sporotrichosis Споротрихоз 
Lymphangitis Лімфангіт 
Wernicke-Korsakoff syndrome Синдром Верніке-Корсакова 
Intestinal disease Захворювання кишечника 
Acute bronchitis Гострий бронхіт 
Persistent vomiting of unknown cause Постійне блювання невідомої причини 
Open wound of the foot Відкрита рана стопи 
Myocarditis Міокардит 
Preeclampsia Прееклампсія 
Ischemic heart disease Ішемічна хвороба серця 
Neurofibromatosis Нейрофіброматоз 
Chickenpox Вітряна віспа 
Pancreatic cancer Рак підшлункової залози 
Neuropathy due to drugs Невропатія через ліки 
Croup Круп 
Idiopathic excessive menstruation Ідіопатичні надмірні менструації 
Amblyopia Амбліопія 
Meckel diverticulum Дивертикул Меккеля 
104 
 
Dislocation of the wrist Вивих зап'ястя 
Ear drum damage Пошкодження барабанної перетинки 
Erectile dysfunction Еректильна дисфункція 
Temporary or benign blood in urine Тимчасова або доброякісна кров у сечі 
Kidney disease due to longstanding Захворювання нирок через тривалу 
hypertension гіпертензію 
Chondromalacia of the patella Хондромаляція надколінника 
Onychomycosis Оніхомікоз 
Urethral disorder Порушення уретри 
Lyme disease Хвороба Лайма 
Iron deficiency anemia Анемія через дефіцит заліза 
Acute respiratory distress syndrome (ARDS) Гострий респіраторний дистрес-синдром 
(ГРДС) 
Toxic multinodular goiter Токсичний багатовузловий зоб 
Open wound of the finger Відкрита рана пальця 
Autonomic nervous system disorder Порушення автономної нервової системи 
Psychosexual disorder Психосексуальний розлад 
Anemia Анемія 
Tendinitis Тендиніт 
Common cold Застуда 
Amyotrophic lateral sclerosis (ALS) Аміотрофічний латеральний склероз (АЛС) 
Central retinal artery or vein occlusion Оклюзія центральної артерії або вени сітківки 
Paroxysmal supraventricular tachycardia Пароксизмальна суправентрикулярна 
тахікардія 
Venous insufficiency Венозна недостатність 
Trichomonas infection Інфекція трихомонас 
Acne Акне 
Depression Депресія 
Drug abuse Зловживання наркотиками 
Urinary tract obstruction Обструкція сечовивідних шляхів 
Diabetes insipidus Нецукровий діабет 
Iridocyclitis Іридоцикліт 
Varicocele of the testicles Варикоцеле яєчок 
Irritable bowel syndrome Синдром роздратованого кишечника 
Fracture of the foot Перелом стопи 
Ovarian cyst Кіста яєчника 
Chlamydia Хламідія 
Parasitic disease Паразитарне захворювання 
Fracture of the jaw Перелом щелепи 
105 
 
Lipoma Ліпома 
Female genitalia infection Інфекція жіночих статевих органів 
Pulmonary hypertension Легенева гіпертензія 
Thyroid nodule Вузол щитовидної залози 
Broken tooth Зламаний зуб 
Dumping syndrome Синдром швидкого спорожнення 
Lymphadenitis Лімфаденіт 
Injury to the face Травма обличчя 
Aortic valve disease Захворювання аортального клапана 
Rheumatoid arthritis Ревматоїдний артрит 
Spermatocele Сперматоцеле 
Impetigo Імпетиго 
Anal fistula Анальна фістула 
Hypothermia Гіпотермія 
Oppositional disorder Розлад опозиційної поведінки 
Migraine Мігрень 
Diabetic peripheral neuropathy Діабетична периферійна нейропатія 
Testicular disorder Порушення яєчка 
Gestational diabetes Гестаційний діабет 
Hidradenitis suppurativa Гідраденіт супуративний 
Valley fever Каліфорнійська гарячка 
Conjunctivitis due to bacteria Бактеріальний кон'юнктивіт 
Lewy body dementia Деменція з тільцями Леві 
Multiple myeloma Множинна мієлома 
Head injury Травма голови 
Ascending cholangitis Висхідний холангіт 
Idiopathic irregular menstrual cycle Ідіопатичний нерегулярний менструальний 
цикл 
Interstitial lung disease Інтерстиціальне захворювання легень 
Mononeuritis Мононеврит 
Malaria Малярія 
Somatization disorder Соматизаційний розлад 
Hypovolemia Гіповолемія 
Schizophrenia Шизофренія 
Knee ligament or meniscus tear Розрив зв'язки або меніска коліна 
Endocarditis Ендокардит 
Sepsis Сепсис 
Heat stroke Сонячний удар 
106 
 
Cholecystitis Холецистит 
Cardiac arrest Зупинка серця 
Cardiomyopathy Кардіоміопатія 
Social phobia Соціальна фобія 
Meningitis Менінгіт 
Spherocytosis Сфероцитоз 
Hormone disorder Гормональний розлад 
Raynaud disease Хвороба Рейно 
 
Reactive arthritis Реактивний артрит 
Scabies Короста 
Ear wax impaction Закупорка вушної сірки 
Hypertension of pregnancy Гіпертензія під час вагітності 
Peripheral arterial embolism Периферійна артеріальна емболія 
Rosacea Розацеа 
Fracture of the skull Перелом черепа 
Uveitis Увіїт 
Fracture of the facial bones Перелом кісток обличчя 
Tracheitis Трахеїт 
Jaw disorder Порушення щелепи 
Perirectal infection Перианальна інфекція 
Breast cyst Кіста молочної залози 
Post-traumatic stress disorder (PTSD) Посттравматичний стресовий розлад (ПТСР) 
Kidney cancer Рак нирки 
Vulvar cancer Рак вульви 
Blepharitis Блефарит 
Celiac disease Целіакія 
Cystitis Цистит 
Sickle cell anemia Серповидноклітинна анемія 
Subconjunctival hemorrhage Підкон'юнктивальна кровотеча 
Hemorrhoids Геморой 
Contact dermatitis Контактний дерматит 
Sinus bradycardia Синусова брадикардія 
High blood pressure Високий кров'яний тиск 
Pelvic inflammatory disease Запальне захворювання тазових органів 
Liver disease Захворювання печінки 
Chronic constipation Хронічний запор 
Thyroid cancer Рак щитовидної залози 
107 
 
Flu Грип 
Friedrich ataxia Атаксія Фрідріха 
Tic (movement) disorder Розлад тік (руху) 
Skin polyp Поліп шкіри 
Brachial neuritis Плечовий неврит 
Cervical cancer Рак шийки матки 
Adrenal adenoma Аденома надниркової залози 
Esophagitis Езофагіт 
Gas gangrene Газова гангрена 
Yeast infection Дріжджова інфекція 
Spina bifida Розщеплення хребта 
Drug poisoning due to medication Отруєння через ліки 
Alcoholic liver disease Алкогольне захворювання печінки 
Malignant hypertension Злоякісна гіпертензія 
Diverticulitis Дивертикуліт 
Moyamoya disease Хвороба Моямоя 
Heat exhaustion Виснаження від спеки 
Psychotic disorder Психотичний розлад 
Frostbite Обмороження 
Atrophy of the corpus cavernosum Атрофія печеристих тіл 
Smoking or tobacco addiction Куріння або залежність від тютюну 
Sprain or strain Розтягнення або розрив 
Essential tremor Первинний тремор 
Open wound of the ear Відкрита рана вуха 
Foreign body in the nose Чужорідне тіло в носі 
Idiopathic painful menstruation Ідіопатичні болісні менструації 
Down syndrome Синдром Дауна 
Idiopathic infrequent menstruation Ідіопатичні рідкісні менструації 
Pneumothorax Пневмоторакс 
De Quervain disease Хвороба де Кервена 
Fracture of the vertebra Перелом хребця 
Human immunodeficiency virus infection Інфекція вірусу імунодефіциту людини (ВІЛ) 
(HIV) 
Mumps Свинка 
Subarachnoid hemorrhage Субарахноїдна кровотеча 
Acute fatty liver of pregnancy (AFLP) Гостра жирова дистрофія печінки під час 
вагітності (ГЖДП) 
Ectropion Ектропіон 
Scar Шрам 
108 
 
Lactose intolerance Непереносимість лактози 
Eustachian tube dysfunction (ear disorder) Порушення функції євстахієвої труби 
(захворювання вуха) 
Appendicitis Апендицит 
Graves disease Хвороба Грейвса 
Dissociative disorder Дисоціативний розлад 
Open wound of the face Відкрита рана обличчя 
Dislocation of the vertebra Вивих хребця 
Phimosis Фімоз 
Hyperemesis gravidarum Гіперемезис вагітних 
Pregnancy Вагітність 
Thalassemia Таласемія 
Placenta previa Передлежання плаценти 
Epidural hemorrhage Епідуральна кровотеча 
Septic arthritis Септичний артрит 
Athlete's foot Грибок стопи 
Pleural effusion Плевральний випіт 
Aphakia Афакія 
Vulvar disorder Порушення вульви 
Sialoadenitis Сіаладеніт 
Gynecomastia Гінекомастія 
Urinary tract infection Інфекція сечовивідних шляхів 
Histoplasmosis Гістоплазмоз 
Erythema multiforme Багатоформна еритема 
Scoliosis Сколиоз 
Bunion Кісточка 
Arrhythmia Аритмія 
Trigeminal neuralgia Тригемінальна невралгія 
Ankylosing spondylitis Анкілозуючий спондиліт 
Peripheral nerve disorder Периферійний нервовий розлад 
Sebaceous cyst Сальна кіста 
Poisoning due to antipsychotics Отруєння антипсихотиками 
Neurosis Невроз 
Prostate cancer Рак простати 
Cerebral edema Мозковий набряк 
Dislocation of the finger Вивих пальця 
Birth trauma Травма при народженні 
Chronic pancreatitis Хронічний панкреатит 
109 
 
Hematoma Гематома 
Carcinoid syndrome Карциноїдний синдром 
Open wound of the head Відкрита рана голови 
Seborrheic keratosis Себорейний кератоз 
Burn Опік 
Spontaneous abortion Мимовільний аборт 
Genital herpes Генітальний герпес 
Adjustment reaction Адаптаційна реакція 
Gallstone Жовчний камінь 
Multiple sclerosis Розсіяний склероз 
Zenker diverticulum Дивертикул Зенкера 
Fracture of the pelvis Перелом тазу 
 
Pneumoconiosis Пневмоконіоз 
Hyperlipidemia Гіперліпідемія 
Ulcerative colitis Виразковий коліт 
Male genitalia infection Інфекція чоловічих статевих органів 
HPV Вірус папіломи людини (ВПЛ) 
Angina Стенокардія 
Injury to the spinal cord Травма спинного мозку 
Nasal polyp Назальний поліп 
Lichen simplex Простий лишай 
Trichiasis Трихиаз 
Acariasis Акараз 
Colorectal cancer Колоректальний рак 
Skin pigmentation disorder Порушення пігментації шкіри 
Factitious disorder Фіктивний розлад 
Lymphogranuloma venereum Венерична лімфогранулема 
Galactorrhea of unknown cause Галакторея невідомої причини 
G6PD enzyme deficiency Недостатність ферменту Г6ФД 
Nerve impingement near the shoulder Затискання нерва біля плеча 
Toxoplasmosis Токсоплазмоз 
Fibroadenoma Фіброаденома 
Open wound of the hand Відкрита рана руки 
Missed abortion Перерваний аборт 
Diabetic ketoacidosis Діабетичний кетоацидоз 
Granuloma inguinale Гранульома пахова 
Obsessive compulsive disorder (OCD) Обсесивно-компульсивний розлад (ОКР) 
110 
 
Injury of the ankle Травма щиколотки 
Hyponatremia Гіпонатріємія 
Stricture of the esophagus Стеноз стравоходу 
Fracture of the ankle Перелом щиколотки 
Soft tissue sarcoma Саркома м'яких тканин 
Bone disorder Порушення кісток 
Epilepsy Епілепсія 
Personality disorder Розлад особистості 
Shingles (herpes zoster) Опоясуючий лишай (герпес зостер) 
Tourette syndrome Синдром Туретта 
Avascular necrosis Авскулярний некроз 
Strep throat Стрептококовий фарингіт 
Spinocerebellar ataxia Спіноцеребелярна атаксія 
Osteomyelitis Остеомієліт 
Sjogren syndrome Синдром Шегрена 
Adhesive capsulitis of the shoulder Адгезивний капсуліт плеча 
Viral hepatitis Вірусний гепатит 
Tonsillar hypertrophy Гіпертрофія мигдаликів 
Gastritis Гастрит 
Skin cancer Рак шкіри 
Rheumatic fever Ревматична гарячка 
Aphthous ulcer Афтозний виразок 
Tonsillitis Тонзиліт 
Intestinal cancer Рак кишечника 
Rocky Mountain spotted fever Лихоманка Скелястих гір 
Stomach cancer Рак шлунка 
Developmental disability Розвиткові вади 
Acute stress reaction Гостра стресова реакція 
Delirium Делірій 
Callus Мозоль 
Guillain Barre syndrome Синдром Гієна-Барре 
Lumbago Люмбаго 
Deviated nasal septum Викривлення носової перегородки 
Hemangioma Гемангіома 
Peripheral arterial disease Периферійна артеріальна хвороба 
Chronic back pain Хронічний біль у спині 
Heart failure Серцева недостатність 
Conjunctivitis Кон'юнктивіт 
111 
 
Herniated disk Грижа міжхребцевого диска 
Rhabdomyolysis Рабдоміоліз 
Breast infection (mastitis) Інфекція молочної залози (мастит) 
Abdominal aortic aneurysm Аневризма черевної аорти 
Pulmonary embolism Легенева емболія 
Conduct disorder Розлад поведінки 
Mastectomy Мастектомія 
Epididymitis Епідидиміт 
Premature rupture of amniotic membrane Передчасний розрив амніотичної оболонки 
Molluscum contagiosum Контагіозний молюск 
Necrotizing fasciitis Некротизуючий фасціит 
Benign vaginal discharge (leukorrhea) Доброякісні вагінальні виділення (лейкорея) 
Bladder obstruction Обструкція сечового міхура 
Melanoma Меланома 
Cervical disorder Порушення шийки матки 
Laryngitis Ларингіт 
Dyshidrosis Дисгідроз 
Poisoning due to opioids Отруєння через опіоїди 
Diaper rash Попрілості 
Lichen planus Плоский лишай 
Gastroduodenal ulcer Гастродуоденальна виразка 
Inguinal hernia Пахова грижа 
Eczema Екзема 
Asperger syndrome Синдром Аспергера 
Mucositis Мукозит 
Paronychia Пароніхія 
Open wound of the jaw Відкрита рана щелепи 
White blood cell disease Захворювання білих кров'яних клітин 
Kaposi sarcoma Саркома Капоші 
Spondylolisthesis Спондилолістез 
Pseudotumor cerebri Псевдопухлина мозку 
Conjunctivitis due to virus Вірусний кон'юнктивіт 
Open wound of the nose Відкрита рана носа1 
 
Таблиця В.2 – симптоми українською і англійською мовами 
Назва симптому англійською Назва симптому українською 
Anxiety and nervousness Тривога та нервозність 
Depression Депресія 
112 
 
Shortness of breath Задишка 
Depressive or psychotic symptoms Депресивні або психотичні симптоми 
Sharp chest pain Гострий біль у грудях 
Dizziness Запаморочення 
Insomnia Безсоння 
Abnormal involuntary movements Ненормальні мимовільні рухи 
Chest tightness Стиснення у грудях 
Palpitations Серцебиття 
Irregular heartbeat Нерегулярний серцевий ритм 
Breathing fast Швидке дихання 
Hoarse voice Хрипкий голос 
Sore throat Біль у горлі 
Difficulty speaking Труднощі з мовою 
Cough Кашель 
Nasal congestion Закладеність носа 
Throat swelling Набряк горла 
Diminished hearing Зниження слуху 
Lump in throat Комок у горлі 
Throat feels tight Відчуття стиснення у горлі 
Difficulty in swallowing Труднощі з ковтанням 
Skin swelling Набряк шкіри 
Retention of urine Затримка сечі 
Groin mass Пухлина в паху 
Leg pain Біль у нозі 
Hip pain Біль у стегні 
Suprapubic pain Біль у надлобковій зоні 
Blood in stool Кров у калі 
Lack of growth Відсутність росту 
Emotional symptoms Емоційні симптоми 
Elbow weakness Слабкість ліктя 
Back weakness Слабкість спини 
Pus in sputum Гній у мокроті 
Symptoms of the scrotum and testes Симптоми мошонки та яєчок 
Swelling of scrotum Набряк мошонки 
Pain in testicles Біль у яєчках 
Flatulence Метеоризм 
Pus draining from ear Виділення гною з вуха 
Jaundice Жовтяниця 
Mass in scrotum Пухлина у мошонці 
White discharge from eye Біле виділення з ока 
Irritable infant Дитяча роздратованність 
Abusing alcohol Зловживання алкоголем 
Fainting Непритомність 
Hostile behavior Ворожа поведінка 
Drug abuse Зловживання наркотиками 
Sharp abdominal pain Гострий біль у животі 
Feeling ill Відчуття нездужання 
Vomiting Блювання 
Headache Головний біль 
Nausea Нудота 
113 
 
Diarrhea Діарея 
Vaginal itching Свербіж вагіни 
Vaginal dryness Сухість вагіни 
Painful urination Болісне сечовипускання 
Involuntary urination Мимовільне сечовипускання 
Pain during intercourse Біль під час статевого акту 
Frequent urination Часте сечовипускання 
Lower abdominal pain Біль у нижній частині живота 
Vaginal discharge Виділення з вагіни 
Blood in urine Кров у сечі 
Hot flashes Припливи 
Intermenstrual bleeding Міжменструальна кровотеча 
Hand or finger pain Біль у руках або пальцях 
Wrist pain Біль у зап'ясті 
Hand or finger swelling Набряк рук або пальців 
Arm pain Біль у руці 
Wrist swelling Набряк зап'ястя 
Arm stiffness or tightness Скутість або стиснення у руці 
Arm swelling Набряк руки 
Hand or finger stiffness or tightness Скутість або стиснення у руках або пальцях 
Wrist stiffness or tightness Скутість або стиснення у зап'ясті 
Lip swelling Набряк губ 
Toothache Зубний біль 
Abnormal appearing skin Аномальний вигляд шкіри 
Skin lesion Ураження шкіри 
Acne or pimples Акне або прищі 
Dry lips Сухі губи 
Facial pain Біль на обличчі 
Mouth ulcer Виразка у роті 
Skin growth Ріст шкіри 
Eye deviation Відхилення ока 
Diminished vision Зниження зору 
Double vision Подвійне бачення 
Cross-eyed Косоокість 
Symptoms of eye Симптоми ока 
Pain in eye Біль в оці 
Eye moves abnormally Ненормальні рухи ока 
Abnormal movement of eyelid Ненормальні рухи повіка 
Foreign body sensation in eye Відчуття чужорідного тіла в оці 
Irregular appearing scalp Аномальний вигляд скальпу 
Swollen lymph nodes Набряк лімфатичних вузлів 
Back pain Біль у спині 
Neck pain Біль у шиї 
Low back pain Біль у попереку 
Pain of the anus Біль у анусі 
Pain during pregnancy Біль під час вагітності 
Pelvic pain Біль у тазі 
Impotence Імпотенція 
Infant spitting up Відрижка у немовляти 
Vomiting blood Блювання кров'ю 
114 
 
Regurgitation Регургітація 
Burning abdominal pain Пекучий біль у животі 
Restlessness Неспокій 
Symptoms of infants Симптоми у немовлят 
Wheezing Хрипи 
Peripheral edema Периферійний набряк 
Neck mass Пухлина на шиї 
Ear pain Біль у вусі 
Jaw swelling Набряк щелепи 
Mouth dryness Сухість у роті 
Neck swelling Набряк шиї 
Knee pain Біль у коліні 
Foot or toe pain Біль у нозі або пальцях стопи 
Bowlegged or knock-kneed Вигнуті або збиті коліна 
Ankle pain Біль у щиколотці 
Bones are painful Біль у кістках 
Knee weakness Слабкість коліна 
Elbow pain Біль у лікті 
Knee swelling Набряк коліна 
Skin moles Родимки на шкірі 
Knee lump or mass Пухлина або вузлик на коліні 
Weight gain Набір ваги 
Problems with movement Проблеми з рухом 
Knee stiffness or tightness Скутість або стиснення в коліні 
Leg swelling Набряк ноги 
Foot or toe swelling Набряк ноги або пальців стопи 
Heartburn Печія 
Smoking problems Проблеми з курінням 
Muscle pain М'язовий біль 
Infant feeding problem Проблема з годуванням немовляти 
Recent weight loss Остання втрата ваги 
Problems with shape or size of breast Проблеми з формою або розміром грудей 
Underweight Недостатня вага 
Difficulty eating Труднощі з їжею 
Scanty menstrual flow Мізерні менструації 
Vaginal pain Біль у вагіні 
Vaginal redness Почервоніння вагіни 
Vulvar irritation Подразнення вульви 
Weakness Слабкість 
Decreased heart rate Зниження серцевого ритму 
Increased heart rate Підвищення серцевого ритму 
Bleeding or discharge from nipple Кровотеча або виділення з соска 
Ringing in ear Дзвін у вусі 
Plugged feeling in ear Відчуття закладеності у вусі 
Itchy ear(s) Свербіж у вусі (вухах) 
Frontal headache Лобовий головний біль 
Fluid in ear Рідина у вусі 
Neck stiffness or tightness Скутість або стиснення шиї 
Spots or clouds in vision Плями або хмари в зору 
Eye redness Почервоніння очей 
115 
 
Lacrimation Сльозотеча 
Itchiness of eye Свербіж очей 
Blindness Сліпота 
Eye burns or stings Печіння або поколювання очей 
Itchy eyelid Свербіж повіка 
Feeling cold Відчуття холоду 
Decreased appetite Зниження апетиту 
Excessive appetite Надмірний апетит 
Excessive anger Надмірна лють 
Loss of sensation Втрата чутливості 
Focal weakness Фокусна слабкість 
Slurring words Нечітка мова 
Symptoms of the face Симптоми на обличчі 
Disturbance of memory Порушення пам'яті 
Paresthesia Парестезія 
Side pain Біль у боці 
Fever Гарячка 
Shoulder pain Біль у плечі 
Shoulder stiffness or tightness Скутість або стиснення у плечі 
Shoulder weakness Слабкість плеча 
Arm cramps or spasms Судоми або спазми у руці 
Shoulder swelling Набряк плеча 
Tongue lesions Ураження язика 
Leg cramps or spasms Судоми або спазми в нозі 
Abnormal appearing tongue Ненормальний вигляд язика 
Ache all over Біль по всьому тілу 
Lower body pain Біль у нижній частині тіла 
Problems during pregnancy Проблеми під час вагітності 
Spotting or bleeding during pregnancy Кровотеча або виділення під час вагітності 
Cramps and spasms Судоми та спазми 
Upper abdominal pain Біль у верхній частині живота 
Stomach bloating Здуття живота 
Changes in stool appearance Зміни у вигляді калу 
Unusual color or odor to urine Незвичайний колір або запах сечі 
Kidney mass Пухлина нирки 
Swollen abdomen Набряклий живіт 
Symptoms of prostate Симптоми простати 
Leg stiffness or tightness Скутість або стиснення ніг 
Difficulty breathing Труднощі з диханням 
Rib pain Біль у ребрах 
Joint pain Біль у суглобах 
Muscle stiffness or tightness Скутість або стиснення м'язів 
Pallor Блідість 
Hand or finger lump or mass Пухлина або вузлик на руці чи пальці 
Chills Озноб 
Groin pain Біль у паху 
Fatigue Втома 
Abdominal distention Здуття живота 
Regurgitation Регургітація 
Symptoms of the kidneys Симптоми нирок 
116 
 
Melena Мелена 
Flushing Припливи 
Coughing up sputum Кашель із виділенням мокротиння 
Seizures Судоми 
Delusions or hallucinations Марення або галюцинації 
Shoulder cramps or spasms Судоми або спазми у плечі 
Joint stiffness or tightness Скутість або стиснення суглобів 
Pain or soreness of breast Біль або біль у грудях 
Excessive urination at night Надмірне сечовипускання вночі 
Bleeding from eye Кровотеча з ока 
Rectal bleeding Ректальна кровотеча 
Constipation Запор 
Temper problems Проблеми з настроєм 
Coryza Риніт 
Wrist weakness Слабкість зап'ястя 
Eye strain Напруга очей 
Hemoptysis Кровохаркання 
Lymphedema Лімфедема 
Skin on leg or foot looks infected Шкіра на нозі або стопі виглядає зараженою 
Allergic reaction Алергічна реакція 
Congestion in chest Застій у грудях 
Muscle swelling Набряк м'язів 
Pus in urine Гній у сечі 
Abnormal size or shape of ear Ненормальний розмір або форма вуха 
Low back weakness Слабкість попереку 
Sleepiness Сонливість 
Apnea Апное 
Abnormal breathing sounds Ненормальні звуки дихання 
Excessive growth Надмірний ріст 
Elbow cramps or spasms Судоми або спазми у лікті 
Feeling hot and cold Відчуття спеки та холоду 
Blood clots during menstrual periods Згустки крові під час менструацій 
Absence of menstruation Відсутність менструації 
Pulling at ears Потягування за вуха 
Gum pain Біль у яснах 
Redness in ear Почервоніння у вусі 
Fluid retention Затримка рідини 
Flu-like syndrome Грипоподібний синдром 
Sinus congestion Закладеність носових пазух 
Painful sinuses Болісні пазухи 
Fears and phobias Страхи та фобії 
Recent pregnancy Недавня вагітність 
Uterine contractions Маткові скорочення 
Burning chest pain Пекучий біль у грудях 
Back cramps or spasms Судоми або спазми у спині 
Stiffness all over Скутість у всьому тілі 
Muscle cramps, contractures, or spasms М'язові судоми, контрактури або спазми 
Low back cramps or spasms Судоми або спазми у попереку 
Back mass or lump Пухлина або вузлик на спині 
Nosebleed Носова кровотеча 
117 
 
Long menstrual periods Довгі менструації 
Heavy menstrual flow Рясні менструації 
Unpredictable menstruation Непередбачувані менструації 
Painful menstruation Болісні менструації 
Infertility Безпліддя 
Frequent menstruation Часті менструації 
Sweating Потовиділення 
Mass on eyelid Пухлина на повіці 
Swollen eye Набрякле око 
Eyelid swelling Набряк повіки 
Eyelid lesion or rash Ураження або висип на повіці 
Unwanted hair Небажане волосся 
Symptoms of bladder Симптоми сечового міхура 
Irregular appearing nails Ненормальний вигляд нігтів 
Itching of skin Свербіж шкіри 
Hurts to breathe Біль при диханні 
Nailbiting Гризіння нігтів 
Skin dryness, peeling, scaliness, or roughness Сухість шкіри, лущення, лускатість або 
шорсткість 
Skin on arm or hand looks infected Шкіра на руці або кисті виглядає зараженою 
Skin irritation Подразнення шкіри 
Itchy scalp Свербіж скальпу 
Hip swelling Набряк стегна 
Incontinence of stool Нетримання калу 
Foot or toe cramps or spasms Судоми або спазми в стопі або пальцях 
Warts Бородавки 
Bumps on penis Горбики на пенісі 
Too little hair Занадто мало волосся 
Foot or toe lump or mass Пухлина або вузлик на стопі або пальцях 
Skin rash Висип на шкірі 
Mass or swelling around the anus Пухлина або набряк навколо ануса 
Low back swelling Набряк попереку 
Ankle swelling Набряк щиколотки 
Hip lump or mass Пухлина або вузлик на стегні 
Drainage in throat Виділення у горлі 
Dry or flaky scalp Сухий або лущиться скальп 
Premenstrual tension or irritability Передменструальне напруження або 
дратівливість 
Feeling hot Відчуття спеки 
Feet turned in Підвернуті стопи 
Foot or toe stiffness or tightness Скутість або стиснення в стопі або пальцях 
Pelvic pressure Тиск у тазі 
Elbow swelling Набряк ліктя 
Elbow stiffness or tightness Скутість або стиснення у лікті 
Early or late onset of menopause Ранній або пізній початок менопаузи 
Mass on ear Пухлина на вусі 
Bleeding from ear Кровотеча з вуха 
Hand or finger weakness Слабкість руки або пальців 
Low self-esteem Низька самооцінка 
Throat irritation Подразнення горла 
118 
 
Itching of the anus Свербіж ануса 
Swollen or red tonsils Набряклі або червоні мигдалики 
Irregular belly button Нерівний пупок 
Swollen tongue Набряк язика 
Lip sore Болячка на губі 
Vulvar sore Болячка на вульві 
Hip stiffness or tightness Скутість або стиснення в стегні 
Mouth pain Біль у роті 
Arm weakness Слабкість руки 
Leg lump or mass Пухлина або вузлик на нозі 
Disturbance of smell or taste Порушення запаху або смаку 
Discharge in stools Виділення у калі 
Penis pain Біль у пенісі 
Loss of sex drive Втрата статевого потягу 
Obsessions and compulsions Нав'язливі ідеї та дії 
Antisocial behavior Антисоціальна поведінка 
Neck cramps or spasms Судоми або спазми шиї 
Pupils unequal Нерівні зіниці 
Poor circulation Погане кровообіг 
Thirst Спрага 
Sleepwalking Лунатизм 
Skin oiliness Жирність шкіри 
Sneezing Чхання 
Bladder mass Пухлина сечового міхура 
Knee cramps or spasms Судоми або спазми коліна 
Premature ejaculation Передчасна еякуляція 
Leg weakness Слабкість ніг 
Posture problems Проблеми з поставою 
Bleeding in mouth Кровотеча в роті 
Tongue bleeding Кровотеча язика 
Change in skin mole size or color Зміна розміру або кольору родимки 
Penis redness Почервоніння пеніса 
Penile discharge Виділення з пеніса 
Shoulder lump or mass Пухлина або вузлик на плечі 
Polyuria Поліурія 
Cloudy eye Каламутне око 
Hysterical behavior Істерична поведінка 
Arm lump or mass Пухлина або вузлик на руці 
Nightmares Нічні кошмари 
Bleeding gums Кровотеча ясен 
Pain in gums Біль у яснах 
Bedwetting Нічне нетримання сечі 
Diaper rash Попрілості 
Lump or mass of breast Пухлина або вузлик у грудях 
Vaginal bleeding after menopause Вагінальна кровотеча після менопаузи 
Infrequent menstruation Рідкісні менструації 
Mass on vulva Пухлина на вульві 
Jaw pain Біль у щелепі 
Itching of scrotum Свербіж мошонки 
Postpartum problems of the breast Післяпологові проблеми грудей 
119 
 
Eyelid retracted Втягнута повіка 
Hesitancy Вагання 
Elbow lump or mass Пухлина або вузлик на лікті 
Muscle weakness М'язова слабкість 
Throat redness Почервоніння горла 
Joint swelling Набряк суглобів 
Tongue pain Біль у язикові 
Redness in or around nose Почервоніння у або навколо носа 
Wrinkles on skin Зморшки на шкірі 
Foot or toe weakness Слабкість стопи або пальців 
Hand or finger cramps or spasms Судоми або спазми у руках або пальцях 
Back stiffness or tightness Скутість або стиснення у спині 
Wrist lump or mass Пухлина або вузлик на зап'ясті 
Skin pain Біль у шкірі 
Low back stiffness or tightness Скутість або стиснення у попереку 
Low urine output Мала кількість сечі 
Skin on head or neck looks infected Шкіра на голові або шиї виглядає зараженою 
Stuttering or stammering Заїкання 
Problems with orgasm Проблеми з оргазмом 
Nose deformity Деформація носа 
Lump over jaw Пухлина над щелепою 
Sore in nose Болячка у носі 
Hip weakness Слабкість стегна 
Back swelling Набряк спини 
Ankle stiffness or tightness Скутість або стиснення у щиколотці 
Ankle weakness Слабкість щиколотки 
Neck weakness Слабкість шиї 
 
 
 
 
  
120 
 
ДОДАТОК Г 
 
 
 
 
 
 
ЗАСТОСУВАННЯ МЕТОДІВ АНАЛІЗУ ДАНИХ І МАШИННОГО 
НАВЧАННЯ В МЕДИЦИНІ НА ОСНОВІ БАЄСІВСЬКОГО ТА 
МЕТРИЧНОГО ПІДХОДІВ  
Текст програми 
482.ЧДТУ.5 2438-01 12 01-1 
 
Листів 6 
Розробник    ____________________  Арсен ЦОКОЛЕНКО 
 
 
 
 
 
 
 
 
 
 
Черкаси – 2025 
  
121 
 
Лістинг коду програми 
import tkinter as tk 
from tkinter import ttk 
import database 
from joblib import load 
import numpy as np 
import scripts_for_models 
def create_loadscrean(): 
    root = tk.Tk() 
    root.title("Load models") 
    root.geometry("400x100") 
    load_label = ttk.Label(root, text="LOADING") 
    load_label.pack(side="top", padx=5, pady=5) 
    load_frame = ttk.Frame(root, padding="10") 
    load_frame.pack(side="left", fill="y", padx=5, pady=5) 
    prog_bar = ttk.Progressbar(load_frame, orient="horizontal", length=350, 
mode="determinate") 
    prog_bar.pack(side="bottom", fill="y") 
    prog_bar["value"] = 0 
    load_label['text'] = 'Random forest' 
    root.update() 
    Random_Forest_Model = load('Random_Forest.joblib') 
    prog_bar["value"] = 20 
    load_label['text'] = 'Naive Bayes' 
    root.update() 
    Nayive_Bayes_Model = load('Nayive_Bayes.joblib') 
    prog_bar["value"] = 40 
    load_label['text'] = 'Logistic Regression' 
    root.update() 
    Logistic_Regression_Model = load('Logistic_Regression.joblib') 
    prog_bar["value"] = 60 
    load_label['text'] = 'XGBoost' 
    root.update() 
    XGBoost_Model = load('XGBoost.joblib') 
    prog_bar["value"] = 80 
    load_label['text'] = 'Neural Network' 
    root.update() 
    Neural_Network_Model = load('Neural_Network.joblib') 
    prog_bar["value"] = 90 
    load_label['text'] = 'KNN' 
    root.update() 
    KNN_Model = load('KNN.joblib') 
    prog_bar["value"] = 100 
    root.update() 
 
    root.destroy() 
 
    root = tk.Tk() 
    root.geometry("900x600") 
    root.title("Neural_Doctor") 
    root.grid_columnconfigure(0, weight=1) 
    root.grid_rowconfigure(0, weight=1) 
 
 
 
    # frame 1 config 
    frame_database = ttk.Frame(root, padding="10", relief="groove") 
    frame_database.grid(row=0, column=0, sticky="nsew", padx=5, pady=5) 
    frame_database.columnconfigure(0, weight=2) 
    frame_database.columnconfigure(1, weight=2) 
    frame_database.columnconfigure(2, weight=2) 
    frame_database.columnconfigure(3, weight=3) 
122 
 
    frame_database.rowconfigure(0, weight=1) 
    frame_database.rowconfigure(1, weight=1) 
    frame_database.rowconfigure(2, weight=1) 
    frame_database.rowconfigure(3, weight=1) 
    frame_database.rowconfigure(4, weight=1) 
    frame_database.rowconfigure(5, weight=1) 
 
    Patients = ttk.Combobox(frame_database, values = 
sorted(database.GET_ALL_PATIENTS_NAMES()), width=40) 
    Patients.grid(row=0, column=0, padx=5, pady=5, sticky="nsew") 
 
    def Delete(): 
        if Patients.get() == '': 
            print('error') 
        else: 
            database.DELETE_PATIENT(Patients.get()) 
            Patients.config(values=database.GET_ALL_PATIENTS_NAMES()) 
            Patients.set('') 
    Delete_Patient = ttk.Button(frame_database, text='видалити пацієнта', 
command=Delete) 
    Delete_Patient.grid(row=0, column=1, padx=5, pady=5, sticky="nsew") 
 
    Patient_sympthoms = ttk.Entry(frame_database, width=40) 
    Patient_sympthoms.grid(row=1, column=0, padx=5, pady=5, sticky="nsew") 
 
    def ShowSympthoms(): 
        try: 
            Patient_sympthoms.delete(0, 'end') 
            Patient_sympthoms.insert(0, 
database.GET_PATIENT_SYMPTHOMS_RAW(Patients.get())) 
        except: 
            print("nine") 
    Show_Symthoms = ttk.Button(frame_database, text="показати симптоми", 
command=ShowSympthoms) 
    Show_Symthoms.grid(row=1, column=1, padx=5, pady=5, sticky="nsew") 
 
    def addSympthoms(): 
        try: 
            if Patients.get() == '' or Sympthoms.get() == '': 
                print('error') 
            else: 
                database.UPPDATE_PATIENT(Patients.get(), Sympthoms.get()) 
                ShowSympthoms() 
        except: print('error') 
    Add_Sympthoms = ttk.Button(frame_database, text = 'додати симптом', 
command=addSympthoms) 
    Add_Sympthoms.grid(row=2, column=1, padx=5, pady=5, sticky="nsew") 
 
    Sympthoms = ttk.Combobox(frame_database, 
values=(sorted(database.B_ukr)+sorted(database.B_eng)), width=40) 
    Sympthoms.grid(row=2, column=0, padx=5, pady=5, sticky="nsew") 
 
    Patient_Create_Entry = ttk.Entry(frame_database, width=40) 
    Patient_Create_Entry.insert(0, "новий пацієнт") 
    Patient_Create_Entry.grid(row=3, column=0, padx=5, pady=5, sticky="nsew") 
 
    def patient_create(): 
        try: 
            if Patient_Create_Entry.get() == '': 
                print("error") 
            else: 
                database.ADD_NEW_PATIENT(Patient_Create_Entry.get()) 
                Patients.config(values=sorted(database.GET_ALL_PATIENTS_NAMES())) 
123 
 
                Patient_Create_Entry.insert(0, '') 
        except: print('error') 
    Patient_create = ttk.Button(frame_database, text='додати пацієнта', 
command=patient_create) 
    Patient_create.grid(row=3, column=1, padx=5, pady=5, sticky="nsew") 
 
    def Analyse(): 
        S = np.array(database.Vector_Maker(Patient_sympthoms.get())).reshape(1, -
1) 
        Bayes_prediction = Nayive_Bayes_Model.predict_proba(S) 
        Bayes_sorted_indices = np.argsort(Bayes_prediction[0])[::-1] 
        Bayes_top_diag = Bayes_sorted_indices[:3] 
        Bayes_top_prob = Bayes_prediction[0][Bayes_top_diag] 
        diagnos = f"{scripts_for_models.real_ukr[Bayes_top_diag[0]]} : 
{round(float(Bayes_top_prob[0]), 
3)}\n{scripts_for_models.real_ukr[Bayes_top_diag[1]]} : 
{round(float(Bayes_top_prob[1]), 
3)}'\n{scripts_for_models.real_ukr[Bayes_top_diag[2]]} : 
{round(float(Bayes_top_prob[2]), 3)}" 
        Bayes.delete("1.0", tk.END) 
        Bayes.insert('1.0', diagnos) 
 
        Log_reg_prediction = Logistic_Regression_Model.predict_proba(S) 
        Log_Reg_sorted_indices = np.argsort(Log_reg_prediction[0])[::-1] 
        Log_reg_top_diag = Log_Reg_sorted_indices[:3] 
        Log_reg_top_prob = Log_reg_prediction[0][Log_reg_top_diag] 
        diagnos = f"{scripts_for_models.real_ukr[Log_reg_top_diag[0]]} : 
{round(float(Log_reg_top_prob[0]), 
3)}\n{scripts_for_models.real_ukr[Log_reg_top_diag[1]]} : 
{round(float(Log_reg_top_prob[1]), 
3)}'\n{scripts_for_models.real_ukr[Log_reg_top_diag[2]]} : 
{round(float(Log_reg_top_prob[2]), 3)}" 
        Log_reg.delete("1.0", tk.END) 
        Log_reg.insert('1.0', diagnos) 
 
        Random_Forest_prediction = Random_Forest_Model.predict_proba(S) 
        Random_Forest_sorted_indices = np.argsort(Random_Forest_prediction[0])[::-
1] 
        Random_Forest_top_diag = Random_Forest_sorted_indices[:3] 
        Random_Forest_top_prob = 
Random_Forest_prediction[0][Random_Forest_top_diag] 
        diagnos = f"{scripts_for_models.real_ukr[Random_Forest_top_diag[0]]} : 
{round(float(Random_Forest_top_prob[0]), 
3)}\n{scripts_for_models.real_ukr[Random_Forest_top_diag[1]]} : 
{round(float(Random_Forest_top_prob[1]), 
3)}'\n{scripts_for_models.real_ukr[Random_Forest_top_diag[2]]} : 
{round(float(Random_Forest_top_prob[2]), 3)}" 
        Random_Forest.delete("1.0", tk.END) 
        Random_Forest.insert('1.0', diagnos) 
 
        XGBoost_prediction = XGBoost_Model.predict_proba(S) 
        XGBoost_sorted_indices = np.argsort(XGBoost_prediction[0])[::-1] 
        XGBoost_top_diag = XGBoost_sorted_indices[:3] 
        XGBoost_top_prob = XGBoost_prediction[0][XGBoost_top_diag] 
        diagnos = f"{scripts_for_models.real_ukr[XGBoost_top_diag[0]]} : 
{round(float(XGBoost_top_prob[0]), 
3)}\n{scripts_for_models.real_ukr[XGBoost_top_diag[1]]} : 
{round(float(XGBoost_top_prob[1]), 
3)}'\n{scripts_for_models.real_ukr[XGBoost_top_diag[2]]} : 
{round(float(XGBoost_top_prob[2]), 3)}" 
        XGBoost.delete("1.0", tk.END) 
        XGBoost.insert('1.0', diagnos) 
 
124 
 
        Neural_Network_prediction = Neural_Network_Model.predict(S) 
        Neural_Network_sorted_indices = 
np.argsort(Neural_Network_prediction[0])[::-1] 
        Neural_Network_top_diag = Neural_Network_sorted_indices[:3] 
        Neural_Network_top_prob = 
Neural_Network_prediction[0][Neural_Network_top_diag] 
        diagnos = f"{scripts_for_models.real_ukr[Neural_Network_top_diag[0]]} : 
{round(float(Neural_Network_top_prob[0]), 
3)}\n{scripts_for_models.real_ukr[Neural_Network_top_diag[1]]} : 
{round(float(Neural_Network_top_prob[1]), 
3)}'\n{scripts_for_models.real_ukr[Neural_Network_top_diag[2]]} : 
{round(float(Neural_Network_top_prob[2]), 3)}" 
        Neural_Network.delete("1.0", tk.END) 
        Neural_Network.insert('1.0', diagnos) 
 
        KNN_prediction = KNN_Model.predict_proba(S) 
        KNN_sorted_indices = np.argsort(KNN_prediction[0])[::-1] 
        KNN_top_diag = KNN_sorted_indices[:3] 
        KNN_top_prob = KNN_prediction[0][KNN_top_diag] 
        diagnos = f"{scripts_for_models.real_ukr[KNN_top_diag[0]]} : 
{round(float(KNN_top_prob[0]), 3)}\n{scripts_for_models.real_ukr[KNN_top_diag[1]]} 
: {round(float(KNN_top_prob[1]), 
3)}'\n{scripts_for_models.real_ukr[KNN_top_diag[2]]} : 
{round(float(KNN_top_prob[2]), 3)}" 
        KNN.delete("1.0", tk.END) 
        KNN.insert('1.0', diagnos) 
 
        def Meta_Analysis(Top_Diag, Top_Prob, diag, prob, acc): 
            for i in range(3): 
                if diag[i] in Top_Diag: 
                    continue 
                else: 
                    Top_Diag.append(diag[i]) 
                    Top_prob.append(0) 
            for i in range(3): 
                Top_Prob[Top_Diag.index(diag[i])] += prob[i]*acc 
            return Top_Diag, Top_Prob 
        Top_diag = [] 
        Top_prob = [] 
        Top_diag, Top_prob = Meta_Analysis(Top_diag, Top_prob, Bayes_top_diag, 
Bayes_top_prob, 0.1666) 
        Top_diag, Top_prob = Meta_Analysis(Top_diag, Top_prob, Log_reg_top_diag, 
Log_reg_top_prob, 0.167) 
        Top_diag, Top_prob = Meta_Analysis(Top_diag, Top_prob, 
Random_Forest_top_diag, Random_Forest_top_prob, 0.1699) 
        Top_diag, Top_prob = Meta_Analysis(Top_diag, Top_prob, XGBoost_top_diag, 
XGBoost_top_prob, 0.1749) 
        Top_diag, Top_prob = Meta_Analysis(Top_diag, Top_prob, 
Neural_Network_top_diag, Neural_Network_top_prob, 0.1657) 
        Top_diag, Top_prob = Meta_Analysis(Top_diag, Top_prob, KNN_top_diag, 
KNN_top_prob,0.1557) 
        for i in range(len(Top_prob)-1): 
            k = i 
            for j in range(i, len(Top_prob)): 
                if Top_prob[j] > Top_prob[k]: 
                    k = j 
            Top_diag[i], Top_diag[k] = Top_diag[k], Top_diag[i] 
            Top_prob[i], Top_prob[k] = Top_prob[k], Top_prob[i] 
        String = '' 
        for i in range(len(Top_diag)): 
            String += scripts_for_models.real_ukr[Top_diag[i]] + " " + 
str(round(Top_prob[i], 3)) + '\n' 
        Meta_Model.delete("1.0", tk.END) 
125 
 
        Meta_Model.insert('1.0', String) 
 
 
 
    Analysis = ttk.Button(frame_database, text='Аналізувати пацієнта', command = 
Analyse) 
    Analysis.grid(row=4, column=0, padx=5, pady=5, sticky="nsew", columnspan=2) 
 
 
    Bayes = tk.Text(frame_database, width=40, height=5) 
    Bayes.grid(row=0, column=3, padx=5, sticky="nsew") 
 
    Bayes_Label = ttk.Label(frame_database, text ='Наївний Баєс', width=20) 
    Bayes_Label.grid(row=0, column=2, padx=5, pady=5, sticky="nsew") 
 
    Log_reg = tk.Text(frame_database, width=40, height=5) 
    Log_reg.grid(row=1, column=3, padx=5, sticky="nsew") 
 
    Log_reg_Label = ttk.Label(frame_database, text='Логістична регресія', 
width=20) 
    Log_reg_Label.grid(row=1, column=2, padx=5, pady=5, sticky="nsew") 
 
    Random_Forest = tk.Text(frame_database, width=40, height=5) 
    Random_Forest.grid(row=2, column=3, padx=5, sticky="nsew") 
 
    Random_Forest_Label = ttk.Label(frame_database, text='Випадковий ліс', 
width=20) 
    Random_Forest_Label.grid(row=2, column=2, padx=5, pady=5, sticky="nsew") 
 
    XGBoost = tk.Text(frame_database, width=40, height=5) 
    XGBoost.grid(row=3, column=3, padx=5, sticky="nsew") 
 
    XGBoost_Label = ttk.Label(frame_database, text='Градієнтний 
бустинг\nвипадкового лісу', width=20) 
    XGBoost_Label.grid(row=3, column=2, padx=5, pady=5, sticky="nsew") 
 
    Neural_Network = tk.Text(frame_database, width=40, height=5) 
    Neural_Network.grid(row=4, column=3, padx=5, sticky="nsew") 
 
    Neural_Network_Label = ttk.Label(frame_database, text='Згорткова 
нейронна\nмережа', width=20) 
    Neural_Network_Label.grid(row=4, column=2, padx=5, pady=5, sticky="nsew") 
 
    Meta_Model = tk.Text(frame_database, width=40, height=5) 
    Meta_Model.grid(row=5, column=0, padx=5, sticky="nsew", columnspan=2) 
 
    KNN = tk.Text(frame_database, width=40, height=5) 
    KNN.grid(row=5, column=3, padx=5, sticky="nsew") 
 
    KNN_Model_Label = ttk.Label(frame_database, text='Мета аналіз | KNN', 
width=20) 
    KNN_Model_Label.grid(row=5, column=2, padx=5, pady=5, sticky="nsew") 
 
    root.mainloop() 
 
 
if __name__ == '__main__': 
    print(sorted(database.B_ukr)) 
    create_loadscrean()
ChSTU repository

ChSTU repository preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets