Управління проектом інтегрування штучного інтелекту в системи обробки даних

Перенесенко, Вадим Павлович
Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: https://er.chdtu.edu.ua/handle/ChSTU/6669
Назва:	Управління проектом інтегрування штучного інтелекту в системи обробки даних
Автори:	Підгорний, Микола Володимирович Перенесенко, Вадим Павлович
Ключові слова:	УПРАВЛІННЯ ПРОЄКТАМИ;ШТУЧНИЙ ІНТЕЛЕКТ;ОБРОБКА ДАНИХ;МАШИННЕ НАВЧАННЯ;MLOPS;AWS;КАЛЕНДАРНЕ ПЛАНУВАННЯ;УПРАВЛІННЯ РИЗИКАМИ.
Дата публікації:	17-гру-2025
Короткий огляд (реферат):	Сучасна цифрова економіка характеризується експоненційним зростанням обсягів даних, що вимагає від організацій переходу до нових моделей їх обробки та аналізу. Традиційні методи вже не забезпечують необхідної швидкості та глибини інсайтів, тому інтеграція технологій штучного інтелекту (ШІ) та машинного навчання (ML) стає критичною умовою конкурентоспроможності. Проте впровадження AI-рішень є складним організаційно-технічним завданням, що супроводжується високими ризиками, технологічною невизначеністю та потребою у специфічних компетенціях (MLOps, Data Engineering). Тому розробка ефективної моделі управління такими проєктами є актуальним науково-прикладним завданням. Метою роботи є розроблення та обґрунтування комплексної моделі управління проєктом інтегрування штучного інтелекту в систему обробки даних, що забезпечує ефективне планування, реалізацію та моніторинг впровадження AI-модуля. Об’єкт дослідження: процеси управління проєктами, спрямованими на впровадження технологій штучного інтелекту у комплексні інформаційні системи. Предмет дослідження: методи, моделі й інструменти управління проєктами інтеграції штучного інтелекту в системи обробки та аналізу даних. Результати роботи. Розроблено детальний план управління проєктом інтеграції ШІ, який включає обґрунтований бюджет, оцінку ризиків та план якості. Спроєктовано архітектуру AI-системи на базі AWS, яка включає шари Data Lake, ETL-процесів та MLOps. Результати тестування прототипу підтвердили досягнення цільових показників точності моделі та стабільності системи під навантаженням. Апробація результатів роботи. Основні положення роботи доповідалися на ІV Міжнародній науково-практичній Інтернет-конференції «Інновації та перспективні шляхи розвитку інформаційних технологій» (ІПШРІТ-2025), Черкаси, 25 листопада 2025 року. Публікації. Перенесенко В.П. Організаційно-технологічні аспекти впровадження штучного інтелекту в системи обробки даних [Текст]: // ІV Міжнародна науково-практична Інтернет-конференція ІПШРІТ-2025, Черкаси, 25 листопада 2025 року, ЧДТУ.
URI (Уніфікований ідентифікатор ресурсу):	https://er.chdtu.edu.ua/handle/ChSTU/6669
Розташовується у зібраннях:	122 Комп’ютерні науки (Управління стартапами і проектами в галузі інформаційних технологій)
Файли цього матеріалу:
Файл	Опис	Розмір	Формат
Пояснювальна записка_Перенесенко Вадим_МСТП-2402_2025-2026.pdf Restricted Access		3.08 MB	Adobe PDF	Переглянути/Відкрити Запит копії
Показати повний опис матеріалу Перегляд статистики
Усі матеріали в архіві електронних ресурсів захищено авторським правом, усі права збережено.
Extracted text
 
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ 
ЧЕРКАСЬКИЙ ДЕРЖАВНИЙ ТЕХНОЛОГІЧНИЙ УНІВЕРСИТЕТ 
 
Факультет інформаційних технологій і систем 
 
Кафедра комп’ютерних наук та системного аналізу 
 
 
 
 
 
 
Пояснювальна записка 
до кваліфікаційної роботи 
                                             магістра       
 (освітньо-кваліфікаційний рівень) 
 
на тему: «Управління проектом інтегрування штучного інтелекту  в системи 
обробки даних» 
 
 
 
 
Виконав: студент 2 курсу, групи МСТП-2402 
 
спеціальності 122 − «Комп’ютерні науки» 
                                                             (шифр і назва спеціальності) 
освітня програма «Управління стартапами                                                                                                                               
(назва освітньої програми) 
і проектами в галузі інформаційних технологій» 
 
Перенесенко Вадим Павлович 
 
Керівник                              Підгорний М.В. 
                                                                  (прізвище та ініціали) 
 
Рецензент                              Мельник В.П. 
                                                             (прізвище та ініціали) 
 
 
 
 
 
 
 
 
Черкаси 2025 року 
2 
Черкаський державний технологічний університет 
Факультет Інформаційних технологій і систем 
Кафедра Комп’ютерних наук та системного аналізу 
Освітньо-кваліфікаційний рівень Магістр 
Спеціальність 122 – комп’ютерні науки 
Освітня програма Управління стартапами і проєктами в галузі інформаційних технологій 
 
ЗАТВЕРДЖУЮ 
Завідувач кафедри КНСА 
_____________Юрій ТРИУС 
«____» ____________ 2025 р. 
 
 
 
 
 
ЗАВДАННЯ 
на кваліфікаційну роботу магістра студенту 
Перенесенку Вадиму Павловичу 
(прізвище, ім‘я, по батькові) 
1. Тема роботи: Управління проєктом інтегрування штучного інтелекту в систему 
обробки даних 
Керівник роботи  Підгорний Микола Володимирович, к.т.н., професор 
(прізвище, ім’я, по батькові, науковий ступінь, вчене звання) 
затверджені наказом університету від «07» жовтня 2025 р. №307/03-03. 
 
2. Строк подання студентом роботи до «11» грудня 2025 року. 
 
 
3. Вихідні дані до роботи: 
Результати та матеріали з проходження виробничої та переддипломної практики 
 
4. Зміст пояснювальної записки (перелік питань, що їх належить розробити): 
Вступ 
1.  Аналіз та дослідження характеристики об’єкту управління 
2.  Розробка концепції проєкту 
3.  Планування та управління проєктом 
4.  Моделювання інтеграції штучного інтелекту та аналіз результатів проєкту 
Висновки 
5. Презентація у вигляді слайдів 
 
 
 
 
 
 
 
 
3 
 
6. Консультанти розділів роботи 
Підпис, дата 
Прізвище, ініціали та посада 
Розділ завдання 
консультанта завдання видав 
прийняв 
    
    
  
7. Дата видачі завдання 02.09.2025 р.  
  
 
КАЛЕНДАРНИЙ ПЛАН 
Назва етапів кваліфікаційної Строк виконання 
№ з/п Примітка 
роботи магістра етапів роботи 
1 Видача завдання на  
до 07.10.2025 
кваліфікаційну роботу магістра. 
2 Аналіз літературних джерел,  
до 10.09.2025 
об’єкту та предмету дослідження. 
3 Написання теоретичного розділу  
до 25.10.2025 
кваліфікаційної роботи магістра. 
4 Написання аналітичного розділу  
(аналіз об’єкту й предмету до 03.11. 2025 
дослідження). 
5 Написання практичних розділів й  
висновків кваліфікаційної роботи до 27.11.2025 
магістра. 
6 Передзахист кваліфікаційної  
роботи магістра на засіданні до 28.11.2025 
випускової кафедри. 
7 Подання роботи завідувачу  
до 01.12. 2025 
кафедри КНСА. 
8 Захист кваліфікаційної роботи  
17.12.2025 
магістра. 
    
    
    
 
Студент                                   _____________________________    Вадим ПЕРЕНЕСЕНКО  
(підпис)                                                                     
 
Керівник роботи                     ____________________________     Микола ПІДГОРНИЙ 
                                          (підпис)                                                                    
 
 
 
 
4 
 
РЕФЕРАТ 
Кваліфікаційна робота магістра містить: 85 с., 14 рис., 26 табл., 38 
використаних джерел. 
Актуальність теми. Сучасна цифрова економіка характеризується 
експоненційним зростанням обсягів даних, що вимагає від організацій переходу до 
нових моделей їх обробки та аналізу. Традиційні методи вже не забезпечують 
необхідної швидкості та глибини інсайтів, тому інтеграція технологій штучного 
інтелекту (ШІ) та машинного навчання (ML) стає критичною умовою 
конкурентоспроможності. Проте впровадження AI-рішень є складним організаційно-
технічним завданням, що супроводжується високими ризиками, технологічною 
невизначеністю та потребою у специфічних компетенціях (MLOps, Data Engineering). 
Тому розробка ефективної моделі управління такими проєктами є актуальним 
науково-прикладним завданням. 
Мета та задачі дослідження. Метою роботи є розроблення та обґрунтування 
комплексної моделі управління проєктом інтегрування штучного інтелекту в систему 
обробки даних, що забезпечує ефективне планування, реалізацію та моніторинг 
впровадження AI-модуля. Для досягнення мети вирішено такі задачі: 
- проаналізовано ринок обробки даних та тенденції розвитку ШІ; 
- проведено стратегічний аналіз середовища (SWOT, STEP, 5 сил Портера); 
- сформовано концепцію проєкту, побудовано дерева проблем та цілей, 
проведено GAP-аналіз (AS-IS/TO-BE); 
- розроблено ієрархічну структуру робіт (WBS), матрицю відповідальності 
(RACI) та календарний план; 
- сплановано ресурси, бюджет та систему управління якістю і ризиками; 
- спроєктовано архітектуру системи на базі хмарних технологій (AWS) та 
проведено моделювання її роботи. 
Об’єкт дослідження: процеси управління проєктами, спрямованими на 
впровадження технологій штучного інтелекту у комплексні інформаційні системи. 
5 
Предмет дослідження: методи, моделі й інструменти управління проєктами 
інтеграції штучного інтелекту в системи обробки та аналізу даних. 
Методи дослідження. У роботі використано методи системного аналізу, 
стратегічного планування (SWOT, PEST), інструменти проєктного менеджменту 
(PMBOK, WBS, CPM, RACI), моделювання бізнес-процесів та архітектури систем 
(DFD, UML), а також методи фінансового планування. 
Результати роботи. Розроблено детальний план управління проєктом 
інтеграції ШІ, який включає обґрунтований бюджет, оцінку ризиків та план якості. 
Спроєктовано архітектуру AI-системи на базі AWS, яка включає шари Data Lake, 
ETL-процесів та MLOps. Результати тестування прототипу підтвердили досягнення 
цільових показників точності моделі та стабільності системи під навантаженням. 
Апробація результатів роботи. Основні положення роботи доповідалися на ІV 
Міжнародній науково-практичній Інтернет-конференції «Інновації та перспективні 
шляхи розвитку інформаційних технологій» (ІПШРІТ-2025), Черкаси, 25 листопада 
2025 року. 
Публікації. Перенесенко В.П. Організаційно-технологічні аспекти 
впровадження штучного інтелекту в системи обробки даних [Текст]: // ІV 
Міжнародна науково-практична Інтернет-конференція ІПШРІТ-2025, Черкаси, 25 
листопада 2025 року, ЧДТУ. 
Перелік ключових слів: УПРАВЛІННЯ ПРОЄКТАМИ, ШТУЧНИЙ 
ІНТЕЛЕКТ, ОБРОБКА ДАНИХ, МАШИННЕ НАВЧАННЯ, MLOPS, AWS, 
КАЛЕНДАРНЕ ПЛАНУВАННЯ, УПРАВЛІННЯ РИЗИКАМИ. 
 
  
 
 
 
6 
ABSTRACT 
The master's thesis contains: 85 pages, 14 figures, 26 tables, 38 used sources. 
Actuality of theme. The modern digital economy is characterized by exponential 
growth in data volumes, requiring organizations to transition to new processing and analysis 
models. Traditional methods no longer provide the necessary speed and depth of insights, 
making the integration of Artificial Intelligence (AI) and Machine Learning (ML) 
technologies a critical condition for competitiveness. However, implementing AI solutions 
is a complex organizational and technical task accompanied by high risks, technological 
uncertainty, and the need for specific competencies (MLOps, Data Engineering). Therefore, 
developing an effective management model for such projects is a relevant scientific and 
applied task. 
Purpose and objectives of the study. The purpose of the thesis is to develop and 
substantiate a comprehensive project management model for integrating artificial 
intelligence into a data processing system, ensuring effective planning, implementation, and 
monitoring of the AI module deployment. To achieve this goal, the following tasks were 
solved: 
- analyzed the data processing market and AI development trends; 
- conducted strategic environment analysis (SWOT, STEP, Porter's 5 Forces); 
- formed the project concept, built problem and objective trees, conducted GAP 
analysis (AS-IS/TO-BE); 
- developed the Work Breakdown Structure (WBS), Responsibility Assignment Matrix 
(RACI), and project schedule; 
- planned resources, budget, quality management system, and risk management; 
- designed the system architecture based on cloud technologies (AWS) and modeled its 
operation. 
Object of research: project management processes aimed at implementing artificial 
intelligence technologies into complex information systems. 
Subject of research: methods, models, and tools for managing projects of integrating 
artificial intelligence into data processing and analysis systems. 
 
7 
Research methods. The work uses methods of system analysis, strategic planning 
(SWOT, PEST), project management tools (PMBOK, WBS, CPM, RACI), business process 
and system architecture modeling (DFD, UML), as well as financial planning methods. 
Results of work. A detailed AI integration project management plan was developed, 
including a justified budget, risk assessment, and quality plan. The architecture of the AI 
system based on AWS was designed, including Data Lake, ETL processes, and MLOps 
layers. Prototype testing results confirmed the achievement of target model accuracy 
indicators and system stability under load. 
Approbation of work results. The main provisions of the work were reported at the 
IV International Scientific and Practical Internet Conference "Innovations and Prospective 
Paths of Development of Information Technologies" (IPSHRIT-2025), Cherkasy, 
November 25, 2025. 
Publications. Perenesenko V.P. Organizational and technological aspects of 
implementing artificial intelligence in data processing systems [Text]: // IV International 
Scientific and Practical Internet Conference IPSHRIT-2025, Cherkasy, November 25, 2025, 
CSTU. 
List of keywords: PROJECT MANAGEMENT, ARTIFICIAL INTELLIGENCE, 
DATA PROCESSING, MACHINE LEARNING, MLOPS, AWS, SCHEDULING, RISK 
MANAGEMENT. 
 
 
 
8 
ЗМІСТ 
ВСТУП .............................................................................................................................. 9 
1 АНАЛІЗ ТА ДОСЛІДЖЕННЯ ХАРАКТЕРИСТИКИ ОБ’ЄКТУ УПРАВЛІННЯ13 
1.1 Аналіз галузі обробки даних та сучасних технологій штучного інтелекту 13 
1.2 Проведення аналізу конкурентів ..................................................................... 16 
1.3 STEP / PEST-аналіз середовища проєкту інтеграції штучного інтелекту в 
систему обробки даних ............................................................................................. 19 
1.4 SWOT-аналіз проєкту інтегрування штучного інтелекту в систему обробки 
даних ........................................................................................................................... 23 
1.5 Аналізу галузі за моделлю пʼяти сил Портера ............................................... 27 
2 РОЗРОБКА КОНЦЕПЦІЇ ПРОЄКТУ ....................................................................... 31 
2.1 Постановка проблем та дерево проблем ............................................................. 31 
2.2 Цілі проєкту та дерево цілей ............................................................................ 33 
2.3 Формування концепції майбутньої системи .................................................. 35 
2.4 Моделювання поточного та цільового станів системи обробки даних ...... 39 
3 ПЛАНУВАННЯ ТА ПРОЕКТУВАННЯ ЗАСТОСУНКУ ...................................... 46 
3.1 Управління змістом та декомпозиція робіт проєкту ..................................... 46 
3.2 Організаційна структура та розподіл відповідальності ................................ 49 
3.3 Розробка календарного плану проєкту ........................................................... 52 
3.4 Управління якістю проєкту .............................................................................. 58 
3.5 Управління ризиками проєкту ......................................................................... 61 
4 МОДЕЛЮВАННЯ ІНТЕГРАЦІЇ ШТУЧНОГО ІНТЕЛЕКТУ ТА АНАЛІЗ 
РЕЗУЛЬТАТІВ ПРОЄКТУ ........................................................................................... 66 
4.1 Опис моделей, які характеризують продукт проєкту ................................... 66 
4.2 Моделювання системи та її інформаційних потоків ..................................... 69 
4.3 Моделювання взаємодії компонентів ............................................................. 73 
4.4 Аналіз результатів моделювання та тестування системи ............................. 76 
ВИСНОВКИ ................................................................................................................... 80 
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ..................................................................... 82 
 
9 
ВСТУП 
Актуальність теми. Стрімкий розвиток цифрових технологій, вибухове зростання 
обсягів даних та поява нових підходів до побудови інформаційних систем визначають 
сучасні тенденції розвитку світової економіки. Сьогодні обробка даних стала 
ключовим стратегічним ресурсом, який прямо впливає на ефективність прийняття 
управлінських рішень, оптимізацію бізнес-процесів та формування конкурентних 
переваг організацій. У таких умовах особливу увагу привертають технології 
штучного інтелекту (ШІ), здатні забезпечити автоматичний аналіз 
великомасштабних, неоднорідних та високошвидкісних потоків даних, виявлення 
прихованих закономірностей, формування персоналізованих рекомендацій і 
прогнозів.  
Інтеграція штучного інтелекту в системи обробки даних стала одним із 
ключових напрямів цифрової трансформації у бізнесі, державному секторі, охороні 
здоров’я, фінансах, виробництві та електронній комерції. Рішення на основі ШІ 
дозволяють суттєво підвищити рівень автоматизації, знизити людський фактор, 
скоротити витрати на обробку інформації та підвищити точність аналітичних 
моделей. Зокрема, у сфері e-commerce та цифрових платформ спостерігається активне 
використання машинного навчання та моделей глибинного навчання для оптимізації 
воронок продажу, прогнозування поведінки користувачів, рекомендації релевантних 
продуктів, оптимізації рекламних кампаній і побудови персоналізованих 
маркетингових стратегій.    
У той же час, незважаючи на очевидні переваги ШІ та його широке 
застосування, проєкти інтеграції інтелектуальних модулів у складні системи обробки 
даних залишаються високоризиковими та ресурсомісткими. Вони потребують 
глибокого аналізу технічних вимог, ретельного оцінювання архітектури даних, 
визначення відповідних алгоритмів і моделей, підготовки інфраструктури MLOps, 
організації процесів навчання та валідації моделей, забезпечення якості даних, а 
також контролю безпеки та приватності. Таким чином, успішне впровадження ШІ є 
не лише інженерним викликом, а й комплексним управлінським завданням, що 
10 
вимагає застосування сучасних проєктних методологій, технік стратегічного 
планування та системного підходу.    
Актуальність дослідження зумовлена зростаючим попитом на 
інтелектуалізацію інформаційних систем, які працюють з великими обсягами даних. 
У більшості компаній відсутня можливість самостійно будувати повноцінні AI-
платформи, розробляти ML-моделі та забезпечувати їх інтеграцію в операційні 
процеси. Водночас, ринковий тиск, конкуренція та зростання вимог користувачів 
вимагають від організацій швидкого переходу до автоматизованих систем аналізу 
даних. Це створює потребу в розробці ефективних моделей управління проєктами 
інтеграції ШІ, які дозволять систематизувати процеси, мінімізувати ризики та 
забезпечити високі стандарти якості. 
Актуальність дослідження зумовлена зростаючим попитом на 
інтелектуалізацію інформаційних систем, які працюють з великими обсягами даних. 
У більшості компаній відсутня можливість самостійно будувати повноцінні AI-
платформи, розробляти ML-моделі та забезпечувати їх інтеграцію в операційні 
процеси. Водночас, ринковий тиск, конкуренція та зростання вимог користувачів 
вимагають від організацій швидкого переходу до автоматизованих систем аналізу 
даних. Це створює потребу в розробці ефективних моделей управління проєктами 
інтеграції ШІ, які дозволять систематизувати процеси, мінімізувати ризики та 
забезпечити високі стандарти якості. 
Особливої актуальності набувають підходи до управління AI-проєктами у 
сферах, де критично важливими є швидкість обробки даних, точність прогнозних 
моделей та можливість масштабування інфраструктури. До таких сфер належить 
електронна комерція, де результати аналітики безпосередньо впливають на конверсії, 
дохід, середній чек та ефективність маркетингових кампаній. Саме тому інтеграція 
ШІ в системи обробки даних e-commerce платформ, таких як модулі оптимізації 
upsell-воронок, аналітичні платформи чи рекомендаційні системи, є важливим 
прикладом складного й актуального ІТ-проєкту, який потребує грамотного 
управління всім життєвим циклом. 
11 
Мета і задачі дослідження. Метою магістерської роботи є розроблення та 
обґрунтування комплексної моделі управління проєктом інтегрування штучного 
інтелекту в систему обробки даних, що забезпечує ефективне планування, 
координацію, реалізацію, моніторинг та контроль процесів впровадження AI-модуля 
у реальну інформаційну інфраструктуру. 
Для досягнення поставленої мети визначено такі основні завдання дослідження: 
 Проаналізувати стан ринку обробки даних, тенденції розвитку ШІ та 
особливості застосування моделей машинного навчання у сучасних 
інформаційних системах; 
 Провести стратегічний аналіз за методами SWOT, STEP та «п’яти сил Портера» 
з метою визначення зовнішніх і внутрішніх факторів, що впливають на 
реалізацію проєкту; 
 Сформувати задум проєкту інтеграції ШІ, включаючи визначення проблем, 
постановку цілей, побудову дерева проблем та дерева цілей; 
 Розробити концептуальну модель AI-інтеграції, описати архітектуру модуля, 
структуру потоків даних та взаємодію компонентів; 
 Побудувати ієрархічну структуру робіт (WBS), визначити ролі та 
відповідальність учасників проєкту, створити матрицю RACI; 
 Розробити календарний план проєкту, визначити критичний шлях, обчислити 
необхідні ресурси та сформувати бюджет; 
 Оцінити ризики, пов’язані з інтеграцією штучного інтелекту, та сформувати 
рекомендації з управління ними; 
 Продемонструвати прототип або структурну архітектуру AI-модуля та його 
інтеграції в систему обробки даних; 
 Сформувати узагальнюючі висновки та рекомендації щодо масштабування, 
подальшого розвитку та експлуатації інтегрованої системи. 
Об’єкт дослідження є процеси управління проєктами, спрямованими на 
впровадження технологій штучного інтелекту у комплексні інформаційні системи. 
12 
Предметом дослідження є методи, моделі й інструменти управління проєктами 
інтеграції штучного інтелекту в системи обробки та аналізу даних. 
У роботі застосовано методи системного, функціонального та структурного 
аналізу, інструменти проєктного менеджменту (PMBOK, Agile, Scrum), методи 
стратегічного аналізу (SWOT, STEP, Porter’s Five Forces), техніки моделювання 
бізнес- та інформаційних процесів (DFD, BPMN), а також підходи до планування 
(WBS, RACI, CPM). Це дозволило забезпечити комплексний характер дослідження та 
створити практично орієнтовану модель управління AI-проєктом. 
Наукова новизна роботи полягає у формуванні цілісної моделі управління 
проєктом інтеграції штучного інтелекту, яка враховує особливості життєвого циклу 
AI-рішень, специфіку MLOps-процесів, потреби валідації моделей, забезпечення 
якості даних та вимоги до безперервного моніторингу.  
Практичне значення роботи полягає у можливості застосування отриманих 
результатів під час впровадження систем аналітики та автоматизації в компаніях, що 
працюють з великими даними, а також у розробці рекомендаційних, прогнозних або 
персоналізаційних AI-модулів для цифрових платформ, зокрема у сфері електронної 
комерції. 
Публікації. Перенесенко В.П. Організаційно-технологічні аспекти 
впровадження штучного інтелекту в системи обробки даних [Текст]:  //  ІV 
Міжнародна науково-практична Інтернет-конференція ІПШРІТ-2025, Черкаси, 25 
листопада 2025 року, ЧДТУ  
  
13 
1 АНАЛІЗ ТА ДОСЛІДЖЕННЯ ХАРАКТЕРИСТИКИ ОБ’ЄКТУ 
УПРАВЛІННЯ 
1.1 Аналіз галузі обробки даних та сучасних технологій штучного інтелекту 
Сучасна цифрова економіка характеризується безпрецедентним зростанням 
обсягів даних, що генеруються користувачами, сенсорними системами, мобільними 
пристроями та корпоративними інформаційними платформами. За оцінками 
аналітичних агентств IDC та Gartner, сукупний світовий обсяг даних перевищив 120 
зетабайт у 2023 році та продовжує збільшуватися зі швидкістю понад 20% на рік. У 
цих умовах сфера обробки даних (data processing) стала одним із стратегічних 
напрямків розвитку інформаційних технологій, оскільки забезпечує базові 
можливості для зберігання, трансформації, очищення, аналізу та візуалізації даних [1; 
2]. 
Сучасні системи обробки даних мають відповідати низці вимог, серед яких 
масштабованість, надійність, швидкодія, можливість інтеграції з різними джерелами 
інформації, підтримка потокової аналітики та здатність працювати з багатовимірними 
та неструктурованими даними. У результаті традиційні підходи до обробки 
інформації, що базувалися на централізованих СУБД та ручному аналізі, втратили 
актуальність. Їх на зміну прийшли розподілені обчислювальні системи, хмарні 
сховища, високопродуктивні ETL-процеси, дата-лейки, дата-сторхауси та 
оркестраційні платформи [3]. 
Паралельно з розвитком технологій обробки даних сформувався потужний 
тренд інтеграції методів штучного інтелекту у процеси аналітики та прийняття 
рішень. Штучний інтелект, зокрема машинне навчання (ML), глибинне навчання (DL) 
та великі мовні моделі (LLM), перетворився на критично важливу складову сучасних 
інформаційних систем. Його застосування дозволяє суттєво підвищити швидкість 
обробки даних, автоматизувати прийняття рішень, створювати персоналізовані 
цифрові сервіси, будувати прогнозні моделі та зменшувати потребу в ручній 
експертній роботі [4; 5]. 
14 
У структурі сучасного ринку обробки даних можна виділити декілька ключових 
сегментів:  
1. Технології зберігання та керування даними. До них належать сучасні СУБД 
(PostgreSQL, MySQL, Oracle), NoSQL-системи (MongoDB, Cassandra), 
розподілені файлові системи (HDFS), дата-лейки (AWS S3, Delta Lake), дата-
сторхауси (Google BigQuery, Snowflake). Їх основне завдання — 
забезпечення надійного доступу до даних та можливості масштабування в 
умовах високих навантажень; 
2. Інструменти обробки даних та побудови ETL/ELT-процесів. Цей сегмент 
представлений такими технологіями, як Apache Spark, Flink, Kafka, Airflow, 
dbt [3]. Дані технології дозволяють створювати високопродуктивні процеси 
трансформації, очищення та агрегації великих масивів даних; 
3. Платформи машинного навчання та MLOps. Стрімко зростає популярність 
спеціалізованих платформ для побудови, розгортання та моніторингу 
моделей машинного навчання: TensorFlow Extended (TFX), Kubeflow, 
MLflow, Vertex AI, SageMaker [6; 7]. Завдяки цим інструментам організації 
можуть автоматизувати цикл розробки, навчання, тестування та оновлення 
моделей. 
4. Системи глибинного навчання та великі мовні моделі. Останніми роками 
саме великі мовні моделі (LLM), такі як GPT, Claude, Llama, стали 
каталізатором значних зрушень у галузі, оскільки забезпечили можливість 
створення універсальних когнітивних сервісів: генеративних рекомендацій, 
аналізу тексту, класифікації, зведення інформації та інтерактивної взаємодії 
з користувачем. Моделі цього класу застосовуються для автоматизації 
маркетингу, аналізу поведінки користувачів, персоналізації продуктів та 
побудови інтелектуальних інтерфейсів. 
5. Сервіси бізнес-аналітики та BI-платформи. Серед найбільш поширених 
рішень виділяються Power BI, Tableau, Looker, Metabase [3]. Вони 
дозволяють здійснювати візуалізацію даних, формувати управлінські панелі 
та автоматизувати звітність. 
15 
Поєднання технологій обробки даних із моделями штучного інтелекту 
сформувало нову парадигму - Intelligent Data Processing, у межах якої аналітичні 
процеси стають не лише автоматизованими, але й адаптивними та здатними до 
самонавчання [3; 4]. 
Сучасні тенденції галузі свідчать про поступовий перехід від класичних 
аналітичних систем до платформ, що працюють у режимі реального часу (real-time 
analytics), підтримують контекстну обробку, сценарне моделювання та 
персоналізовані рекомендації. Наприклад, у сфері електронної комерції активний 
розвиток отримують модулі прогнозування купівельної поведінки, системи 
рекомендацій товарів, моделі оцінки ризиків та інтелектуальні інструменти 
оптимізації воронок продажів [8; 9]. 
Водночас зростає роль концепції Data-driven decision making, яка передбачає 
прийняття управлінських рішень виключно на основі об’єктивних аналітичних даних, 
а не інтуїтивних припущень. Штучний інтелект, інтегрований у систему обробки 
даних, є ключовим елементом цього підходу, оскільки дозволяє організаціям 
виявляти закономірності, неможливі для ручного аналізу [3; 4; 5]. 
Однак швидке впровадження ШІ у галузі обробки даних супроводжується 
низкою викликів [6; 7]. Серед основних проблем можна виділити: 
 високу вартість розгортання та обслуговування моделей; 
 складність інтеграції AI-платформ у наявні системи; 
 брак кваліфікованих спеціалістів у сфері ML та MLOps; 
 потребу в забезпеченні прозорості моделей (explainability) та відповідності 
етичним нормам; 
 питання безпеки та приватності даних; 
 потребу у високоякісних, чистих та репрезентативних даних. 
Таким чином, ринок обробки даних і штучного інтелекту перебуває у фазі 
активного становлення та масштабування. Інтеграція ШІ у системи обробки даних є 
не просто технічною інновацією, а стратегічною необхідністю для компаній, що 
прагнуть залишатися конкурентоспроможними в умовах цифрової економіки. Це 
визначає актуальність побудови ефективних моделей управління відповідними 
16 
проєктами, що забезпечують контроль якості, планування ресурсів, управління 
ризиками, організаційну структурованість та економічну доцільність впровадження 
таких рішень [3; 4; 5]. 
1.2 Проведення аналізу конкурентів 
Ринок рішень для обробки даних та впровадження штучного інтелекту є 
висококонкурентним, динамічним та таким, що стрімко розвивається під впливом 
генеративних моделей, хмарних технологій, автоматизованих ML-сервісів та систем 
аналітики нового покоління [8; 9]. Конкурентні продукти у цій сфері можна умовно 
розподілити на чотири основні категорії: 
- хмарні платформи для зберігання та обробки даних (Data Platforms); 
- платформи машинного навчання та MLOps; 
- AI-аналітика для e-commerce та маркетингу; 
- генеративні ШІ-платформи з функціями data-аналізу. 
Кожна з категорій містить рішення, які частково перекривають функціонал 
майбутньої системи інтеграції ШІ в обробку даних, але не пропонують комплексного 
підходу саме в тому форматі, який є предметом дослідження [6; 7]. 
У таблиці 1.1 наведено порівняльний аналіз провідних хмарних платформ для 
зберігання та обробки даних. Оцінювання виконувалося за критеріями переваг та 
недоліків кожної системи з урахуванням масштабованості, можливостей інтеграції з 
інструментами машинного навчання та загальної придатності для використання в AI-
проєктах. Таблиця дозволяє сформувати уявлення про сильні та слабкі сторони 
кожного рішення та визначити їх відповідність потребам проєкту інтеграції ШІ [3]. 
Таблиця 1.1 — Аналіз хмарних платформ для обробки даних 
Платформа Переваги Недоліки 
Serverless, авто-маштабування; Висока вартість при великих 
Google BigQuery Вбудований BigQuery ML; обсягах даних; 
Інтеграція з Vertex AI Складність кастомізації 
 
 
 
17 
Продовження таблиці 1.1 
Платформа Переваги Недоліки 
Інтеграція з SageMaker; Складність розгортання; 
AWS LakeHouse Потужна клауд- Потребує експертного 
інфраструктура; адміністрування; 
Окреме масштабування Обмежені можливості real-time 
Compute/Storage; аналізу; 
Snowflake 
Підтримка Snowpark для ML; Додаткові модулі для AI; 
Висока продуктивність;  
 
У таблиці 1.2 представлено характеристику ключових платформ для 
машинного навчання та MLOps. Порівняння здійснювалося на основі 
функціональних можливостей, рівня автоматизації ML-процесів, доступності 
інструментів для розробників та організаційної складності впровадження. Наведені 
дані дозволяють оцінити ступінь зрілості кожної платформи та визначити їх 
відповідність задачам побудови повноцінного AI-пайплайну [6; 7]. 
Таблиця 1.2 — Платформи ML та MLOps 
Платформа Можливості Обмеження 
AutoML Висока ціна інференсу 
Google Vertex 
LLM/Generative AI Орієнтація на enterprise 
AI 
MLOps pipelines 
Повний ML lifecycle Низька зручність для новачків 
AWS SageMaker Моніторинг моделей Висока складність конфігурації 
Інтеграція з AWS data stack 
Єдиний Lakehouse Високий поріг входу 
Databricks + 
ETL + ML + governance Не надає готових бізнес-рішень 
MLflow 
Стандартизований MLflow 
 
У таблиці 1.3 наведено порівняльний аналіз аналітичних та персоналізаційних 
рішень, орієнтованих на сферу електронної комерції. Оцінка проводилася за такими 
критеріями: глибина поведінкової аналітики, наявність прогнозних моделей, 
можливості персоналізації та обмеження застосування. Таблиця демонструє, що 
жодне з представлених рішень не забезпечує комплексної інтеграції ML, LLM та 
аналізу воронок продажів, що підтверджує наявність ринкової ніші для проєкту [8; 9]. 
18 
Таблиця 1.3 — AI-аналітика для e-commerce 
Платформа Можливості Обмеження 
Немає глибокого behavioral 
Генерація тексту 
Shopify Magic modeling 
Базова аналітика 
Не аналізує upsell-фанели 
Фокус на email-маркетингу 
Прогноз відтоку 
Klaviyo AI Немає даних про конверсійні 
Сегментація аудиторій 
фанели 
Закриті алгоритми 
Персоналізація товарів 
Rebuy Engine Брак інсайтів про структуру 
Рекомендаційні блоки 
воронок 
Не дає рекомендацій по 
ROAS-аналітика 
Triple Whale AI UX/фанелах 
Атрибуція продажів 
Обмежений набір ML-моделей 
 
У таблиці 1.4 наведено порівняння генеративних ШІ-платформ, які можуть бути 
використані як основа для створення інтелектуальних модулів аналітики [7; 9]. 
Оцінка здійснювалася за показниками функціональності, універсальності, гнучкості 
інтеграції та потенційних технічних обмежень. Наведений аналіз дозволяє визначити 
оптимальні AI-технології для проєкту та оцінити залежність від зовнішніх 
постачальників [7]. 
Таблиця 1.4 — Генеративні ШІ-платформи для аналітик 
Платформа Переваги Недоліки 
Універсальні LLM Немає нативного data-pipeline 
Інтеграція через API Залежність від цін 
OpenAI API 
Можливість кастомних 
моделей 
Високий рівень reasoning Потребує власного інтеграційного 
Anthropic Claude Відмінна робота з великими шару 
текстами 
Швидкий пошук і аналітика Не працює з приватними даними 
Perplexity 
Узагальнення великих обсягів компаній 
Enterprise 
інформації 
Можливість локального Потребує GPU-інфраструктури 
Meta Llama розгортання Нижча якість за GPT-5/Claude 
Контроль над моделлю 
19 
1.3 STEP / PEST-аналіз середовища проєкту інтеграції штучного інтелекту в 
систему обробки даних 
STEP-аналіз (Social, Technological, Economic, Political) є одним із ключових 
інструментів стратегічного дослідження зовнішнього середовища проєкту. Він 
дозволяє оцінити фактори макросередовища, які впливають на можливість реалізації 
проєкту інтеграції штучного інтелекту в системи обробки даних, а також визначити 
потенційні можливості та загрози [11; 12; 14]. 
В умовах глобального розвитку цифрових технологій, стрімкої автоматизації та 
широкого впровадження моделей машинного навчання STEP-аналіз є критично 
важливим для оцінки життєздатності AI-проєктів, особливо тих, що працюють із 
великими даними, складними даними користувачів і прогнозною аналітикою [11; 14]. 
1. Політичні фактори (Political) 
- Регулювання персональних даних (GDPR, CCPA, Закон „Про захист 
персональних даних“). Інтеграція ШІ в обробку даних безпосередньо 
залежить від дотримання норм конфіденційності. Підвищена увага урядів до 
захисту приватності накладає додаткові вимоги на архітектуру AI-систем, 
зокрема анонімізацію даних, аудит доступу та логування. 
- Державна цифровізація та програми підтримки ІТ-галузі. Низка країн, 
зокрема Україна, активно впроваджують програми розвитку штучного 
інтелекту („Концепція розвитку AI в Україні“, 2021), а також ініціативи 
підтримки цифрових сервісів (Diia, цифрова трансформація держпослуг). Це 
створює сприятливий політичний клімат для AI-проєктів. 
- Регулювання хмарних технологій та штучного інтелекту. У 2023–2025 роках 
ЄС розробляє AI Act — перший всеосяжний законодавчий акт щодо 
використання ШІ. Його прийняття ускладнить запуск системи без чіткої 
документації, аудиту моделей та управління ризиками. 
- Політична стабільність і вплив воєнних дій. В Україні фактор безпеки та 
ризики пов’язані з воєнною ситуацією створюють загрози для стабільності 
інфраструктури, бізнес-процесів та збереження даних. Це посилює вимоги 
до резервного копіювання, геореплікації та клаудових рішень. 
20 
2. Eкономічні фактори (Economic) 
- Глобальний ріст інвестицій у штучний інтелект. За даними McKinsey, світові 
AI-інвестиції у 2023 році перевищили $180 млрд. Бізнес активно переходить 
до автоматизації, що стимулює попит на платформи обробки даних із 
вбудованим ШІ. 
- Зростання ринку e-commerce та персоналізаційних сервісів. За даними 
Shopify і Grand View Research [8], світовий ринок e-commerce AI зростає зі 
швидкістю понад 27% на рік. Це створює стійкий попит на рішення з 
поведінкової аналітики та оптимізації воронок продажів. 
- Висока вартість експлуатації моделей (LLM + ML). Це формує економічні 
ризики для підприємств із великими обсягами даних. 
- Перехід бізнесу до хмарних технологій. Більшість компаній використовують 
AWS, GCP, Azure - це знижує витрати на розгортання і підвищує доступність 
інфраструктури. 
- Економічна нестабільність та інфляція. Зовнішні кризові фактори знижують 
інвестиційну активність, що потенційно може вплинути на темпи 
впровадження дорогої AI-інфраструктури [3; 8]. 
3. Соціальні фактори (Social) 
- Зростання очікувань користувачів щодо персоналізації. Сучасні користувачі 
очікують індивідуальний досвід — персональні рекомендації, адаптивні 
пропозиції, автоматизовані сценарії. Це збільшує попит на AI-модулі у 
платформах e-commerce та SaaS. 
- Глобальна цифрова грамотність. У 2020–2025 роках зріс рівень знань у сфері 
роботи з даними та цифровими продуктами. Це створює попит на аналітичні 
інструменти, які можуть використовувати не лише інженери, а й 
маркетологи, менеджери, підприємці. 
- Зміна моделі поведінки споживачів. Користувачі частіше купують онлайн, 
проводять більше часу на мобільних пристроях та очікують швидкого й 
простого UX. AI-модуль може оптимізувати взаємодію користувача з 
магазинами.  
21 
- Підвищена увага до конфіденційності. Користувачі стали більш уважними 
до того, як використовуються їхні дані. Це вимагає прозорості в застосуванні 
машинного навчання. 
- Потреба бізнесу у швидких рішеннях. У висококонкурентному середовищі 
компанії прагнуть автоматизувати процеси обробки даних, щоб швидше 
реагувати на зміни попиту. 
4. Технологічні фактори (Technological) 
- Бурхливий розвиток моделей машинного і глибинного навчання. Зростання 
ефективності LLM, трансформерів, рекомендаційних систем і прогнозних 
моделей дозволяє створювати автоматичні системи прийняття рішень [3; 6]. 
- Поява хмарних AI-платформ. Vertex AI, AWS SageMaker, Azure ML надають 
готові інструменти MLOps, які знижують поріг входу для бізнесу. 
- Генеративний ШІ (Generative AI). Новий клас систем дозволяє: генерувати 
текстові рекомендації, аналізувати контент, автоматизувати створення 
маркетингових оферів, пояснювати аналітику у природній мові.  
- Широке застосування подійних архітектур (Event-Driven Architecture) та 
потокових платформ (Kafka, Flink). Це дозволяє опрацьовувати поведінкові 
дані в реальному часі. 
- Розвиток MLOps-практик. Автоматизація навчання, тестування та 
моніторингу моделей стала стандартом індустрії. 
- Інтеграція AI через API. Платформи (OpenAI, Cohere, Anthropic, Mistral) 
дозволяють швидко інтегрувати AI в існуючі системи обробки даних [7]. 
- Проблеми масштабування. Великі моделі потребують GPU-інфраструктури, 
оптимізованого inference та кешування. 
Проведений STEP-аналіз дозволив сформувати системне уявлення про зовнішні 
умови, у яких розвивається проєкт інтеграції штучного інтелекту в систему обробки 
даних. Оцінка політичних, економічних, соціальних і технологічних факторів 
показала, що середовище функціонування проєкту є динамічним, технічно насиченим 
та таким, що швидко змінюється під впливом глобальних тенденцій цифрової 
трансформації. 
22 
Аналіз політичних чинників засвідчив наявність одночасно сприятливих і 
стримуючих умов. З одного боку, державні програми цифровізації, розвиток 
національної стратегії штучного інтелекту та орієнтація України на інтеграцію до 
європейських цифрових стандартів створюють підґрунтя для активного 
впровадження новітніх технологій у бізнес-практики. З іншого боку, посилення 
регуляторних вимог до обробки персональних даних (GDPR, AI Act, українське 
законодавство) формує необхідність суворого контролю за конфіденційністю, що 
ускладнює процеси інтеграції ШІ-рішень у робочі системи та підвищує вартість їх 
реалізації. 
Економічні фактори мають переважно позитивний вплив. Глобальні інвестиції 
у штучний інтелект стабільно зростають, ринок e-commerce демонструє високі темпи 
розвитку, а бізнес дедалі більше переходить до моделей, заснованих на обробці даних. 
Це означає, що впровадження інтелектуальних рішень має високу економічну 
доцільність та відповідає тенденціям розвитку підприємств у світі та в Україні. 
Водночас необхідність масштабної інфраструктури, залежність від хмарних сервісів 
і висока вартість підтримки ML-моделей є стримувальними чинниками, які 
потребують врахування при бюджетуванні проєкту. 
Соціальні фактори формують сприятливе середовище для впровадження 
проєкту, оскільки сучасні споживачі та бізнес-користувачі очікують персоналізації, 
швидких і точних рекомендацій, прозорої аналітики та зручної взаємодії з цифровими 
сервісами. Зростання цифрової грамотності та зміна поведінкових моделей 
користувачів стимулюють запит на інтелектуальні інструменти [8; 9], що 
автоматизують маркетингові та управлінські процеси. У цьому контексті 
впровадження AI-модуля для аналізу даних є логічним продовженням розвитку 
сучасних сервісів. 
Технологічні фактори виявилися найбільш вагомими та визначальними. 
Стрімкий розвиток великих мовних моделей, хмарних платформ, ML-інфраструктури 
та систем потокової обробки даних створює необхідні передумови для впровадження 
інтелектуальних модулів обробки даних. Водночас технологічна складність рішень, 
потреба у фахівцях високої кваліфікації та швидке моральне старіння технологій 
23 
формують ризики, які впливають на довгострокову стійкість та масштабованість 
проєкту. 
Узагальнюючи результати STEP-аналізу, можна зробити висновок, що 
зовнішнє середовище, в якому реалізується проєкт інтеграції штучного інтелекту, 
загалом є сприятливим для його впровадження. Потужний технологічний розвиток, 
висока економічна підтримка ринку та соціальний запит на автоматизацію значно 
перевищують потенційні обмеження, пов’язані з регуляторними вимогами, потребою 
в інфраструктурі та технологічними викликами. Це підтверджує, що проєкт є 
актуальним, перспективним і має значний потенціал для практичної реалізації у сфері 
електронної комерції та цифрових платформ [11-14]. 
1.4  SWOT-аналіз проєкту інтегрування штучного інтелекту в систему 
обробки даних 
 SWOT-аналіз дозволяє комплексно оцінити внутрішні та зовнішні фактори, що 
впливають на реалізацію проєкту інтеграції ШІ в системи обробки даних. Цей 
інструмент відображає сильні та слабкі сторони проєкту, а також можливості та 
загрози зовнішнього середовища, що сприяє обґрунтуванню управлінських рішень на 
ранніх етапах проєктування та планування [10; 12; 13]. 
1. Сильні сторони (Strengths) 
- Високий рівень інноваційності рішення. Інтеграція LLM, ML-моделей та 
MLOps-дисциплін створює конкурентну перевагу та підвищує 
інтелектуальну цінність системи. 
- Комплексний підхід до аналізу поведінкових даних користувачів. Система 
обробляє подійні дані (events), конверсії, кліки, трафік, дані оферів, що 
дозволяє будувати точні прогностичні моделі. 
- Можливість автоматизації ключових бізнес-процесів e-commerce. AI-модуль 
оптимізує: upsell-конверсії, структуру воронки продажів, формування 
персоналізованих оферів. 
24 
- Високий рівень масштабованості. Використання сучасних cloud-платформ 
та контейнеризації (Docker/Kubernetes) дозволяє обробляти великі обсяги 
даних. 
- Гнучка архітектура інтеграцій. API-орієнтована архітектура дає можливість 
легко інтегрувати рішення у вже існуючі системи e-commerce та SaaS-
платформи. 
- Інтелектуальна підтримка прийняття рішень. AI-агент надає маркетологам 
пояснення, рекомендації та пропозиції щодо оптимізації сторінок та оферів. 
- Зниження людського фактора. Автоматичні моделі працюють точніше й 
стабільніше за ручний аналіз.  
- Висока додана цінність для бізнесів малого та середнього розміру. Дозволяє 
SMB отримувати рівень аналітики, доступний раніше лише enterprise-
компаніям. 
2. Слабкі сторони (Weaknesses) 
- Висока залежність від якості вхідних даних. Неповні, некоректні або 
„зашумлені“ дані суттєво знижують точність моделей. 
- Складність розгортання та підтримки ML-інфраструктури. Потрібні 
спеціалісти з: Data Engineering, ML Engineering, MLOps, DevOps. 
- Підвищені вимоги до обчислювальних ресурсів. Навчання моделей потребує 
GPU, а LLM-інференс — дорогих API. 
- Необхідність регулярного оновлення та перенавчання моделей. Поведінка 
користувачів змінюється, тому моделі можуть деградувати. 
- Потенційні складнощі інтеграції з застарілими або „монолітними“ 
системами. Деякі e-commerce продукти мають обмежені інтеграційні 
можливості. 
- Висока чутливість до затримок та пропускної здатності даних. Для real-time 
аналітики необхідні стабільні канали передачі даних. 
- Вартість підтримки інфраструктури може зрости при масштабуванні. 
3. Можливості (Opportunities) 
25 
- Стрімке зростання ринку AI-рішень у сфері e-commerce. За даними Grand 
View Research, CAGR ринку AI-eCommerce перевищує 27%. 
- Підвищення попиту на персоналізацію пропозицій. Сучасні магазини 
прагнуть індивідуальних оферів для підвищення конверсій. 
- Розвиток хмарних AI-сервісів і доступність LLM-API. Це значно знижує 
поріг входу для компаній. 
- Можливість впровадження системи на ринки США, ЄС, Азії. Попит на 
маркетингову автоматизацію зростає у всьому світі. 
- Автоматизація A/B тестів. AI може самостійно запускати, аналізувати та 
оптимізувати експерименти. 
- Створення нових продуктів на основі модулів проєкту. Наприклад: 
рекомендаційний двигун, AI-копірайтер для сторінок, розумний 
конструктор оферів. 
- Зростання ролі data-driven підходу в бізнесі. Компанії дедалі частіше 
приймають рішення на основі аналітики.  
- Інтерес ринку до інтелектуальної автоматизації маркетингу. 
4. Загрози (Threats) 
- Висока конкуренція зі сторони великих платформ. Shopify Magic, Klaviyo AI, 
Rebuy можуть розширити функціонал. 
- Нестабільність регуляторних вимог щодо ШІ. Прийняття EU AI Act, 
посилення GDPR, обмеження щодо приватності. 
- API-залежність від зовнішніх провайдерів. OpenAI, Anthropic, AWS можуть 
змінити ціни або політики доступу. 
- Швидкі технологічні зміни. Моделі можуть застарівати за 6–12 місяців. 
- Кібербезпека та ризики витоку даних. Системи обробки даних є критичними 
до незаконного доступу. 
- Високі витрати на масштабування. Для великих обсягів подій обробка в 
реальному часі коштує дорого. 
- Можлива недовіра користувачів до рішень на основі ШІ. Особливо при 
автоматичному формуванні оферів або рекомендацій. 
26 
 
Таблиця 1.5. — Результати SWOT-аналізу галузі на основі підходів, викладених у [10; 
13]  
Позитивний вплив Негативний вплив 
(Strengths) (Weaknesses) 
Високий рівень іноваційності Залежність від якості даних 
Комплексний аналіз behavioral data Складність ML-інфраструктури 
Автоматизація процесів Обмежена впізнаваність локальних розробників 
Масштабованість Недостатній рівень кіберзахисту 
Гнучкі інтеграції Інтеграційні складності 
AI-підтримка рішень Вартість підтримки 
Можливості (Opportunities) Загрози (Threats) 
Ріст AI-ринку eCommerce Конкуренція з великими платформами 
Попит на персоналізацію Посилення регуляцій 
 
Поширення LLM-API 
API-залежність 
 
Міжнародний ринок Технологічна застарілість 
Автоматизація A/B тестів Кіберзагрози 
Нові AI-продукти Висока вартість масштабування 
 
SWOT-аналіз показує, що проєкт інтеграції штучного інтелекту в систему 
обробки даних має значний потенціал завдяки високому рівню інноваційності, 
здатності до автоматизації та актуальності для ринку e-commerce. Основні сильні 
сторони повʼязані зі складністю і глибиною аналітики, можливістю побудови 
прогнозних моделей та персоналізації взаємодії з користувачами.  
У той же час внутрішні слабкі сторони вимагають ретельного управління 
ризиками, оптимізації інфраструктури та забезпечення високої якості даних. Зовнішні 
можливості підтверджують перспективність ідеї на глобальному ринку, тоді як 
загрози вказують на важливість адаптивності, дотримання регуляторних норм і 
постійного моніторингу технологічних змін. 
Отже, SWOT-аналіз підтверджує доцільність реалізації проєкту та його високий 
потенціал в умовах цифрової економіки [10; 12; 13]. 
27 
1.5 Аналізу галузі за моделлю пʼяти сил Портера 
Аналіз галузі за моделлю п’яти сил Портера є одним із поширених інструментів 
стратегічного оцінювання привабливості ринку. Його застосування дозволяє всебічно 
дослідити конкурентну структуру середовища, у якому реалізується проєкт інтеграції 
штучного інтелекту в систему обробки даних. Метод враховує вплив п’яти основних 
сил: загрозу появи нових конкурентів, силу постачальників, силу покупців, загрозу 
товарів-замінників та рівень конкурентної боротьби. Результати цього аналізу 
допомагають визначити ступінь ризику та інтенсивність конкурентного тиску, що 
впливають на стратегію розвитку проєкту [12; 14]. 
1. Загроза появи нових конкурентів 
Загроза входу на ринок нових учасників у сфері рішень для обробки даних та 
інтеграції штучного інтелекту оцінюється як середня. З одного боку, хмарні сервіси, 
доступність інфраструктури «як послуги» та велика кількість API моделей знижують 
бар’єри входу. Стартапи можуть швидко створювати прототипи завдяки готовим ML-
фреймворкам, автоматизованим пайплайнам та генеративним моделям. З іншого 
боку, складність побудови повноцінної інфраструктури для роботи з великими 
даними, необхідність глибоких компетенцій у сфері Data Engineering, машинного 
навчання та MLOps істотно обмежують кількість потенційних нових гравців. Крім 
того, інтеграція ШІ у систему обробки даних потребує значних стартових інвестицій 
та відповідності регуляторним вимогам щодо роботи з інформацією, що додатково 
стримує ринок [12; 14]. 
2. Сила впливу постачальників 
Сила постачальників у цій галузі є високою, оскільки інфраструктура проєкту 
безпосередньо залежить від обмеженого кола великих провайдерів. Основні 
залежності стосуються хмарних обчислювальних потужностей, моделей штучного 
інтелекту (зокрема великих мовних моделей), GPU-ресурсів, а також платформ для 
потокової обробки та зберігання даних. Хмарні провайдери та AI-компанії мають 
високу ринкову концентрацію й часто встановлюють власні тарифи, технічні 
обмеження або політики доступу. Це створює ситуацію, у якій проєкт змушений 
28 
адаптовуватися до зовнішніх умов і враховувати можливі коливання вартості чи зміну 
технічних параметрів. Водночас залежність від зовнішніх моделей підвищує 
вразливість щодо змін у політиці використання API або їх можливого подорожчання. 
3. Сила впливу покупців 
Сила покупців у галузі оцінюється як середньо-висока. Користувачами систем, 
що працюють із обробкою даних та інтеграцією ШІ, переважно є підприємства сфери 
e-commerce, SaaS-компанії та маркетингові агентства. Вони характеризуються 
високою чутливістю до якості рішень, їх вартості, швидкості впровадження та 
економічної ефективності. Покупці прагнуть отримувати очевидні, вимірювані 
результати — підвищення конверсій, збільшення середнього чеку, оптимізацію 
фанелів, зниження витрат на аналітику. Оскільки на ринку існує значна кількість 
альтернативних продуктів та сервісів, покупці мають змогу порівнювати рішення між 
собою та швидко змінювати постачальника. Це посилює їхню переговорну силу та 
стимулює підвищення якості сервісу з боку розробників. 
4. Загроза товарів-замінників 
Загроза з боку товарів-замінників оцінюється як середня. На ринку існує 
широкий спектр інструментів, що частково можуть замінити функціональність 
системи інтеграції ШІ: бізнес-аналітика (Power BI, Tableau), сторонні рекомендаційні 
модулі, email-платформи з прогнозною аналітикою, можливості, вбудовані у Shopify 
чи інші e-commerce комерційні платформи. Проте більшість цих рішень не 
забезпечують комплексного підходу, який поєднує глибокий аналіз поведінкових 
даних, машинне навчання, генеративні рекомендації та оптимізацію воронок 
продажів. Замінники часто мають вузьку спеціалізацію й не дозволяють досягти рівня 
персоналізації або автоматизації, притаманного повноцінній AI-системі. Це суттєво 
знижує ризик повної заміни запропонованого рішення. 
5. Рівень конкуренції в галузі 
Конкурентна боротьба між існуючими учасниками ринку є високою. Галузь 
активно розвивається, а попит на аналітику та AI-засоби стимулює появу численних 
конкурентів — від великих технологічних корпорацій до спеціалізованих платформ 
та стартапів. Конкуренція посилюється високим темпом інновацій, швидким 
29 
оновленням продуктів і постійною появою нових моделей штучного інтелекту. У 
сфері e-commerce активно працюють компанії, що пропонують персоналізацію, 
рекомендаційні системи та маркетингову аналітику. Проте більшість наявних рішень 
зосереджені на окремих аспектах аналітики або маркетингу й не охоплюють повного 
циклу інтеграції ШІ у data pipeline, що створює можливість диференціювання та 
формує конкурентну нішу. 
У таблиці 1.6 наведено узагальнені оцінки сили впливу кожного з факторів за 
шкалою [12]: 1–3 — низький вплив, 4–7 — середній вплив, 8–10 — високий вплив. 
Таблиця 1.6 — Аналіз галузі за методом М. Портера 
Рівень 
Сила Портера Оцінка Основні характеристики 
впливу 
Вхід можливий, але ускладнений 
Загроза нових 
6 Середній інфраструктурними та компетентнісними 
конкурентів 
вимогами 
Сила Висока залежність від хмарних сервісів, 
9 Висока 
постачальників API-моделей та GPU-ресурсів 
Середньо- Покупці мають широкий вибір і чутливі 
Сила покупців 7 
висока до цін та якості 
Існують альтернативи, але вони не 
Загроза замінників 5 Середній 
забезпечують комплексного підходу 
 
Рівень конкуренції 8 Високий Ринок насичений інноваційними 
продуктами з швидкими циклами 
розвитку 
 
 
Здійснений аналіз за методом п’яти сил Портера свідчить, що галузь, у якій 
реалізується проєкт інтеграції штучного інтелекту в систему обробки даних, має 
високий рівень конкурентності, значну залежність від постачальників та підвищені 
вимоги з боку покупців. Попри це, ринок залишається привабливим завдяки значному 
попиту на автоматизовану аналітику, персоналізацію та технології штучного 
інтелекту. Отримані результати підтверджують перспективність проєкту та 
доцільність подальшої розробки його концепції, структури та моделі управління, що 
буде розглянуто у наступному розділі [12; 14]. 
30 
 
Висновки до розділу 1 
У першому розділі здійснено комплексний аналіз ринку обробки даних, 
сучасних AI-технологій та конкурентного середовища. Встановлено, що галузь 
перебуває у фазі стрімкого зростання, зумовленого збільшенням обсягів даних та 
еволюцією від класичного машинного навчання до LLM і генеративних алгоритмів, 
що дозволяє суттєво автоматизувати аналітичні процеси [1-5]. 
Аналіз конкурентів показав, що попри наявність потужних інструментів, на 
ринку відсутнє комплексне рішення, яке поєднує ML-моделі, LLM-рекомендації та 
поведінкову аналітику в єдиний пайплайн. Це підтверджує наявність вільної ніші для 
створення автоматизованої системи аналізу поведінки користувачів [3; 6-9]. 
Результати стратегічного аналізу (STEP, 5 сил Портера) засвідчили сприятливі 
умови для реалізації проєкту. Технологічні драйвери та зростаючий попит на 
персоналізацію переважають над регуляторними ризиками, а загроза товарів-
замінників оцінюється як середня, що свідчить про потенціал для успішної адаптації 
системи [11-14]. 
SWOT-аналіз продемонстрував, що сильні сторони проєкту (інноваційність, 
масштабованість) та зовнішні можливості значно перевищують потенційні загрози та 
слабкі сторони, пов'язані з якістю даних та інфраструктурою [10-14]. 
Таким чином, інтеграція штучного інтелекту в систему обробки даних є 
економічно обґрунтованою та стратегічно важливою, що дає підстави перейти до 
розробки концепції та архітектури проєкту в наступному розділі. 
  
31 
2 РОЗРОБКА КОНЦЕПЦІЇ ПРОЄКТУ 
2.1 Постановка проблем та дерево проблем 
Сучасні організації функціонують у середовищі, де обсяг даних зростає 
експоненціально. За прогнозами IDC, глобальний обсяг даних перевищив 120 
зетабайт у 2023 році, а до 2025 року досягне понад 180 ZB, формуючи передумови 
для кардинального оновлення інструментів аналітики та обробки даних [1]. Зростання 
масштабів даних супроводжується ускладненням їх структури, появою нових джерел 
(сенсорні системи, IoT-пристрої, корпоративні платформи, транзакційні системи, 
цифрові платформи) та зростанням вимог до швидкості їх обробки [2]. 
Попри високий темп цифрової трансформації, значна частина організацій 
продовжує використовувати застарілі системи обробки даних, створені переважно 
для роботи з реляційними структурами та ручним управлінням потоками даних. Такі 
системи мають низку обмежень: 
- погана масштабованість через залежність від вертикальної інфраструктури; 
- низька швидкість обробки великих потоків даних (особливо 
неструктурованих); 
- відсутність механізмів автоматичного виявлення закономірностей та 
аномалій; 
- складність інтеграції з сучасними моделями штучного інтелекту. 
Одним із ключових викликів є відсутність ML-автоматизації. У традиційних 
системах більшість аналітичних процесів виконується вручну, що призводить до 
повільного циклу ухвалення рішень і підвищення навантаження на аналітичні 
команди. Дослідження Business Expert Press підтверджує, що сучасним компаніям 
бракує інструментів для автоматизованої обробки великих обсягів даних та 
контекстної аналітики [3]. 
Ситуацію ускладнює фрагментованість даних: дані розподілені між різними 
платформами, форматами, командами та інструментами. Відсутність єдиного 
джерела достовірної інформації (Single Source of Truth) створює бар’єри для інтеграції 
AI-рішень, ускладнює ETL/ELT-процеси та підвищує ймовірність помилок. 
32 
Важливим аспектом є розрив якості даних (data quality gap) — явище, коли темп 
зростання обсягу даних випереджає здатність організацій забезпечувати їх якість, 
цілісність, актуальність та валідацію. Це стає критичним викликом для систем зі 
штучним інтелектом, адже некоректні дані призводять до помилкових моделей, 
зниження точності прогнозів та втрати довіри до AI-рішень. 
Таким чином, вихідна ситуація характеризується високим темпом зростання 
даних, недостатнім рівнем автоматизації та потребою у комплексному оновленні 
технологічної та організаційної інфраструктури для впровадження AI-інтеграції. 
На основі виконаного аналізу сформульовано ядро проблеми: Сучасні системи 
обробки даних не забезпечують необхідного рівня автоматизації, масштабованості та 
інтелектуального аналізу, що зумовлює низьку ефективність використання даних для 
прийняття управлінських рішень. 
Ключові аспекти проблеми: 
- Низький рівень автоматизації ухвалення рішень. Організації продовжують 
покладатися на ручний аналіз, що збільшує час до отримання результатів 
(Time-to-Insight) та створює додаткове навантаження на аналітичні команди 
[3]. 
- Відсутність AI-орієнтованої архітектури. Застарілі системи не підтримують 
сучасні ML-моделі, модульний підхід, оркестрацію даних та безперервний 
цикл MLOps, що робить інтеграцію штучного інтелекту технічно складною 
та економічно затратною. 
- Перевантаження команд аналітики. Команди Data Analysts, Data Engineers та 
BI-фахівців часто виконують рутинні операції (очищення даних, побудова 
звітів, верифікація моделей), замість того щоб фокусуватися на 
високорівневих задачах. 
На основі аналізу побудовано дерево проблем, яке дозволяє структурувати 
причинно-наслідкові зв’язки та визначити ключові напрямки подальшої 
трансформації. 
 
 
33 
 
Рисунок 2.1 — Діаграма дерева проблем 
 
2.2 Цілі проєкту та дерево цілей 
Відповідно до виявленої центральної проблеми та причинно-наслідкових 
зв’язків, сформованих у дереві проблем, загальна мета проєкту полягає у: 
Розроблення та обґрунтування моделі управління проєктом інтегрування штучного 
інтелекту в систему обробки даних, що забезпечує дотримання часових, бюджетних 
та якісних показників впровадження.. 
Ця мета узгоджується із сучасними світовими тенденціями розвитку штучного 
інтелекту, аналітики та цифрової трансформації, а також рекомендаціями IDC щодо 
переходу до Data-Driven підходів у прийнятті рішень [1], концепцією бізнес-
аналітики [3] і принципами побудови AI-керованих систем відповідно до ISO/IEC 
42001:2023. 
На основі загальної мети сформовано SMART-цілі, які є конкретними, 
вимірюваними, досяжними, релевантними та обмеженими в часі. 
Стратегічні SMART-цілі: 
34 
- Підвищити рівень автоматизації обробки даних до 70% шляхом впровадження 
ML-моделей та AI-сервісів протягом 12 місяців. 
- Скоротити Time-to-Insight щонайменше у 3 рази завдяки впровадженню 
MLOps-пайплайнів, автоматизованих ETL/ELT-процесів та потокової обробки 
даних. 
- Забезпечити 90% покриття даних уніфікованою моделлю якості (Data Quality 
Framework) відповідно до рекомендацій Gartner. 
- Підвищити точність прогнозних моделей щонайменше на 20% через 
систематичний моніторинг моделей, data validation. 
- Забезпечити надійну масштабовану архітектуру, здатну обробляти 
щонайменше 10× збільшення обсягів даних без втрати продуктивності. 
- Підвищити ефективність роботи аналітичних команд до 40%, зменшивши 
частку ручних операцій та оптимізувавши процеси. 
Побудова дерева цілей здійснюється через переформулювання виявлених проблем 
у бажані стани майбутньої системи. Структура дерева цілей дозволяє представити 
логічні шляхи досягнення стратегічної мети, визначити проміжні результати та 
деталізувати завдання. 
 
35 
Рисунок 2.2 — Діаграма дерева цілей 
Для коректного проектного планування важливо забезпечити відповідність між 
проблемами та цілями. У нашій моделі ця відповідність реалізована наступним 
чином. 
Таблиця 2.1 – Взаємозв’язок дерева проблем та дерева цілей 
Елемент дерева проблем Відповідна ціль 
Фрагментованість даних Побудова єдиного джерела достовірних даних 
(SSOT) 
Низька якість даних Упровадження системи валідації, стандартизації 
та Data Quality Framework 
Застарілі технології Модернізація архітектури та впровадження AI-
орієнтованих технологій 
Відсутність ML-автоматизації Впровадження ML-пайплайнів та MLOps-
процесів 
Ручні ETL/ELT-процеси Автоматизація обробки даних 
Перевантаження аналітичних Оптимізація процесів та AI-автоматизація 
команд 
Опір впровадженню AI Формування культури даних (Data Culture) та 
навчання персоналу 
 
Таким чином, дерево цілей є повною трансформацією дерева проблем у 
позитивні цільові орієнтири, що забезпечують системний розвиток проєкту. 
2.3 Формування концепції майбутньої системи 
Розроблена концепція системи включає визначення архітектурних принципів, 
компонентної структури, потреб та стратегічних цілей, визначених у попередніх 
підрозділах. Вона включає визначення архітектурних принципів, компонентної 
структури, функціональних модулів та підходів до забезпечення масштабованості, 
якості та надійності системи. У центрі концепції — перехід від традиційної моделі 
роботи з даними до інтелектуального, автоматизованого й адаптивного середовища, 
здатного підтримувати сучасні бізнес-процеси та рішення. 
Система має бути побудована відповідно до міжнародних рекомендацій з 
управління штучним інтелектом (ISO/IEC 42001:2023) [24], DataOps-практик [25], а 
також підходів MLOps, які забезпечують повний життєвий цикл ML-моделей — від 
створення до моніторингу [3; 6]. 
36 
 Для системного уявлення про структуру майбутньої AI-орієнтованої системи 
доцільно узагальнити її логічну побудову за основними архітектурними шарами. 
Такий підхід дозволяє визначити функціональне призначення кожного шару, його 
роль у забезпеченні інтеграції даних, обробки, застосування моделей штучного 
інтелекту та надання аналітичних сервісів користувачам. 
Узагальнення архітектури також забезпечує зв’язок між концепцією системи та 
стратегічними цілями проєкту, зокрема щодо підвищення рівня автоматизації, 
масштабованості, якості даних та ефективності аналітичних процесів. Зведена 
структура архітектури представлена у таблиці 2.2. 
Таблиця 2.2 — Концептуальна архітектура AI-орієнтованої системи обробки даних 
№ Архітектурний Призначення Основні Потенційні 
шар компоненти технології 
1 Шар збору даних Забезпечення збору API-конектори, Kafka, 
(Data Ingestion потокових та брокери подій, Kinesis, REST 
Layer) пакетних даних із парсери даних, API, MQTT, 
внутрішніх та стрімінгові модулі Logstash 
зовнішніх джерел 
2 Шар зберігання Централізоване Data Lake, Data AWS S3, 
даних (Data Lake зберігання Warehouse, BigQuery, 
/ DWH Layer) структурованих та сховища метаданих Snowflake, 
неструктурованих ClickHouse, 
даних Delta Lake 
3 Шар обробки та Очищення, ETL/ELT-процеси, Apache Spark, 
трансформації нормалізація, data validation, Flink, Airflow, 
(Data Processing трансформація та stream/batch dbt 
Layer) підготовка даних для processing 
моделювання 
4 Шар штучного Створення, ML-моделі, Model MLflow, 
інтелекту та тестування, Registry, Feature Kubeflow, 
MLOps (AI & деплоймент та Store, drift- TensorFlow, 
ML Layer) моніторинг ML/AI- monitoring, PyTorch 
моделей inference-сервіси 
5 API та Надання результатів BI-дашборди, PowerBI, 
аналітичний шар аналітики й AI- Recommendation Tableau, 
(Application рішень користувачам Engine, Decision Metabase, 
Layer) та бізнес-процесам Engine, API FastAPI, 
Gateway GraphQL 
 
37 
 Формування концепції майбутньої системи базується на дотриманні 
фундаментальних принципів, що забезпечують її ефективність, надійність та 
відповідність поточним і перспективним вимогам обробки даних. Ці принципи 
визначають архітектурні підходи та стратегію впровадження штучного інтелекту. 
- Масштабованість. 
Система повинна забезпечувати можливість обробки суттєво зростаючих 
обсягів даних без втрати продуктивності, що особливо важливо з огляду на 
експоненційне збільшення світового data footprint [1]. Масштабованість 
охоплює як горизонтальне, так і вертикальне розширення інфраструктури. 
- Модульність та мікросервісна архітектура. 
Функціональність системи має бути організована у вигляді незалежних 
компонентів, таких як ingestion-сервіси, ML-модулі, API-шари та аналітичні 
сервіси. Такий підхід забезпечує гнучкість, простоту оновлення і можливість 
поступового розширення. 
- Автоматизація (Automation-first). 
Ключовою вимогою є максимальна автоматизація: ETL/ELT-процесів, обробки 
даних, навчання та розгортання моделей, моніторингу дрейфу, перевірки якості 
даних. Автоматизація знижує навантаження на аналітичні команди та зменшує 
кількість помилок. 
- Принципи Data Governance. 
Система має включати політики керування даними, метаданими, якостю даних 
і доступами. Особливе значення має відповідність стандартам захисту даних 
(GDPR) та рекомендаціям ISO/IEC 42001 щодо управління AI-системами. 
- Надійність і спостережуваність (Observability). 
Інфраструктура повинна передбачати повноцінний моніторинг стану системи, 
моделей, якості даних, логів і продуктивності для забезпечення стабільної 
роботи. 
Для деталізації концепції архітектури майбутньої AI-орієнтованої системи 
доцільно виокремити основні групи її компонентів [18; 21]. Така класифікація 
дозволяє систематизувати функціональні можливості системи, визначити їхню роль 
38 
у загальній архітектурі та забезпечити узгодженість між технологічними шарами, 
описаними у таблиці 2.2. 
Представлення компонентної структури у вигляді таблиці надає можливість чітко 
відобразити функції, призначення та завдання кожної групи компонентів, що є 
важливим для подальшого проєктного планування та визначення вимог до реалізації 
системи. Узагальнену структуру основних компонентів майбутньої системи подано 
в таблиці 2.3. 
Таблиця 2.3 — Основні компоненти АI-орієнтованої системи обробки даних 
№ Група Опис призначення Основні елементи 
компонентів 
1 Компоненти Забезпечують отримання даних API-конектори, модулі 
збору та із різнорідних внутрішніх і інтеграції, брокери 
інтеграції даних зовнішніх джерел, їх потокову та подій (Kafka), 
пакетну інтеграцію стрімінгові сервіси 
2 Компоненти Виконують функції Data Lake, Data 
сховища даних довгострокового зберігання Warehouse, сховища 
структурованих і метаданих, каталоги 
неструктурованих даних з даних 
підтримкою масштабованості та 
швидкого доступу 
3 Компоненти Забезпечують очищення, ETL/ELT-пайплайни, 
обробки та нормалізацію, агрегацію та Spark/Flink-процеси, 
трансформації підготовку даних для аналітики data validation, генерація 
даних й моделювання ознак (feature 
engineering) 
4 Компоненти Реалізують навчання, ML-пайплайни, Feature 
штучного експериментування, деплоймент Store, Model Registry, 
інтелекту та і моніторинг ML/AI-моделей, AutoML, inference-
MLOps контроль дрейфу та сервіси 
автоматизацію моделювання 
5 Компоненти API Надають користувачам та BI-панелі, 
та аналітики зовнішнім системам доступ до Recommendation Engine, 
результатів аналізу, моделей і Decision Engine, API 
сервісів штучного інтелекту Gateway, аналітичні 
сервіси 
 
 Застосування проєктної концепції AI-орієнтованої системи забезпечить 
реалізацію визначених цілей і усунення ключових проблем, описаних у підрозділі 2.1. 
Очікувані результати включають: 
- Підвищення ефективності обробки даних. 
39 
Скорочення часу отримання аналітичних результатів у 3–5 разів завдяки 
автоматизації та швидкій обробці даних у потоковому режимі. 
- Зменшення навантаження на аналітичні команди. 
Зниження частки рутинних операцій на 40–60% завдяки впровадженню MLOps-
процесів, автоочищення даних та інтелектуальних пайплайнів. 
- Підвищення точності управлінських рішень. 
Зростання точності прогнозних моделей на 20–35% та надання релевантних 
рекомендацій у режимі реального часу. 
- Підвищення надійності та якості даних. 
Запровадження єдиних стандартів якості, контролю дрейфу, моніторингу 
моделей та політик Data Governance. 
- Оптимізація витрат і зростання ROI. 
Покращення окупності інвестицій у дані та зниження операційних витрат за 
рахунок автоматизації ключових процесів і масштабованої інфраструктури. 
2.4 Моделювання поточного та цільового станів системи обробки даних 
Поточний стан системи обробки даних (AS-IS) характеризується домінуванням 
фрагментованих рішень, ручних операцій та обмеженою інтегрованістю між 
джерелами даних, аналітичними інструментами та управлінськими процесами [3; 7]. 
Основні риси моделі AS-IS: 
- дані розподілені між окремими базами даних, файлами, сервісами та робочими 
документами (наприклад, електронні таблиці); 
- більшість ETL/ELT-процесів виконується вручну або напівручними скриптами; 
- відсутні централізовані механізми контролю якості та цілісності даних; 
- аналітика реалізується переважно у форматі статичних звітів “post factum”; 
- моделі машинного навчання або не застосовуються взагалі, або функціонують 
у вигляді експериментальних, ізольованих рішень. 
 
 
Схематичне зображення поточної моделі AS-IS наведено нижче. 
40 
 
Рисунок 2.3 — Схема поточної моделі AS-IS системи обробки даних 
 
Така конфігурація призводить до: 
- високого Time-to-Insight через значну частку ручної роботи; 
- підвищеного ризику помилок в аналітиці через низьку якість даних; 
- перевантаження команд аналітики рутинними задачами; 
- труднощів у масштабуванні системи обробки даних при зростанні обсягів 
інформації. 
 
Цільова модель (TO-BE) описує стан системи після впровадження AI-
орієнтованої архітектури, сформованої у підрозділі 2.3. У цій моделі дані проходять 
через стандартизовані, автоматизовані пайплайни збору, зберігання, обробки й 
моделювання, а результати аналізу доступні для бізнес-користувачів у 
напівавтоматичному або повністю автоматизованому режимі. 
Ключові характеристики моделі TO-BE: 
- централізоване сховище даних (Data Lake / DWH) з єдиним джерелом 
достовірних даних (SSOT); 
- автоматизовані ETL/ELT-процеси та контроль якості даних; 
- інтегроване MLOps-середовище для повного життєвого циклу ML-моделей; 
41 
- аналітика в режимі near real-time; 
- модулі рекомендацій та підтримки прийняття рішень (Decision Engine). 
Схематична модель TO-BE наведена на рис. нижче 
 
Рисунок 2.4 — Схема поточної моделі TO-BE системи обробки даних 
 
 Таким чином, у моделі TO-BE: 
- аналітичні процеси стають повторюваними, масштабованими та 
контрольованими; 
- штучний інтелект інтегрується у ключові бізнес-процеси; 
- зменшується залежність від ручних операцій, підвищується точність та 
швидкість ухвалення рішень. 
Цільова модель (TO-BE) описує стан системи після впровадження AI-
орієнтованої архітектури, сформованої у підрозділі 2.3. У цій моделі дані проходять 
через стандартизовані, автоматизовані пайплайни збору, зберігання, обробки й 
42 
моделювання, а результати аналізу доступні для бізнес-користувачів у 
напівавтоматичному або повністю автоматизованому режимі. 
GAP-аналіз дозволяє формалізувати розрив між поточним і цільовим станами 
системи та визначити напрями змін, які мають бути реалізовані в межах проєкту. Для 
цього доцільно порівняти основні виміри системи: дані, технології, процеси та 
організаційну складову. 
Для виявлення пріоритетних напрямів трансформації було виконано 
порівняльний аналіз (GAP-аналіз) ключових характеристик поточної моделі системи 
обробки даних та цільової AI-орієнтованої моделі. Це дозволило систематизувати 
необхідні зміни та пов’язати їх із відповідними компонентами проєкту. Узагальнені 
результати аналізу подано в таблиці 2.4. 
 
Таблиця 2.4 — GAP-аналіз між моделями AS-IS та TO-BE 
Вимір AS-IS (поточний стан) TO-BE (цільовий стан) Необхідні зміни 
Дані Фрагментовані, Централізоване Впровадження 
зберігаються в різних сховище (Data Lake / єдиного сховища, 
БД та файлах; DWH), єдине джерело створення моделей 
відсутні єдині достовірних даних даних, регламентів 
стандарти якості (SSOT), формалізовані якості, каталогів 
правила Data Quality даних 
Технології Локальні рішення, Модульна, Модернізація 
окремі скрипти, масштабована AI- інфраструктури, 
відсутність підтримки орієнтована впровадження 
AI на рівні архітектура з платформ для 
архітектури підтримкою MLOps та обробки великих 
stream/batch обробки даних та MLOps 
Процеси Ручні ETL/ELT, Автоматизовані Опис та 
несистемна пайплайни, формалізація 
підготовка звітів, стандартизовані процесів, 
відсутність сценарії обробки, впровадження 
стандартизованих CI/CD для моделей інструментів 
пайплайнів оркестрації (Airflow 
тощо) 
 
 
 
 
 
43 
 
Продовження таблиці 2.4 
Аналітика та Статичні звіти, Інтегровані ML- Розробка та 
AI обмежена або моделі, прогнозна впровадження AI-
експериментальна та рекомендаційна модулів, створення 
аналітика, поодинокі аналітика, MLOps-процесів, 
ML-ініціативи Decision Engine навчання моделей на 
історичних даних 
Організаційна Низька культура Сформована Data Програми навчання, 
складова роботи з даними, Culture, зміна ролей і 
перевантаження підготовлений відповідальностей, 
команд, опір змінам персонал, чіткі впровадження практик 
ролі  Data Governance 
Логіко-структурна схема (логіко-структурна матриця, Logical Framework 
Matrix, LFM) використовується для формалізації логіки проєкту за рівнями: загальна 
мета, специфічна ціль, результати та діяльність. Вона дозволяє пов’язати цілі з 
вимірюваними показниками, джерелами перевірки та ключовими припущеннями 
[17]. 
Побудова логіко-структурної схеми дає змогу узагальнити заплановані зміни в 
системі обробки даних, пов’язавши їх із результатами, які мають бути досягнуті 
внаслідок AI-інтеграції. Це також забезпечує основу для подальшого моніторингу 
виконання проєкту та оцінювання його ефективності. Логіко-структурну матрицю 
проєкту AI-інтеграції представлено в таблиці 2.5. 
Таблиця 2.5 — Логіко-структурна матриця проєкту AI-інтеграції в системи обробки 
даних  
Рівень Показники Джерела Ключові 
Опис 
логіки досягнення перевірки припущення 
Загальна Підвищення Зростання Стратегічні Стабільність 
мета ефективності точності KPI ринку, підтримка 
використання управлінських організації, цифрової 
даних для рішень; фінансові трансформації з 
управлінських підвищення ROI звіти, боку керівництва 
рішень за від ініціатив, аналітичні 
рахунок пов’язаних з звіти 
впровадження даними 
AI-
орієнтованої 
системи 
обробки даних 
44 
Продовження таблиці 2.5 
Специфічн Створення та Скорочення Звіти про Доступність 
а ціль впровадження Time-to-Insight виконання необхідних 
проєкту AI- у 3–5 разів; проєкту, ресурсів 
орієнтованої зменшення технічна (кадрових, 
архітектури частки ручної документація, технічних, 
обробки даних роботи на 40– метрики фінансових), 
з 60%; продуктивності відсутність 
автоматизацією підвищення системи критичних 
ключових якості даних зовнішніх 
аналітичних обмежень 
процесів 
Результати 1)Впроваджене Наявність Активи ІТ- Успішне 
(outputs) єдине сховище функціонуючог інфраструктури проходження 
даних; 2) о Data , звіти про етапів розробки 
Налаштовані Lake/DWH; розгортання та тестування, 
ETL/ELT- кількість моделей, готовність 
пайплайни; 3) автоматизовани журнали стейкхолдерів 
Створені та х пайплайнів; використання використовуват
задеплойлені кількість BI-систем и нові сервіси 
ML-моделі; 4) моделей у 
Впроваджені продакшені; 
BI- та AI- кількість 
сервіси активних 
користувачів 
аналітики 
Діяльність Аналіз вимог; Виконання Календарні та Дотримання 
(activities) проєктування етапів згідно з звітні графіку 
архітектури; календарним документи реалізації, 
налаштування планом; проєкту, своєчасне 
інфраструктури відсоток протоколи фінансування, 
; розробка навчань, доступність 
пайплайнів; технічна ключових 
створення ML- документація фахівців 
моделей; 
навчання 
персоналу 
 
Висновки до розділу 2 
У другому розділі було сформовано концептуальну основу проєкту інтеграції 
штучного інтелекту в систему обробки даних. На підставі аналізу вихідної ситуації 
встановлено, що поточний стан інформаційної інфраструктури характеризується 
45 
фрагментованістю даних, низьким рівнем автоматизації процесів, застарілими 
технологічними рішеннями та обмеженими можливостями для застосування 
алгоритмів штучного інтелекту. Побудоване дерево проблем дозволило системно 
ідентифікувати ключові бар’єри та причинно-наслідкові зв’язки, що стримують 
підвищення ефективності аналітики й прийняття рішень. 
На основі визначених проблем сформовано дерево цілей, яке відображає 
стратегічні орієнтири проєкту: створення AI-орієнтованої архітектури, забезпечення 
високої якості даних, автоматизацію процесів обробки, впровадження ML-пайплайнів 
та розвиток організаційної культури роботи з даними. Ці цілі стали концептуальним 
підґрунтям для розроблення архітектури майбутньої системи. 
У межах підпункту 2.3 сформовано цілісну концепцію AI-інтегрованої системи 
обробки даних, що включає багаторівневу архітектуру (інжест, зберігання, 
трансформація, MLOps, аналітичні сервіси) та відповідні принципи її побудови — 
масштабованість, модульність, автоматизацію та adherence до Data Governance. 
Визначено основні групи компонентів, що забезпечують функціонування системи, а 
також описано рівні впровадження штучного інтелекту — від операційного до рівня 
прийняття управлінських рішень. 
AS-IS / TO-BE моделювання, представлене у підпункті 2.4, дало змогу 
порівняти поточний та цільовий стани системи і визначити ключові розриви в 
технологіях, процесах, якості даних та організаційній складовій. GAP-аналіз 
продемонстрував необхідність модернізації інфраструктури, впровадження 
централізованого сховища даних, автоматизації ETL/ELT-процесів, побудови 
MLOps-середовища та підвищення компетентності персоналу. 
Загалом результати розділу підтверджують доцільність розроблення та 
реалізації AI-орієнтованої системи обробки даних, а також формують структуровану 
основу для подальшого планування проєкту, зокрема опису робіт, ресурсів і ризиків 
у наступних розділах дослідження. 
 
46 
3 ПЛАНУВАННЯ ТА ПРОЕКТУВАННЯ ЗАСТОСУНКУ 
3.1 Управління змістом та декомпозиція робіт проєкту  
Планування змістом проєкту є фундаментальним етапом, що визначає межі 
дослідження, необхідний обсяг робіт та критерії успішного завершення проєкту. 
Враховуючи специфіку інтеграції штучного інтелекту (ШІ) у системи обробки даних, 
що характеризується високим рівнем невизначеності та технічної складності, було 
застосовано метод структурної декомпозиції робіт (Work Breakdown Structure — 
WBS) [16]. Це дозволило розділити комплексне завдання на керовані робочі пакети, 
що піддаються плануванню, оцінці та контролю. 
Життєвий цикл проєкту побудовано згідно з гібридною моделлю, що поєднує 
етапи класичного каскадного планування (для інфраструктурних завдань) та 
ітеративного підходу CRISP-DM (Cross-Industry Standard Process for Data Mining) для 
розробки ML-моделей [22]. 
Для забезпечення ефективного планування та контролю реалізації проєкту було 
застосовано метод структурної декомпозиції робіт (WBS) [15; 16]. Це дозволило 
структурувати складний процес інтеграції штучного інтелекту на ієрархічні рівні, що 
полегшує оцінку ресурсів, вартості та часу. 
 Декомпозиція виконана за фазовим принципом і включає 5 основних етапів 
(рівень 1), які деталізовані до пакетів робіт (рівень 3). Графічне відображення верхніх 
рівнів WBS наведено на Рисунку 3.1. Повний перелік робіт із деталізацією до 
конкретних завдань представлено в Таблиці 3.1. 
 
 
47 
 
Рисунок 3.1 — Структурна декомпозиція робіт  
Таблиця 3.1 — Ієрархічна структура робіт (WBS) проєкту 
Код Назва етапу / Роботи Опис результату (Deliverable) 
WBS 
1 Фаза 1: Ініціація та аналіз вимог Затверджений Статут проєкту та ТЗ 
1.1 Аналіз бізнес-контексту та процесів Звіт про бізнес-вимоги 
1.1.1 Аналіз поточного стану (AS-IS) Опис існуючих процесів, виявлення 
«вузьких місць» 
1.1.2 Визначення бізнес-цілей та KPI Затверджений список метрик успіху 
(точність, швидкість) 
1.1.3 Формування концепції TO-BE Концептуальна модель цільового 
стану системи 
1.2 Аудит даних та інфраструктури Звіт про технічну готовність 
1.2.1 Інвентаризація джерел даних Реєстр джерел даних (SQL, API, 
файли) з описом обсягів 
1.2.2 Оцінка якості даних (Data Quality) Звіт про якість, повноту та 
придатність даних для ML 
1.2.3 Аналіз поточної IT-інфраструктури Технічний звіт про наявні 
обчислювальні потужності 
1.3 Організаційне планування План управління проєктом 
1.3.1 Формування проєктної команди Затверджена оргструктура, набір 
персоналу 
1.3.2 Розробка Статуту проєкту Підписаний Статут, затверджений 
бюджет та строки 
2 Фаза 2: Проєктування Технічний проєкт (Architecture Design 
архітектури Document) 
2.1 Проєктування архітектури даних Схема інфраструктури даних 
2.1.1 Вибір хмарної платформи Обґрунтування вибору провайдера 
(AWS/GCP/Azure) 
2.1.2 Проєктування Data Lake / DWH Схема зберігання «сирих» та 
оброблених даних 
48 
Продовження таблиці 3.1 
2.1.3 Проєктування ETL-пайплайнів Специфікація потоків даних та логіки 
трансформації 
2.2 Проєктування AI-компонента Специфікація моделі ШІ 
2.2.1 Вибір класу моделей Визначення типу задач та алгоритмів 
(регресія, класифікація) 
2.2.2 Проєктування MLOps-процесів Схема середовища для навчання та 
версіонування моделей 
2.3 Проєктування безпеки Політика безпеки 
2.3.1 Розробка політик доступу (IAM) Матриця доступу до даних та 
ресурсів 
2.3.2 Планування шифрування Визначення методів захисту даних 
(in-transit, at-rest) 
3 Фаза 3: Розробка інфраструктури Налаштоване середовище даних 
3.1 Налаштування інфраструктури Розгорнуте хмарне середовище 
3.1.1 Розгортання хмарного середовища Налаштовані сервери, контейнери 
(Docker/Kubernetes), БД 
3.1.2 Налаштування середовища Готові до роботи Jupyter Notebooks, 
розробки Git-репозиторії 
3.2 Реалізація ETL/ELT процесів Автоматизовані потоки даних 
3.2.1 Розробка конекторів (Ingestion) Скрипти для завантаження даних із 
джерел 
3.2.2 Очищення та трансформація даних Програмний код для нормалізації та 
обробки даних 
3.2.3 Автоматизація потоків даних Налаштований оркестратор (напр., 
Apache Airflow) 
4 Фаза 4: Розробка та навчання Навчена модель, готова до 
моделей ШІ впровадження 
4.1 Підготовка наборів даних (Datasets) Тренувальні та тестові датасети 
4.1.1 Генерація ознак (Feature Набір нових змінних для покращення 
Engineering) точності 
4.1.2 Розділення вибірки Сформовані тренувальні, валідаційні 
та тестові вибірки 
4.2 Тренування та оптимізація моделей Фінальна модель ШІ 
4.2.1 Навчання базової моделі (Baseline) Прототип моделі для оцінки базової 
ефективності 
4.2.2 Налаштування гіперпараметрів Оптимізована модель з найкращими 
параметрами 
4.2.3 Валідація моделі Звіт про тестування моделі (метрики 
Accuracy, F1-score) 
5 Фаза 5: Інтеграція, тестування та Працююча система в експлуатації 
запуск 
5.1 Інтеграція (Deployment) Інтегрований сервіс 
Продовження таблиці 3.1 
49 
5.1.1 Розробка API для моделі Мікросервіс для отримання 
передбачень (REST API) 
5.1.2 Інтеграція з основною системою Налаштована взаємодія між системою 
даних та AI-сервісом 
5.2 Тестування системи Протоколи тестування 
5.2.1 Функціональне тестування Перевірка коректності роботи всіх 
функцій 
5.2.2 Навантажувальне тестування Звіт про стабільність під 
навантаженням 
5.3 Запуск та підтримка Акт введення в експлуатацію 
5.3.1 Розгортання у Production Система запущена на робочих 
серверах 
5.3.2 Налаштування моніторингу Дашборди для відстеження здоров'я 
моделі (Data Drift) 
5.3.3 Навчання користувачів Інструкції користувача та 
адміністратора 
 
3.2 Організаційна структура та розподіл відповідальності 
Ефективність реалізації проєкту інтеграції штучного інтелекту в систему 
обробки даних значною мірою визначається правильним формуванням організаційної 
структури управління проєктом та раціональним розподілом відповідальності між 
учасниками команди. З огляду на міждисциплінарний характер ініціативи, яка 
поєднує роботу в галузях інженерії даних (Data Engineering), машинного навчання 
(Machine Learning), DevOps/MLOps-практик та програмної інженерії, доцільним є 
застосування матричної організаційної структури [15; 16]. 
Матрична структура дозволяє забезпечити оптимальне використання 
спеціалізованих ресурсів, підвищує гнучкість взаємодії між учасниками проєкту та 
сприяє ефективному управлінню багатошаровими технологічними компонентами 
системи. Такий підхід є рекомендованим для проєктів AI/ML-інтеграції згідно з 
сучасними галузевими стандартами DataOps та MLOps, де потрібна постійна 
комунікація між технічними напрямами, бізнес-аналітикою та управлінською 
ланкою.  
Рольова модель побудована на основі вимог, визначених у структурі WBS 
(підрозділ 3.1), та відображає розподіл функціональних обов’язків між членами 
50 
команди. Кожна роль має чітко окреслені функції, що забезпечує прозорість 
відповідальності та узгодженість дій у межах проєкту. Для аналізу фінансових витрат 
на персонал у процесі виконання проекту був визначений склад команди та уточнені 
їхні ролі, завдання та функції. Отримані висновки та деталі представлені в таблиці 
3.2. 
Таблиця 3.2 — Склад команди, обов'язки та завдання 
Роль Основна функція Зони відповідальності (WBS) 
Project Загальне управління Розробка Статуту проєкту (WBS 1.3.2), 
Manager проєктом, координація контроль дотримання бюджету та 
(PM) учасників, управління календарного плану, управління 
часом, бюджетом та ризиками, організація навчання 
ризиками персоналу (WBS 5.3.3). 
Data Проєктування Вибір хмарної платформи та 
Architect високорівневої архітектури проєктування Data Lake/DWH (WBS 
даних та визначення 2.1), розробка політик безпеки та 
політик управління даними доступу (WBS 2.3), контроль 
архітектурної цілісності рішення. 
Data Побудова інфраструктури Аудит джерел та оцінка якості даних 
Engineer збору, зберігання та (WBS 1.2), розгортання хмарного 
підготовки даних середовища (WBS 3.1), розробка та 
автоматизація ETL/ELT-пайплайнів 
(WBS 3.2). 
ML Розробка, тренування та Проєктування AI-компонента та 
Engineer / деплоймент моделей MLOps-процесів (WBS 2.2), підготовка 
Data машинного навчання датасетів та генерація ознак (WBS 4.1), 
Scientist тренування, валідація та оптимізація 
моделей (WBS 4.2), налаштування 
моніторингу моделей (WBS 5.3.2). 
Backend Інтеграція моделей та Розробка REST API для моделі (WBS 
Developer сервісів у корпоративні 5.1.1), забезпечення програмної 
системи взаємодії компонентів системи (WBS 
5.1.2). 
QA Тестування Функціональне та навантажувальне 
Engineer функціональності, тестування системи (WBS 5.2), 
продуктивності та верифікація відповідності результатів 
відповідності бізнес- бізнес-вимогам. 
вимогам 
Для чіткого розподілу ролей, обов’язків та рівня залученості учасників до виконання 
окремих завдань проєкту доцільно застосувати матрицю відповідальності RACI [15]. 
Вона дозволяє визначити, хто саме відповідає за виконання конкретної діяльності 
51 
(Responsible), хто затверджує результати (Accountable), хто консультує або надає 
підтримку (Consulted) та хто має бути поінформований про хід виконання робіт 
(Informed). Такий підхід забезпечує прозорість управління, підвищує ефективність 
командної взаємодії й мінімізує ризики дублювання або пропуску завдань. Матрицю 
розподілу відповідальності для даного проєкту наведено у таблиці 3.3. 
Позначення: 
R (Responsible) – відповідальний за виконання; 
A (Accountable) – особа, що затверджує результат; 
C (Consulted) – залучений експерт або консультант; 
I (Informed) – поінформований про виконання. 
Таблиця 3.3 — Матриця відповідальності RACI) для проєкту 
Код Пакет робіт PM Data Data ML Backend QA 
WBS Architect Engineer Engineer Dev Engineer 
1.1 Аналіз бізнес-
A C I I I I 
контексту 
1.2 Аудит даних та 
I A R C I I 
інфраструктури 
1.3 Організаційне 
A/R I I I I I 
планування 
2.1 Архітектура 
I A/R C I I I 
даних 
2.2 Архітектура AI-
I C I A/R I I 
компонента 
2.3 Архітектура 
A R C I C I 
безпеки 
3.1 Налаштування 
I A R C I I 
інфраструктури 
3.2 Реалізація 
I C A/R I I C 
ETL/ELT 
4.1 Підготовка 
I I C A/R I C 
датасетів 
4.2 Тренування 
I I I A/R I C 
моделей 
5.1 Інтеграція 
A C I C R I 
(Deployment) 
5.2 Тестування 
I I C C R A/R 
системи 
5.3 Запуск та 
A I C R C I 
підтримка 
52 
 
 
3.3 Розробка календарного плану проєкту  
Календарне планування є ключовим інструментом управління часовими 
параметрами проєкту, що дозволяє синхронізувати роботу крос-функціональної 
команди, забезпечити раціональний розподіл ресурсів та встановити контрольні 
точки (віхи) для моніторингу прогресу. Для розробки календарного плану проєкту 
інтеграції штучного інтелекту в систему обробки даних використано метод 
критичного шляху (Critical Path Method — CPM) та візуалізацію у вигляді діаграми 
Ганта [15; 16]. Задля встановлення календарних строків реалізації проектних задач 
було виконано календарне планування, за допомогою ПЗ  Project Libre. Список робіт 
за даним проектом представлено на рисунках 3.2 та рисунку 3.3. 
 
Рисунок 3.2 — Календарне планування (І частина) 
53 
Рисунок 3.3 — Календарне планування (ІІ частина) 
 
Рисунок 3.4 — Діаграма Ганта стартапу в Project Libre (Початок) 
54 
 
Рисунок 3.5 — Діаграма Ганта стартапу в Project Libre (Закінчення) 
 
Таким чином, календарний план у проєкту є не просто графіком виконання 
робіт, а стратегічним інструментом управління часом і ресурсами, що забезпечує 
узгодженість командної діяльності, підвищує ефективність реалізації та сприяє 
досягненню цілей в оптимальні терміни.  
Для забезпечення своєчасного виконання проєкту було проведено аналіз 
мережевої моделі методом критичного шляху (Critical Path Method — CPM). Цей 
метод дозволив виявити послідовність завдань, які не мають часового резерву (Total 
Float = 0). Будь-яка затримка виконання цих завдань призведе до зміщення дати 
завершення всього проєкту. 
Згідно з розробленим календарним планом, загальна тривалість проєкту 
становить 109 робочих днів. Проєкт розпочинається 24 листопада 2025 року і має бути 
завершений 23 квітня 2026 року.  
Для ефективного моніторингу прогресу та управління якістю результатів 
встановлено п'ять ключових контрольних точок (віх), які відповідають датам 
завершення основних фаз проєкту. Перехід до наступної фази можливий лише після 
успішного проходження відповідної контрольної точки. 
Графік контрольних точок, сформований на основі календарного плану, 
наведено у Таблиці 3.5. 
 
 
55 
Таблиця 3.5 — Графік контрольних точок (віх) проєкту 
Назва контрольної Дата Результат етапу Критерій успіху 
точки (Віхи) настання (Deliverable) 
М1. Затвердження 05.12.2025 Статут проєкту, Підписаний Статут, 
вимог ТЗ погоджені бізнес-цілі та KPI. 
М2. Затвердження 22.12.2025 Архітектурний Готова схема Data Lake, 
архітектури проєкт обрані алгоритми ШІ та 
протоколи безпеки. 
М3. Готовність 02.02.2026 ETL-пайплайни Дані автоматично 
інфраструктури збираються, очищуються та 
завантажуються у сховище. 
М4. Готовність 23.03.2026 Навчена модель Модель пройшла валідацію 
моделі ШІ та досягла цільових метрик 
точності. 
М5. Введення в 23.04.2026 Працююча Система розгорнута у 
експлуатацію система Production, персонал 
навчений, моніторинг 
активний. 
  
Аналіз показує, що найбільш критичним періодом є лютий-березень 2026 року 
(Фаза розробки та навчання моделей ШІ), оскільки цей етап має найбільшу тривалість 
(35 днів) і високу залежність від якості попередньо підготовлених даних. Для 
мінімізації ризиків на цьому етапі передбачено регулярні (щотижневі) статус-мітинги 
команди Data Science для оперативного коригування гіперпараметрів моделей. 
3.4  Планування ресурсів та вартості проєкту 
Планування ресурсів та вартості є невід’ємною складовою управління 
проєктом, що забезпечує економічну доцільність розробки та відповідність 
фінансовим можливостям замовника. Згідно зі стандартом PMBOK, управління 
вартістю включає процеси оцінки, бюджетування та контролю витрат, що дозволяє 
завершити проєкт у межах затвердженого бюджету [15]. 
Враховуючи специфіку проєкту інтеграції штучного інтелекту, основні ресурси 
поділено на такі категорії: 
1. Трудові ресурси: Команда розробників, інженерів даних та аналітиків. 
56 
2. Матеріально-технічні ресурси: Комп’ютерне обладнання, хмарна 
інфраструктура (Cloud Computing) для навчання моделей та зберігання 
даних. 
3. Програмне забезпечення: Ліцензії на інструменти розробки, управління 
проєктами та середовища розгортання. 
Оцінка вартості проєкту здійснювалася методом «знизу-вгору» (bottom-up 
estimating) [15], що передбачає розрахунок вартості окремих пакетів робіт з 
подальшим їх сумуванням. 
Витрати на оплату праці складають найбільшу частку бюджету ІТ-проєктів. Для 
реалізації системи сформовано команду з 6 фахівців. Загальна тривалість проєкту 
становить 5 місяців (листопад 2025 – квітень 2026). 
Розрахунок фонду оплати праці (ФОП) виконано на основі середньоринкових 
погодинних ставок для відповідних ролей (Таблиця 3.6). Враховано неповну 
зайнятість деяких спеціалістів на певних етапах (наприклад, Архітектор даних 
залучається переважно на етапі проєктування). 
Таблиця 3.6 — Розрахунок витрат на трудові ресурси 
№ Роль у проєкті Кількість, Завантаження Погодинна Загальна 
осіб (годин) ставка, $ вартість, $ 
1 Керівник 1 300 15 4 500 
проєкту (PM) 
2 Архітектор 1 160 25 4 000 
даних (Data 
Architect) 
3 Інженер даних 1 600 20 12 000 
(Data Engineer) 
4 ML-інженер / 1 640 22 14 080 
Data Scientist 
5 Backend- 1 400 15 6 000 
розробник 
6 QA-інженер 1 320 10 3 200 
Всього  6 2 420  43 780 
  
 Специфікою AI-проєктів є необхідність використання потужних 
обчислювальних ресурсів (зокрема GPU) для тренування моделей та обробки великих 
масивів даних. Оскільки закупівля фізичних серверів є економічно недоцільною для 
57 
пілотного проєкту, обрано модель використання хмарних сервісів (IaaS/PaaS) від 
провайдера AWS або Google Cloud. 
 Витрати на технічне забезпечення включають оренду обчислювальних 
потужностей, сховищ даних та амортизацію робочих станцій розробників (Таблиця 
3.7). 
Таблиця 3.7 — Витрати на метеріально-технічне забеспечення 
№ Найменування ресурсу Одиниця Кількість / Вартість Сума, 
виміру Термін од., $ $ 
1 Оренда хмарного сервера Місяць 3 800 2 400 
для навчання моделей 
(GPU Instance) 
2 Хмарне сховище даних Місяць 5 200 1 000 
(Data Lake Storage) 
3 Сервер для розміщення API Місяць 2 150 300 
та БД (Production 
environment) 
4 Амортизація ноутбуків Шт. 6 200 1 200 
розробників 
Всього     4 900 
  
Для забезпечення ефективної командної роботи та розробки необхідні ліцензії 
на спеціалізоване ПЗ. Також враховано накладні витрати (комунікація, інтернет, 
сервіси). 
Таблиця 3.8 — Витрати на ПЗ та накладні витрати 
№ Стаття витрат Примітка Сума, 
$ 
1 Ліцензії IDE (JetBrains All Products) 3 ліцензії на 5 міс. 450 
2 Jira & Confluence (Project Підписка на команду 300 
Management) 
3 GitHub Enterprise Репозиторій коду та 250 
CI/CD 
4 Комунікаційні витрати Zoom, Slack, Інтернет 500 
Всього   1 500 
  
Враховуючи високий рівень невизначеності у проєктах з машинним навчанням 
(ризики низької якості даних, необхідність додаткових експериментів з моделями), до 
бюджету закладено резервний фонд. Згідно з рекомендаціями PMBOK для 
58 
інноваційних проєктів, розмір резерву встановлено на рівні 10% від суми прямих 
витрат. Розрахунок резервного фонду здійснюється за формулою (3.1).   
 �������� = (43780 + 4900 + 1500) ⋅ 10% = 5018  (3.1) 
На основі розрахунків, проведених у попередніх пунктах, сформовано зведений 
бюджет проєкту (Таблиця 3.9). 
Таблиця 3.9 — Зведений бюджет проєкту інтеграції ШІ 
№ Стаття витрат Сума, $ Частка у бюджеті, % 
1 Витрати на трудові ресурси (ФОП) 43 780 79,3% 
2 Матеріально-технічне забезпечення 4 900 8,8% 
3 Програмне забезпечення та накладні 1 500 2,7% 
витрати 
4 Резерв на ризики 5018 9,1% 
Разом Загальна вартість проєкту 55198 100% 
  
Основну частину витрат (79,3%) складає оплата праці висококваліфікованих 
фахівців, що є типовим для R&D та IT-проєктів. Витрати на інфраструктуру 
оптимізовано завдяки використанню хмарних технологій (Pay-as-you-go), що 
дозволяє уникнути капітальних вкладень у власні сервери. Загальна вартість проєкту 
у розмірі 55 198 $ є обґрунтованою для розробки системи такого рівня складності 
протягом 5 місяців. Розрахований бюджет дозволяє забезпечити якісну реалізацію 
технічного завдання та мінімізувати проєктні ризики. 
3.5 Управління якістю проєкту 
Управління якістю є фундаментальним інструментом забезпечення успішності 
проєкту інтеграції штучного інтелекту у систему обробки даних, оскільки його 
результатом має стати високонадійна, точна, відтворювана та масштабована 
технологічна система, що функціонує відповідно до вимог замовника та міжнародних 
стандартів. Згідно з положеннями PMBOK 7 [15], ISO 9001 [18], ISO/IEC 25010 [23], 
DataOps Manifesto [25] та MLOps v2 Guidelines [6; 7], якість IT-продукту 
розглядається як багатовимірна характеристика, що охоплює не лише властивості 
програмного забезпечення, а й якість даних, процесів збору та трансформації 
59 
інформації, стабільність моделей машинного навчання, а також ефективність 
управлінських і операційних процедур. 
У контексті проєкту, що поєднує Data Engineering, ML-моделювання, 
інтеграцію AI-сервісів зі сторонніми цифровими платформами (зокрема Shopify), 
управління якістю набуває системного характеру. Воно охоплює повний життєвий 
цикл даних (Data Lifecycle), життєвий цикл моделей (Model Lifecycle) та життєвий 
цикл ПЗ (SDLC), що потребує інтегрованого застосування практик DevOps, MLOps 
та DataOps. 
Планування якості (Quality Planning) у рамках проєкту визначає нормативно-
методичну базу, стандарти, метрики та процедури, необхідні для досягнення 
цільового рівня якості. На цьому етапі формується План управління якістю, який 
визначає: 
- вимоги до результатів проєкту (функціональні, нефункціональні, нормативні); 
- критерії прийняття проміжних та кінцевих результатів (Acceptance Criteria); 
- стандарти, яким має відповідати система — включно з вимогами до 
архітектури, даних, алгоритмів та бізнес-логіки; 
- методи перевірки і валідації (Verification & Validation); 
- процеси контролю та аудиту якості. 
Особливе значення планування якості має у проєктах зі значним ступенем 
невизначеності — таких як AI-системи, де вихід моделі залежить не лише від 
алгоритмів, а й від характеристик даних, які можуть змінюватися динамічно. Тому 
планування включає визначення: 
- Data Quality Requirements: повнота, точність, цілісність, актуальність, 
стабільність та узгодженість даних. 
- Model Quality Requirements: стабільність метрик, дрейф даних, дрейф моделі, 
інтерпретованість, стійкість до шуму. 
- System Quality Requirements: продуктивність, доступність, масштабованість, 
безпечність, сумісність. 
60 
Для систематизації методів та інструментів управління якістю сформовано 
узагальнений план, поданий у таблиці 3.10. Він охоплює всі основні домени якості, 
що критично впливають на результативність системи. 
 
Таблиця 3.10 — План управління якістю проєкту 
Компонент Показники Методи Інструменти Відповідальний 
якості (метрики) контролю 
Якість completeness ≥ 95%; Data dbt tests, Data Engineer 
даних помилки ≤ 1% validation, Great 
anomaly Expectations 
detection 
Якість стабільність логування, Airflow, Data Engineer 
ETL/ELT виконання ≥ 99%; retry- Spark 
відхилення часу < механізми 
10% 
Якість Accuracy/Recall ≥ cross- MLflow, ML Engineer 
моделей baseline +10%; F1 ≥ validation, Jupyter 
0.75 A/B testing 
Якість API час відповіді < 300 load testing, Postman, Backend 
мс; uptime ≥ 99% API Grafana Developer 
monitoring 
Якість ПЗ ≥ 80% модульного Unit & PyTest, QA Engineer 
покриття тестами Integration GitHub 
tests Actions 
Безпека відповідність IAM- security OWASP ZAP Security/DevOps 
моделі; відсутність scans Engineer 
критичних 
вразливостей 
 
Комплексна система управління якістю, побудована на принципах DataOps, 
MLOps та DevOps, дозволяє забезпечити: 
- високу стабільність та достовірність даних; 
- відтворюваність і точність моделей машинного навчання; 
- надійність і продуктивність програмно-інтеграційних компонентів; 
- низький рівень дефектів на всіх етапах SDLC; 
- відповідність системи вимогам безпеки та міжнародним стандартам. 
Застосування структурованої системи метрик та інструментів контролю якості 
створює передумови для довгострокової масштабованості, підтримуваності та 
61 
операційної ефективності розробленої системи обробки даних із компонентами 
штучного інтелекту. 
3.6 Управління ризиками проєкту 
Управління ризиками є одним із ключових процесів успішної реалізації 
проєктів, що пов’язані з інтеграцією штучного інтелекту, складними процесами 
обробки даних, багаторівневими інтеграціями та високими вимогами до надійності 
системи. Особливої актуальності цей процес набуває у проєктах, де поєднані Data 
Engineering, MLOps, ML-моделювання, e-commerce інтеграції та масштабовані 
сервіси обробки подій у реальному часі. 
Відповідно до рекомендацій PMBOK 7 та міжнародного стандарту ISO 31000, 
ризик визначається як невизначена подія або умова, яка у разі реалізації може мати 
позитивний або негативний вплив на цілі проєкту [15; 19]. Для IT- та AI-проєктів 
характерна висока технологічна, організаційна, інтеграційна та ринкова 
невизначеність, що потребує системного, структурованого й безперервного 
управління ризиками. 
Ідентифікація ризиків передбачала аналіз архітектури системи, характеристик 
даних, особливостей ML-моделей, інтеграційних процесів та потенційних 
організаційних обмежень. Ризики було згруповано за основними категоріями, 
характерними для AI/ML-проєкті: 
1. Технологічні ризики: 
- збої в ML- або ETL/ELT-пайплайнах; 
- деградація продуктивності моделей після їхнього розгортання; 
- надмірне споживання обчислювальних ресурсів; 
- некоректна робота API через зміну конфігурацій або навантаження. 
2. Ризики якості даних: 
- неповнота або затримки у потоках подій; 
- порушення узгодженості схем даних після оновлення джерел; 
- аномалії в поведінкових даних; 
- зниження точності моделей через дрейф даних. 
62 
3. Інтеграційні ризики: 
- зміни у зовнішніх API (Shopify, аналітичні сервіси); 
- обмеження швидкості запитів, throttling; 
- недоступність сторонніх сервісів або їхня нестабільність. 
4. Організаційні та управлінські ризики: 
- недостатня координація між командами Data, ML, Dev та PM; 
- неузгодженість вимог, часті зміни пріоритетів; 
- недооцінка складності AI-модуля в плануванні. 
5. Фінансові ризики: 
- перевищення бюджетів на обчислення, зберігання та inference; 
- збільшення вартості зовнішніх AI-провайдерів; 
- непередбачені витрати на масштабування інфраструктури. 
6. Ризики безпеки та відповідності: 
- витік даних або несанкціонований доступ; 
- порушення політик приватності та регуляцій; 
- вразливості в API чи пайплайнах, що можуть викликати кібератаки. 
Для оцінки ризиків використано якісний метод на основі: 
- ймовірності настання ризику (P); 
- ступеня впливу на проєкт (I); 
- пріоритетності реагування (R); 
Результати оцінки зведено в таблицю 3.11. 
Таблиця 3.11 — Перелік, характеристика та пріоритезація ключових ризиків 
№ Категорія Опис ризику Ймовірність Вплив Пріоритет 
ризику 
1 Дані Некоректні або неповні 0.6 Високий Високий 
поведінкові події 
2 MLOps Збій або нестабільність 0.4 Високий Високий 
ML-пайплайнів 
3 Модельний Дрейф даних і 0.5 Середній Високий 
деградація якості 
моделей 
4 Інтеграції Несумісність або 0.3 Високий Середній 
обмеження зовнішніх 
API 
63 
5 Фінансовий Зростання витрат на 0.5 Середній Середній 
інфраструктуру та 
inference 
6 Організаційний Недостатня взаємодія 0.4 Середній Середній 
між технічними 
командами 
7 Юридичний Потенційні порушення 0.2 Високий Середній 
приватності даних 
8 Безпековий Кіберінциденти або 0.1 Дуже Високий 
несанкціонований високий 
доступ 
 
Матриця ймовірність/вплив дозволяє візуально визначити критичність ризиків 
та пріоритетність дій [15; 19]. 
Матриця 3.12 – Матриця якісної оцінки ризиків 
Ймовірність / Вплив Низький Середній Високий 
0.8–1.0 – – – 
0.6–0.8 – Р1 Р1 
0.4–0.6 – Р3, Р6 Р2 
0.2–0.4 – Р4 Р7 
0.0–0.2 – Р7 Р8 
(Позначення «P#» відповідають номерам ризиків у таблиці 3.11.) 
Матриця показує, що найбільш критичними є ризики, пов’язані з якістю даних, 
стабільністю ML-пайплайнів та безпекою. Планування реагування на ризики 
передбачає розроблення заходів, спрямованих на: 
- уникнення ризику; 
- зменшення ймовірності або впливу; 
- передачу ризику; 
- прийняття ризику з контролем; 
- розроблення плану дій у разі реалізації ризику. 
 
Таблиця 3.13 — План реагування на ключові ризики проєкту 
№ Назва ризику Попередження Мінімізація / Відповідальний 
ризику Усунення 
1 Низька якість Валідація схем, Аномалія-детекція, Data Engineer 
даних автоматичні тести ручний аудит даних 
64 
2 Збій ML- Резервні Перезапуск, fallback- MLOps Engineer 
пайплайнів конфігурації, моделі 
тестування модулів 
3 Дрейф моделей Розклад Оновлення моделей, ML Engineer 
регулярного корекція фіч 
перенавчання 
4 Проблеми Тестування Кешування, резервні Backend 
інтеграції API сумісності, API Developer 
throttling-контроль 
5 Фінансові Budget Alerts, Оптимізація PM + Architect 
ризики контроль обчислень, 
інфраструктури використання 
менших моделей 
6 Організаційні Регулярні Формалізація ролей, PM 
ризики синхронізації уточнення вимог 
команд 
7 Юридичні Моделі анонімізації Аудит доступів, Data Architect 
ризики даних відповідність GDPR 
8 Ризики безпеки Security scans, IAM- Реагування на DevOps/Security 
контроль інциденти, 
шифрування 
 
Моніторинг ризиків передбачає систематичне відстеження появи нових 
ризиків, оцінювання ефективності застосованих заходів реагування та регулярне 
оновлення реєстру ризиків. У межах проєкту ця діяльність реалізується через 
постійний перегляд ризикових факторів під час спринтових зустрічей, відстеження 
продуктивності моделей машинного навчання з урахуванням показників дрейфу та 
зміни ключових метрик, аналіз якості даних із контролем показників повноти, 
актуальності та узгодженості, а також перевірку стабільності роботи API, включаючи 
швидкодію та рівень помилок.  
Додаткову роль у контролі відіграють системи логування та оповіщення, які 
забезпечують виявлення критичних подій у режимі реального часу. У разі зміни 
профілю ризиків здійснюється оновлення RACI-матриці та WBS-структури, що 
дозволяє оперативно адаптувати відповідальності та планування робіт. Окремим 
елементом є регулярний аудит безпеки та контролю доступів, спрямований на 
запобігання інцидентам і забезпечення відповідності системи вимогам інформаційної 
безпеки. 
65 
Ефективний моніторинг забезпечує вчасне виявлення відхилень, швидке 
коригування моделей, архітектури чи бізнес-логіки та зберігає стабільне, 
передбачуване функціонування системи в умовах динамічних змін середовища. 
Система управління ризиками у проєкті інтеграції штучного інтелекту 
забезпечує структурований підхід до роботи з невизначеністю на всіх етапах 
життєвого циклу — від збору та підготовки даних до експлуатації й моніторингу 
моделей. Комплексність цього підходу полягає у поєднанні процесів ідентифікації, 
аналізу, планування реагування та безперервного моніторингу ризикових подій, що 
разом дає можливість мінімізувати негативний вплив технічних і організаційних 
факторів на перебіг проєкту, забезпечити високу стабільність ML-процесів і якість 
даних, гарантувати відповідність системи вимогам безпеки та регуляторним нормам, 
підтримувати безперебійність роботи інтеграційних компонентів і підвищувати 
передбачуваність, контрольованість та ефективність реалізації проєктних 
результатів. Таким чином, управління ризиками виконує роль критичного механізму, 
що забезпечує надійність і стійкість проєкту в умовах високої технологічної 
складності та динамічних змін зовнішнього середовища. 
Висновки до розділу 3 
 
 У третьому розділі розроблено комплексну систему планування проєкту. 
Використання структурної декомпозиції робіт (WBS) дозволило структурувати етапи 
реалізації та визначити логічні залежності між ними [15; 16]. Сформована матрична 
оргструктура та матриця RACI забезпечили чіткий розподіл відповідальності в крос-
функціональній команді, мінімізуючи ризики втрати контролю . 
Календарний план, побудований за методом критичного шляху (CPM), 
дозволив об’єктивно оцінити тривалість проєкту та встановити контрольні точки для 
моніторингу прогресу [15; 16]. Економічну обґрунтованість забезпечено плануванням 
ресурсів методом «bottom-up», що враховує витрати на хмарну інфраструктуру та 
команду [15]. Також визначено стандарти якості та механізми управління ризиками, 
що закладає повну методологічну основу для практичної реалізації проєкту та 
переходу до етапу моделювання [15; 18; 19].  
66 
4 МОДЕЛЮВАННЯ ІНТЕГРАЦІЇ ШТУЧНОГО ІНТЕЛЕКТУ ТА АНАЛІЗ 
РЕЗУЛЬТАТІВ ПРОЄКТУ 
4.1 Опис моделей, які характеризують продукт проєкту 
Моделі, що описують продукт стартапу, відіграють ключову роль у формуванні 
цілісного бачення майбутньої системи, визначенні логіки її функціонування та 
взаємодії з зовнішніми елементами. Їх використання дозволяє не лише формалізувати 
вимоги, а й структурно представити механізми обробки даних, які лежать в основі 
розроблюваного рішення. На цьому етапі моделювання забезпечує розуміння того, 
які компоненти будуть відповідати за збір поведінкових подій, у який спосіб вони 
перетворюються на структуровану інформацію, що надалі використовується для 
навчання моделей машинного навчання, і яким чином кінцевий користувач отримує 
персоналізовані рекомендації під час взаємодії із системою. 
Першим важливим аспектом формування моделі є визначення функціональних 
можливостей системи, що наочно демонструється через діаграму варіантів 
використання (Use Case) [26]. Вона відображає ключових акторів - покупця, 
адміністратора магазину, технічних спеціалістів та елементи інфраструктури Shopify 
- і показує, як кожен із них взаємодіє із системою. Це дає змогу описати загальну 
поведінку продукту: від генерації подій користувачем до формування рекомендацій, 
які відображаються під час оформлення замовлення. Структура взаємодій між 
акторами та системою відображена на Рисунок 4.1. 
На діаграмі варіантів використання Рисунок 4.1 відображено основних акторів: 
- Покупець: генерує поведінкові події; 
- Shopify Store: передає події у систему; 
- Адміністратор магазину: переглядає аналітичні дані і керує налаштування; 
- Data/ML Engineer: відповідає за моделювання, контроль якості та експерменти. 
 
 
 
67 
 
Рисунок 4.1 — Діаграма варіантів використання системи 
 
 Подальший розвиток моделі вимагає аналізу системи у ширшому контексті її 
функціонування, що забезпечується побудовою контекстної діаграми [27]. Такий 
підхід дозволяє розглядати продукт не лише як сукупність внутрішніх процесів, а як 
елемент складної екосистеми, у якій він взаємодіє з низкою зовнішніх сервісів і 
користувачів. Контекстна діаграма відіграє роль інструмента, який окреслює межі 
системи, визначає, які саме компоненти перебувають у її сфері відповідальності, а які 
функціонують як зовнішні джерела даних або споживачі результатів роботи. 
 Модель відображає рух інформації між фронтенд-скриптами магазину, що 
генерують поведінкові події покупців, та бекенд-API платформи Shopify, яке 
забезпечує передачу системних webhook-повідомлень. Також у контекстній діаграмі 
представлені адміністративні інструменти, за допомогою яких керівництво магазину 
отримує доступ до аналітичних даних і результатів роботи рекомендаційних 
алгоритмів. Важливою складовою є хмарна інфраструктура AWS, у межах якої 
відбувається обробка, зберігання та аналітичне опрацювання подій, а також навчання 
і періодичне оновлення моделей машинного навчання. Саме поєднання цих елементів 
забезпечує можливість безперервної передачі інформації, її трансформації у 
68 
структуровані набори даних та використання для точних персоналізованих 
рекомендацій. 
Окрему увагу в контекстній моделі приділено ролі технічних фахівців, які 
забезпечують конфігурацію системи, оптимізацію параметрів моделей, проведення 
тестування та виконання MLOps-процедур. Їх взаємодія із системою включає 
налаштування інфраструктурних компонентів, запуск експериментів, контроль якості 
даних та аналіз стабільності потоків подій. Таким чином, контекстна діаграма не лише 
демонструє структуру інформаційних потоків, а й відображає розподіл 
відповідальності між різними учасниками процесу. 
Узагальнення всіх зазначених зв’язків, потоків даних та ролей відображено на 
Рисунку 4.2, який подає цілісну картину взаємодії AI-системи з екосистемою Shopify 
та іншими зовнішніми компонентам. 
 
Рисунок 4.2 — Контекстна діаграма взаємодії AI-системи та екосистеми Shopify 
 
Зазначені моделі виконують важливу системотвірну функцію, оскільки 
забезпечують формування спільного бачення архітектури та поведінки системи для 
всіх учасників розробки. Діаграма варіантів використання дозволяє побачити систему 
з позиції її користувачів та зовнішніх компонентів, тоді як контекстна діаграма 
окреслює межі продукту та забезпечує чітке відокремлення внутрішньої логіки від 
зовнішніх інтеграційних елементів. Завдяки цьому формується логічна основа для 
69 
подальшого деталізованого моделювання, включно з розробкою потоків даних, 
моделі бази даних та архітектурної структури обробки інформації. 
Узагальнений опис моделей у межах підрозділу 4.1 створює концептуальний 
фундамент для подальшої технічної деталізації. Саме на основі сформованих у цьому 
розділі уявлень вибудовується структура інформаційних потоків, визначається 
організація компонентів системи та формуються вимоги до елементів машинного 
навчання. Це забезпечує логічну послідовність у побудові проєктної документації та 
сприяє підвищенню якості архітектурних рішень, що розглядаються у наступних 
підрозділах. 
4.2 Моделювання системи та її інформаційних потоків 
Моделювання структури та логіки функціонування системи потребує 
детального аналізу того, як дані надходять до інфраструктури, у який спосіб вони 
трансформуються та які компоненти залучаються до їх опрацювання. У межах 
стартапу, спрямованого на інтеграцію штучного інтелекту з екосистемою Shopify, 
ключову роль відіграє побудова моделі потоків даних та архітектури їх обробки. Ці 
моделі забезпечують глибоке розуміння механізмів взаємодії між окремими 
модулями, дозволяють визначити технічні вимоги до інфраструктури та створюють 
основу для розробки ефективних і масштабованих ML-пайплайнів. 
Інформаційні потоки в системі формуються на основі поведінкових подій 
користувачів, які надходять із фронтенд-скриптів Shopify та системних webhook-
повідомлень. Вони проходять через рівень первинної обробки, де відбувається 
валідація, нормалізація та маршрутизація подій у сховище даних. Подальший етап 
передбачає їх агрегування, структурування та перетворення на датасети для 
машинного навчання. Щоб відобразити усю послідовність переходів даних від 
моменту генерації до використання в моделі, була побудована діаграма потоків даних 
(DFD), наведена на Рисунку 4.3 [28]. 
 
70 
 
Рисунок 4.3 — DFD рівня 0 процесів збору, зберігання та обробки подій 
71 
DFD-модель дозволяє проаналізувати зв’язки між ключовими процесами: 
інжестом подій, передачею інформації в черги повідомлень, їх переходом у сховище 
S3, аналітичною обробкою через Glue та Athena, формуванням ознак для моделей, а 
також роботою з модельним реєстром, через який забезпечується контроль версій 
моделей та їх доступність для inference-сервісів. Важливою частиною моделі є також 
зворотний зв’язок, у межах якого система отримує інформацію щодо якості роботи 
моделей і коригує параметри навчання. 
Наступним кроком після побудови потоків даних є розробка архітектурної 
моделі системи, яка відображає взаємодію інфраструктурних компонентів. На 
Рисунку 4.4 представлено архітектурну схему AI-системи інтеграції з Shopify, яка 
включає елементи AWS-інфраструктури, сервіси керування подіями, процеси 
підготовки даних, модуль навчання моделей та сервіс інференсу [30]. Архітектура 
формує логіку автоматизованої обробки даних, забезпечує масштабованість системи 
та підтримує повний ML-життєвий цикл - від збору даних до видачі персоналізованих 
рекомендацій у режимі реального часу. 
Суттєвим елементом технічної моделі є структура даних, на основі якої 
формуються тренувальні вибірки, створюються ознаки та забезпечується доступ до 
агрегованої інформації під час inference. Логічна модель даних включає сутності, що 
характеризують покупців, їхню поведінку, товари та параметри сесій [29]. Фізична 
реалізація передбачає використання хмарних сховищ та сервісів обробки, таких як 
Amazon S3, DynamoDB, Glue, Athena та Feature Store. Ці компоненти забезпечують 
можливість роботи з великими обсягами подій, оптимізують швидкість доступу та 
дозволяють створювати відтворювані інфраструктурні процеси [31].
 
 
Рисунок 4.4 — Архітектурна схема AI-системи інтеграції з Shopify 
 
Завдяки моделюванню, представленому в межах цього підрозділу, вдалося 
сформувати цілісне бачення архітектури системи, визначити ключові технічні 
залежності, побудувати основу для навчання моделей та забезпечити необхідні 
засоби для масштабування та підтримки високої продуктивності. Це створює 
міцний фундамент для подальших етапів реалізації стартапу та переходу до 
контролю процесів, розглянутих у наступному підрозділі. 
4.3 Моделювання взаємодії компонентів 
Ефективна реалізація стартапу потребує впровадження комплексного 
механізму контролю, який охоплює усі етапи роботи системи: від збору подій до 
генерації рекомендацій та моніторингу моделей машинного навчання [33]. 
Контроль дозволяє забезпечити надійність інфраструктури, стабільність обробки 
даних, високу якість моделей, а також відповідність сервісів вимогам до 
продуктивності та точності. У контексті інтеграції AI-рішень із Shopify контроль 
набуває особливого значення, оскільки система працює у реальному часі й 
залежить від безперервного потоку подій, швидкої генерації рекомендацій та 
стабільної роботи API. 
Ефективність контролю забезпечується за рахунок систематичного 
спостереження за роботою кожного компонента, зокрема черг повідомлень, 
сховищ даних, ETL/ELT-процесів, функцій AWS Lambda, потокових сервісів та 
модельних API. Аналізуються обсяги даних, затримки у процесах обробки, 
стабільність отримання подій, помилки при виконанні запитів, показники 
доступності, швидкодії та відмовостійкості системи. У межах ML-процесів 
додатково контролюються метрики якості, рівень дрейфу даних, актуальність 
навчання, коректність параметрів моделі та відтворюваність результатів. 
З метою глибшого розуміння логіки, за якою інференс-модель взаємодіє з 
екосистемою Shopify, була побудована діаграма послідовності [26; 38]. На 
Рисунку 4.5 представлено механізм отримання персоналізованих рекомендацій 
під час оформлення замовлення. Діаграма відображає ключові етапи процесу: 
формування запиту з фронтенду, передавання його через бекенд Shopify, обробку 
74 
у рекомендаційному сервісі та повернення результатів у вигляді персоналізованих 
товарних пропозицій. Така модель дозволяє детально оцінити часові залежності, 
критичні точки обробки та перевірити узгодженість роботи компонентів у 
реальному часі. 
Механізм контролю також охоплює управління модельними артефактами, 
журналювання, складання звітів, регулярний аудит інфраструктури та тестування 
сервісів. Завдяки цьому забезпечується стабільність роботи продукту, 
підвищується точність рекомендацій, покращується якість накопичених даних та 
оптимізується процес оновлення моделей. 
Узагальнюючи, комплексний підхід до контролю дозволяє забезпечити 
прозорість реалізації стартапу, підтримувати високу ефективність обробки даних 
та гарантувати якість роботи рекомендаційної моделі на всіх етапах її життєвого 
циклу. Такий механізм формує стійку основу для подальшого масштабування 
системи, впровадження нових моделей і підтримки стабільної роботи продукту 
під час інтеграції з екосистемою Shopify та іншими зовнішніми сервісами.
 
 
 
 
Рисунок 4.5 — Діаграма послідовності процесу отримання рекомендацій у Shopify Checkout
 
4.4 Аналіз результатів моделювання та тестування системи 
Метою цього етапу є верифікація розробленої архітектури та моделей на 
відповідність технічним вимогам, а також оцінка ефективності роботи ML-
компонентів. Тестування проводилося у кілька етапів, що охоплювали перевірку 
якості даних, валідацію моделей та навантажувальне тестування інтеграційних 
шлюзів. 
Для рекомендаційної системи було використано метрики точності, які 
дозволяють оцінити релевантність запропонованих товарів [32; 36]. Навчання 
проводилося на історичних даних поведінки користувачів. Результати валідації 
моделі наведено у таблиці 4.1. 
Таблиця 4.1 — Метрики ефективності рекомендаційної моделі 
Метрика Опис Цільове Фактичне Статус 
значення значення 
Precision@K (K=5) Частка релевантних ≥ 0.15 0.18 Виконано 
товарів у топ-5 
рекомендацій 
Recall@K (K=5) Частка знайдених ≥ 0.10 0.12 Виконано 
релевантних товарів 
серед усіх можливих 
NDCG (Normalized Оцінка якості ≥ 0.25 0.29 Виконано 
Discounted ранжування з 
Cumulative Gain) урахуванням позиції 
Training Time Час повного циклу ≤ 4 3.2 години Виконано 
перенавчання моделі години 
 
Отримані результати свідчать, що модель демонструє достатню точність для 
використання у продуктивному середовищі, перевищуючи базові порогові 
значення (baseline) [37]. Метою цього етапу верифікації було підтвердження того, 
що розроблена архітектура здатна забезпечити безперебійну обробку даних та 
надання рекомендацій в умовах реальної експлуатації. Тестування проводилося у 
три етапи: перевірка функціональної логіки (Functional Testing), інтеграційне 
тестування (Integration Testing) та стрес-тестування (Stress/Load Testing) [35]. 
77 
Для проведення випробувань було розгорнуто тестове середовище (Staging 
Environment) [34], яке повністю дублює продуктивну архітектуру на базі AWS. Як 
інструменти тестування використовувалися: 
- Locust (Python): для генерації синтетичного навантаження та імітації 
одночасної роботи тисяч користувачів. 
- AWS CloudWatch: для моніторингу метрик інфраструктури (CPU, RAM, 
Latency, Error Rate) у реальному часі. 
Основний акцент було зроблено на перевірці цілісності даних (Data Integrity) під 
час їх проходження через ETL-пайплайни. Було перевірено сценарії «позитивного» 
шляху (Happy Path) та обробки виключних ситуацій. Було згенеровано 10 000 
тестових подій (перегляди товарів, додавання в кошик). Результат перевірки в 
Amazon S3 показав 100% збереження даних. Формат даних успішно конвертовано 
з JSON у Parquet, що підтверджує коректність роботи AWS Glue. Перевірялася 
коректність відповіді моделі на запит з фронтенду. Система коректно обробляє 
запити, що містять userId та контекст кошика, повертаючи JSON-список 
рекомендованих товарів. 
Таблиця 4.2 — Зведені результати тестування системи 
№ Сценарій Умови тесту Очікуваний Отриманий Висновок 
тестування результат результат 
1 Обробка Емуляція 10 Всі події 100% подій Успішно 
Webhook- тис. подій збережені в Data успішно 
подій через Lake, дублікати записано в 
Postman відсутні S3 (Parquet) 
2 Автоматичний Тригер за Airflow-даг Пайплайн Успішно 
запуск ETL розкладом запускається, дані відпрацював 
трансформуються коректно, 
без помилок статус 
"Success" 
3 Швидкодія Запит Час відповіді < Середній Успішно 
API (Latency) рекомендацій 200 мс час: 145 мс 
при (P99: 198 
звичайному мс) 
навантаженні 
 
 
 
78 
Продовження таблиці 4.2 
4 Стрес- 650 RPS Відсутність Система Успішно 
тестування (Load (запитів/сек) помилок 5xx, витримала 
Test) протягом 10 Latency < 500 навантаження, 
хв мс помилок 0% 
5 Відмовостійкість Примусове Система Трафік Успішно 
(Failover) відключення перенаправляє перерозподілено 
одного вузла трафік, втрати Load Balancer-
обробки даних немає ом 
6 Data Drift Подача Система Алерт отримано Успішно 
Monitoring даних з генерує в Slack через 5 
відхиленням сповіщення хв 
розподілу на (Alert) 
20% 
 
 Результати тестування підтверджують, що спроєктована архітектура на базі 
хмарних сервісів AWS забезпечує необхідну продуктивність та надійність, а 
механізми MLOps дозволяють контролювати життєвий цикл моделей. 
Для забезпечення успішної реалізації проєкту та дотримання встановлених 
строків і бюджету розроблено механізм адміністративного контролю. Він базується 
на регулярному моніторингу ключових показників ефективності (KPI) проєкту та 
управлінні змінами. 
Для підтримки прозорості виконання робіт впроваджено багаторівневу 
систему звітності (Таблиця 4.3) 
Таблиця 4.3 — Регламент звітності та нарад 
Тип заходу / Періодичність Учасники Мета та зміст 
Звіту 
Daily Stand-up Щодня (15 Проєктна Синхронізація поточних 
хв) команда задач, виявлення блокерів. 
Sprint Review Раз на 2 тижні Команда, Демонстрація результатів 
Стейкхолдери спринту (готових функцій 
або моделей). 
Звіт про Щотижня PM, Замовник Звіт про прогрес (Plan/Fact), 
статус використання бюджету, 
проєкту статус ризиків. 
Технічний Щомісяця Архітектор, Перевірка якості коду, 
аудит Tech Lead архітектури та безпеки 
даних. 
 
79 
Висновки до розділу 4 
У четвертому розділі проведено комплексне моделювання виконання 
стартапу з інтеграції штучного інтелекту в систему обробки даних. Сформовано 
опис моделей продукту (Use Case та Context Diagram), що дозволило чітко 
окреслити межі системи та сценарії взаємодії з користувачами й зовнішніми 
платформами (Shopify). Розроблено детальну модель потоків даних (DFD) та 
архітектурну схему, які відображають логіку ETL-процесів, навчання моделей та 
інференсу в хмарному середовищі AWS. Це підтвердило технічну здійсненність 
проєкту. Проведено моделювання взаємодії компонентів за допомогою діаграми 
послідовності, що дозволило верифікувати логіку роботи системи в реальному часі 
під час обробки запитів користувачів.  
Таким чином, результати моделювання підтверджують, що запропоноване 
рішення є технічно зрілим, організаційно забезпеченим та готовим до практичної 
реалізації. 
 
 
 
80 
ВИСНОВКИ 
У кваліфікаційній роботі магістра вирішено актуальне науково-прикладне 
завдання розроблення комплексної моделі управління проєктом інтегрування 
штучного інтелекту в систему обробки даних. На основі проведених досліджень, 
моделювання та розрахунків отримано наступні результати. 
Встановлено, що експоненційне зростання обсягів даних (понад 120 ЗБ у 2023 
році) та розвиток технологій AI формують стійкий попит на інтелектуальні системи 
обробки інформації. Аналіз конкурентного середовища показав, що існуючі 
рішення (Klaviyo AI, Shopify Magic) часто є фрагментарними й не забезпечують 
комплексної MLOps-інтеграції, що підтвердило наявність ринкової ніші для 
розроблюваного продукту. За результатами STEP та SWOT-аналізу визначено, що 
технологічні та економічні фактори сприяють реалізації проєкту, а стратегія 
розвитку має базуватися на використанні інноваційних можливостей AI при 
жорсткому контролі якості даних. 
На основі побудованих дерев проблем і цілей сформовано концепцію 
переходу від застарілої моделі «AS-IS» (ручна обробка, фрагментованість) до 
моделі «TO-BE» (автоматизована AI-орієнтована система). Запропоновано 
п’ятирівневу архітектуру, що включає шари збору даних (Ingestion), зберігання 
(Data Lake), обробки, ML-моделювання та API-інтеграції. Це дозволяє вирішити 
ключову проблему низької ефективності прийняття управлінських рішень шляхом 
автоматизації аналітичних процесів. Застосування методу структурної 
декомпозиції робіт (WBS) дозволило виділити 5 основних фаз реалізації проєкту: 
від ініціації до запуску в експлуатацію. Розроблено календарний план за методом 
критичного шляху, який визначає тривалість проєкту в 109 робочих днів. 
Розраховано бюджет проєкту, який становить 55 198 доларів США, де основну 
частку (79,3%) складають витрати на команду висококваліфікованих фахівців. 
Сформовано матричну організаційну структуру та матрицю відповідальності 
(RACI), що забезпечує ефективну взаємодію крос-функціональної команди.  
Ідентифіковано та оцінено ключові ризики проєкту, серед яких найбільш 
критичними визначено низьку якість даних та нестабільність ML-пайплайнів. 
81 
Розроблено план реагування на ризики та систему метрик якості (Data Quality, 
Model Accuracy, API Latency), що базується на міжнародних стандартах та MLOps-
практиках. Це гарантує надійність системи та відповідність бізнес-вимогам 
замовника. 
Розроблено детальні моделі потоків даних (DFD) та архітектурну схему на 
базі хмарної інфраструктури AWS, що забезпечує масштабованість рішення. 
Тестування прототипу підтвердило ефективність закладених алгоритмів: 
рекомендаційна модель досягла цільових показників точності (Precision@5 = 0.18, 
NDCG = 0.29), а інфраструктура успішно витримала навантажувальні тести. 
Результати роботи підтверджують технічну здійсненність, економічну 
доцільність та організаційну забезпеченість проєкту. Впровадження розробленої 
системи дозволить автоматизувати процеси обробки даних, скоротити час на 
прийняття рішень (Time-to-Insight) та забезпечити персоналізовану взаємодію з 
користувачами, що створить значні конкурентні переваги для бізнесу в сфері 
електронної комерції. Отже, виконана робота має практичну цінність, оскільки 
запропонована архітектура на базі AWS та MLOps готова до впровадження, а 
результати тестування підтверджують досягнення цільових показників 
ефективності 
  
82 
 
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ 
1. The Digitization of the World: From Edge to Core. IDC / Seagate, 2018. 
URL: https://www.seagate.com/files/www-content/our-story/trends/files/idc-
seagate-dataage-whitepaper.pdf (дата звернення: 22.11.2025). 
2. Data Explosion: Key Drivers Behind Unprecedented Data Growth. ApplyDataAI, 
2025. URL: https://applydata.ai (дата звернення: 22.11.2025). 
3. Business Analytics: A Data-Driven Decision Making Approach for Business. – 
Business Expert Press, 2016. 
4. Poulose J. (ed.). Data-Driven Decision Making. – Springer, 2023. 
5. Data-Driven Decision-Making and Business Intelligence in Modern Organizations. 
Research article, 2024. 
6. Neptune.ai. MLOps Tools and Platforms Landscape. – Neptune AI Blog, 2022. 
URL: https://neptune.ai/blog (дата звернення: 22.11.2025). 
7. Futurense. Top 10 MLOps Tools in 2025: Features & Benefits. Futurense 
Academy, 2025. URL: https://futurense.com (дата звернення: 22.11.2025). 
8. Grand View Research. Artificial Intelligence in E-commerce Market Size, Share 
& Trends. Grand View Research, 2024. URL: 
https://www.grandviewresearch.com (дата звернення: 22.11.2025). 
9. Bilovodska O., Pasmor M., etc. Artificial Intelligence for Marketing Product 
Strategy in the Online Education Market // Economics of Development. – 2024. – 
Vol. 23, No. 3. – С. 18–31. 
10. Балабанова Л. В. SWOT-аналіз – основа формування маркетингових 
стратегій підприємства. – К.: Знання, 2005. – 301 с. 
11. Берницька Д. І. Стратегічний аналіз зовнішнього середовища підприємства 
методом PEST/STEP // Економічний аналіз. – 2012. – Вип. 11, ч. 2. – С. 41–
45. 
12. Долгальова О. Оцінювання впливу факторів зовнішнього середовища на 
діяльність підприємства // Галицький економічний вісник. – 2020. 
83 
13. Піжук О. І., Пронькін М. С. Методика проведення SWOT-аналізу як 
передумови прийняття стратегічних рішень // Глобальні та національні 
проблеми економіки. – 2017. 
14. Розширюючи обрії управління проектами: збірник матеріалів конференції. – 
Міносвіти України, 2018. 
15. Project Management Institute. A Guide to the Project Management Body of 
Knowledge (PMBOK® Guide). 7th ed. Newtown Square, PA: PMI, 2021. 370 p 
16. Бушуєв С. Д. Управління проектами: Підручник / С. Д. Бушуєв, Н. С. 
Бушуєва. – К.: Саміт-Книга, 2010. – 368 с. 
17. ISO 21502:2020. Project, programme and portfolio management — Guidance on 
project management. Geneva: ISO, 2020. 46 p. 
18. ISO 10006:2017. Quality management — Guidelines for quality management in 
projects. Geneva: ISO, 2017. 
19. ISO 31000:2018. Risk management — Guidelines. Geneva: ISO, 2018. 
20. Booch G., Rumbaugh J., Jacobson I. The Unified Modeling Language User Guide. 
2nd Edition. Addison-Wesley Professional, 2005. 496 p 
21. Connolly T., Begg C. Database Systems: A Practical Approach to Design, 
Implementation, and Management. 6th Edition. Pearson, 2014. 1440 p. 
22. Chapman P. et al. CRISP-DM 1.0: Step-by-step data mining guide. SPSS Inc., 
2000. 78 p. 
23. ISO/IEC 25010:2011. Systems and software engineering — Systems and software 
Quality Requirements and Evaluation (SQuaRE) — System and software quality 
models. Geneva: ISO, 2011. 
24. ISO/IEC 42001:2023. Information technology — Artificial intelligence — 
Management system. Geneva: ISO, 2023. 
25. The DataOps Manifesto. URL: https://dataopsmanifesto.org (дата звернення: 
22.11.2025). 
26. Fowler M. UML Distilled: A Brief Guide to the Standard Object Modeling 
Language. 3rd ed. Addison-Wesley Professional, 2003. 208 p. 
84 
27. Kossiakoff A., Sweet W. N., Seymour S. J., Biemer S. M. Systems Engineering 
Principles and Practice. 2nd ed. Wiley, 2011. 592 p. 
28. DeMarco T. Structured Analysis and System Specification. Yourdon Press, 1979. 
352 p 
29. Kleppmann M. Designing Data-Intensive Applications: The Big Ideas Behind 
Reliable, Scalable, and Maintainable Systems. O'Reilly Media, 2017. 616 p. 
30. Amazon Web Services. AWS Well-Architected Framework. Whitepaper. AWS, 
2024.URL:https://docs.aws.amazon.com/wellarchitected/latest/framework/wellar
chitected-framework.pdf (дата звернення: 25.11.2025). 
31. Erl T., Puttini R., Mahmood Z. Cloud Computing: Concepts, Technology & 
Architecture. Prentice Hall, 2013. 528 p. 
32. Ricci F., Rokach L., Shapira B. Recommender Systems Handbook. 3rd ed. 
Springer, 2022. 1003 p. 
33. Beyer B., Jones C., Petoff J., Murphy N. R. Site Reliability Engineering: How 
Google Runs Production Systems. O'Reilly Media, 2016. 550 p. 
34. Gunther N. J. Guerrilla Capacity Planning: A Tactical Approach to Planning for 
Highly Scalable Applications and Services. Springer, 2007. 222 p. 
35. ISO/IEC/IEEE 29119-1:2022. Software and systems engineering — Software 
testing — Part 1: General concepts. Geneva: ISO, 2022. 
36. Aggarwal C. C. Recommender Systems: The Textbook. Springer, 2016. 498 p. 
37. Géron A. Hands-On Machine Learning with Scikit-Learn, Keras, and 
TensorFlow. 3rd ed. O'Reilly Media, 2022. 856 p. 
38. Richards M., Ford N. Fundamentals of Software Architecture: An Engineering 
Approach. O'Reilly Media, 2020. 432 p.
Репозиторій ЧДТУ