<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <title>DSpace Community:</title>
  <link rel="alternate" href="https://er.chdtu.edu.ua/handle/ChSTU/5864" />
  <subtitle />
  <id>https://er.chdtu.edu.ua/handle/ChSTU/5864</id>
  <updated>2026-06-24T04:30:39Z</updated>
  <dc:date>2026-06-24T04:30:39Z</dc:date>
  <entry>
    <title>Adaptive hybrid SMS spam detection system with user feedback-based self-learning</title>
    <link rel="alternate" href="https://er.chdtu.edu.ua/handle/ChSTU/9063" />
    <author>
      <name>Liakh, Ihor</name>
    </author>
    <author>
      <name>Chorniy, Andriy</name>
    </author>
    <author>
      <name>Lutak, Oksana</name>
    </author>
    <author>
      <name>Tsenkner, Marian</name>
    </author>
    <author>
      <name>Лях, Ігор</name>
    </author>
    <author>
      <name>Чорній, Андрій Михайлович</name>
    </author>
    <author>
      <name>Лутак, Оксана</name>
    </author>
    <author>
      <name>Ценкнер, Мар’ян</name>
    </author>
    <id>https://er.chdtu.edu.ua/handle/ChSTU/9063</id>
    <updated>2026-03-25T01:01:24Z</updated>
    <published>2025-01-01T00:00:00Z</published>
    <summary type="text">Title: Adaptive hybrid SMS spam detection system with user feedback-based self-learning
Authors: Liakh, Ihor; Chorniy, Andriy; Lutak, Oksana; Tsenkner, Marian; Лях, Ігор; Чорній, Андрій Михайлович; Лутак, Оксана; Ценкнер, Мар’ян
Abstract: This study presented a comprehensive approach to SMS spam detection based on a hybrid architecture&#xD;
that integrated local message processing algorithms with high-performance cloud-based deep learning models.&#xD;
This approach enabled a balance between classification accuracy and the privacy of processed messages. The&#xD;
objective of this study was to develop an intelligent hybrid SMS spam detection system capable of delivering&#xD;
high classification accuracy, maintaining up-to-date knowledge, enabling user personalisation, and adapting&#xD;
to new attack patterns. To achieve the study’s objective, a comprehensive analytical approach was applied,&#xD;
combining a detailed review of scientific literature on SMS spam detection – including machine learning, neural&#xD;
networks, and hybrid methods – with empirical analysis. To implement classic machine learning models (Naïve&#xD;
Bayes, Logistic Regression, Random Forest), standard machine learning libraries were used, and for deep learning,&#xD;
frameworks that support recurrent neural networks, in particular Long Short-Term Memory and transformer&#xD;
architectures, were applied. The system was tested on the open SMS Spam Collection dataset using Accuracy&#xD;
(up to 0.98), F1-score (up to 0.95) and ROC-AUC (up to 0.98) metrics. Moreover, a system was developed to&#xD;
dynamically update knowledge based on user feedback, alongside a weighted framework designed to evaluate&#xD;
the trustworthiness of that feedback. During the study, a multi-level system was developed that performed&#xD;
initial classification on the user’s device with the ability to delegate processing to a cloud module in cases of uncertainty. Compared to basic approaches, the hybrid architecture demonstrated improved classification&#xD;
accuracy, reduced false positives and false negatives, and increased adaptability to changes in the structure&#xD;
of spam messages. Aggregation of suspicious messages in the cloud ensured effective retraining of models in&#xD;
cases of conceptual shift. The practical value of the results lies in the potential integration of the developed&#xD;
system into mobile platforms, as well as corporate information security tools, for the purpose of filtering SMS&#xD;
content and protecting end-users from social engineering.; У статті представлено комплексний підхід до виявлення SMS-спаму на основі гібридної архітектури,&#xD;
яка поєднує локальні алгоритми обробки повідомлень із високопродуктивними хмарними моделями&#xD;
глибокого навчання. Такий підхід дозволяє досягти балансу між точністю та конфіденційністю обробки&#xD;
вхідних повідомлень. Метою дослідження було створення інтелектуальної гібридної системи виявлення&#xD;
SMS-спаму, яка забезпечувала б високу точність класифікації, підтримку актуальності знань, персоналізацію&#xD;
для користувачів та здатність адаптуватися до нових шаблонів атак. Для досягнення мети дослідження було&#xD;
застосовано комплексний аналітичний підхід, що поєднував детальний огляд наукової літератури з питань&#xD;
виявлення спаму в SMS-повідомленнях, включаючи машинне навчання, нейронні мережі та гібридні методи, з&#xD;
емпіричним аналізом. Для реалізації класичних моделей машинного навчання (Naïve Bayes, Logistic Regression,&#xD;
Random Forest) використовувалися стандартні бібліотеки машинного навчання, а для глибокого навчання –&#xD;
фреймворки, що підтримують рекурентні нейронні мережі, зокрема Long Short-Term Memory та трансформерні&#xD;
архітектури. Тестування системи на відкритому датасеті SMS Spam Collection з використанням метрик Accuracy&#xD;
(до 0,98), F1-score (до 0,95) та ROC-AUC (до 0,98). Додатково було реалізовано механізм динамічного оновлення&#xD;
знань через зворотний зв’язок користувача та запропоновано вагову систему оцінки достовірності фідбеку. У&#xD;
ході дослідження було розроблено багаторівневу систему, що виконувала початкову класифікацію на пристрої&#xD;
користувача з можливістю делегування обробки хмарному модулю у випадках невизначеності. У порівнянні&#xD;
з базовими підходами, гібридна архітектура продемонструвала покращення точності класифікації, зниження&#xD;
кількості хибнопозитивних і хибнонегативних спрацьовувань, а також підвищену адаптивність до змін у структурі&#xD;
spam-повідомлень. Агрегація підозрілих повідомлень у хмарі забезпечувала ефективне донавчання моделей у&#xD;
випадках концептуального зсуву. Практична цінність результатів полягає в можливості інтеграції розробленої&#xD;
системи для мобільних платформ, а також у корпоративні засоби інформаційної безпеки з метою фільтрації&#xD;
SMS-контенту та захисту кінцевих користувачів від соціальної інженерії.</summary>
    <dc:date>2025-01-01T00:00:00Z</dc:date>
  </entry>
  <entry>
    <title>Continuous feedback loops: Online fine-tuning of LLMs with user signals</title>
    <link rel="alternate" href="https://er.chdtu.edu.ua/handle/ChSTU/9062" />
    <author>
      <name>Shvets, Sofiia</name>
    </author>
    <author>
      <name>Швець, Софія</name>
    </author>
    <id>https://er.chdtu.edu.ua/handle/ChSTU/9062</id>
    <updated>2026-03-25T01:01:00Z</updated>
    <published>2025-01-01T00:00:00Z</published>
    <summary type="text">Title: Continuous feedback loops: Online fine-tuning of LLMs with user signals
Authors: Shvets, Sofiia; Швець, Софія
Abstract: The intensive growth in the use of real-time language models requires mechanisms for their dynamic&#xD;
adaptation to changes in queries, terminology, and user expectations. The study aimed to investigate approaches&#xD;
to continuous feedback-based retraining of large language models. To achieve this goal, the theoretical and&#xD;
structural-functional modelling of the adaptation architecture, experimental implementation of the language&#xD;
model retraining cycle with processing and classification of different types of feedback, and quantitative&#xD;
evaluation of the results using automatic and user metrics were applied. The results of the study showed the&#xD;
effectiveness of the architecture of continuous online learning, which ensures the relevance and stability of the&#xD;
language model in real time. The study determined that implicit feedback is 4-10 times more common than&#xD;
explicit feedback, but explicit feedback gives a higher increase in the accuracy of answers. The proposed system&#xD;
successfully integrated different types of user signals, providing dynamic generation of training examples and&#xD;
hybrid relearning while maintaining the quality and consistency of the results. The Python software cycle for&#xD;
adaptive retraining of the language model involved processing and filtering user signals to form a high-quality&#xD;
buffer of training pairs. After 500 retraining steps on 52,912 query-response pairs, a significant improvement of&#xD;
the model was observed, which was confirmed by a decrease in the loss function from 3.82 to 3.15 and stability&#xD;
of the fine-tuning process without signs of overtraining. The results of the pre-training showed a moderate&#xD;
improvement in the quality of answers after adaptation: lexical similarity according to the Recall-Oriented&#xD;
Understudy for Gisting Evaluation was 0.102, accuracy according to the Bilingual Evaluation Understudy was&#xD;
0.006, and subjective user satisfaction increased to 0.24, while maintaining the stability of the model with an&#xD;
average cosine similarity value of 0.396. The approach proposed in this study improves the quality and relevance&#xD;
of real-time responses of language models while maintaining their stability and can be used in productive&#xD;
systems to improve user experience.; Інтенсивне зростання використання мовних моделей реального часу вимагає механізмів їх&#xD;
динамічної адаптації до змін у запитах, термінології та очікуваннях користувачів. Метою дослідження було&#xD;
вивчення підходів до перенавчання великих мовних моделей на основі безперервного зворотного зв’язку. Для&#xD;
досягнення цієї мети було застосовано теоретичне та структурно-функціональне моделювання архітектури&#xD;
адаптації, експериментальну реалізацію циклу перенавчання мовної моделі з обробкою та класифікацією&#xD;
різних типів зворотного зв’язку, а також кількісну оцінку результатів за допомогою автоматичних та&#xD;
користувацьких метрик. Результати дослідження показали ефективність архітектури безперервного онлайннавчання, яка забезпечує актуальність та стабільність мовної моделі в реальному часі. У дослідженні&#xD;
визначено, що неявний зворотний зв’язок зустрічається в 4-10 разів частіше, ніж явний зворотний зв’язок,&#xD;
але явний зворотний зв’язок дає вищий приріст точності відповідей. Запропонована система успішно&#xD;
інтегрує різні типи користувацьких сигналів, забезпечуючи динамічну генерацію навчальних прикладів та&#xD;
гібридне перенавчання, зберігаючи при цьому якість та узгодженість результатів. Програмний цикл Python&#xD;
для адаптивного перенавчання мовної моделі включав обробку та фільтрацію користувацьких сигналів&#xD;
для формування високоякісного буфера навчальних пар. Після 500 кроків перенавчання на 52 912 парах&#xD;
запит-відповідь спостерігалося значне покращення моделі, що підтверджувалося зменшенням функції&#xD;
втрат з 3,82 до 3,15 та стабільністю процесу точного налаштування без ознак перенавчання. Результати&#xD;
попереднього навчання показали помірне покращення якості відповідей після адаптації: лексична подібність&#xD;
за даними Recall-Oriented Understudy for Gisting Evaluation становила 0,102, точність за даними Bilingual&#xD;
Evaluation Understudy – 0,006, а суб’єктивна задоволеність користувачів зросла до 0,24, зберігаючи при цьому&#xD;
стабільність моделі із середнім значенням косинусної подібності 0,396. Підхід, запропонований у цьому&#xD;
дослідженні, покращує якість та релевантність відповідей мовних моделей у реальному часі, зберігаючи їх&#xD;
стабільність, і може бути використаний у продуктивних системах для покращення користувацького досвіду.</summary>
    <dc:date>2025-01-01T00:00:00Z</dc:date>
  </entry>
  <entry>
    <title>Study of the impact of different categorical feature encoding techniques on cluster structures</title>
    <link rel="alternate" href="https://er.chdtu.edu.ua/handle/ChSTU/9060" />
    <author>
      <name>Kondruk, Natalia</name>
    </author>
    <author>
      <name>Neroda, Inna</name>
    </author>
    <author>
      <name>Кондрук, Наталія</name>
    </author>
    <author>
      <name>Нерода, Інна</name>
    </author>
    <id>https://er.chdtu.edu.ua/handle/ChSTU/9060</id>
    <updated>2026-03-25T01:01:25Z</updated>
    <published>2025-01-01T00:00:00Z</published>
    <summary type="text">Title: Study of the impact of different categorical feature encoding techniques on cluster structures
Authors: Kondruk, Natalia; Neroda, Inna; Кондрук, Наталія; Нерода, Інна
Abstract: Categorical features are a common type of data used in data analysis, but their non-metric nature&#xD;
makes it difficult to apply standard clustering algorithms. The relevance of the study is conditioned by the&#xD;
need to assess the impact of different methods of recoding (digitisation) of such features on the effectiveness&#xD;
of cluster analysis. The purpose of the study was to investigate how different techniques of categorical data&#xD;
processing affect the quality and structure of clusters. The methodology included the implementation of three&#xD;
models with different approaches to variable coding: without taking into account domain specifics, considering&#xD;
the content of the features, and with alternating the order of application of clustering and dimensionality&#xD;
reduction approaches. LabelEncoder, OrdinalEncoder, One-Hot Encoding, Mapping, and MultiLabelBinarizer&#xD;
were used for coding. In each of the models, clustering was performed using two algorithms – K-Means and&#xD;
agglomerative clustering, which allowed comparison of their sensitivity to changes in data representation. The&#xD;
t-SNE dimensionality reduction method was used to visualise the cluster structure in two-dimensional space. The&#xD;
quality of clustering was evaluated using the Silhouette Score, Dunn Index, Davies-Bouldin Index, and CalinskiHarabasz Index metrics. The data for the analysis were obtained from an open source and contained information&#xD;
about the psycho-emotional state of students. The study found that the basic recoding of categorical features&#xD;
without considering their semantics and context negatively affected the quality of clustering, reducing the&#xD;
accuracy of the division and complicating the interpretation of the results. Instead, the use of domain-oriented&#xD;
coding approaches ensured the development of clusters with clearer boundaries and a more logical internal&#xD;
structure. In addition, it was found that changing the sequence of clustering and dimensionality reduction&#xD;
affects the preservation of local relationships in the data. It was analysed that different approaches change both&#xD;
the number and quality of clusters, which was reflected in the values of the evaluation metrics. The practical&#xD;
significance of the results lies in the possibility of their application by data analysts and machine learning&#xD;
specialists to improve the accuracy of segmentation of complex categorical data.; Категоріальні ознаки є поширеним типом даних, що використовуються у практиці аналізу даних, проте&#xD;
їх неметричний характер створює труднощі для застосування стандартних алгоритмів кластеризації. Актуальність&#xD;
дослідження зумовлена необхідністю оцінки впливу різних методів перекодування (оцифровування) таких&#xD;
ознак на результативність кластерного аналізу. Метою роботи було дослідити, як різні техніки обробки&#xD;
категоріальних даних впливають на якість та структуру кластерів. Методологія включала реалізацію трьох&#xD;
моделей з різними підходами до кодування змінних: без урахування доменної специфіки, з урахуванням&#xD;
змісту ознак та з чергуванням порядку застосування підходів кластеризації і зменшення розмірності. Для&#xD;
кодування використовувалися LabelEncoder, OrdinalEncoder, One-Hot Encoding, Mapping і MultiLabelBinarizer.&#xD;
У кожній із моделей кластеризація здійснювалася з використанням двох алгоритмів – K-Means та агломеративної&#xD;
кластеризації, що дозволяло порівняти їхню чутливість до змін у представленні даних. Метод зниження&#xD;
розмірності t-distributed Stochastic Neighbor Embedding (t-SNE) застосовувався для візуалізації кластерної&#xD;
структури у двовимірному просторі. Якість кластеризації оцінювалася за допомогою метрик Silhouette Score,&#xD;
Dunn Index, Davies-Bouldin Index та Calinski-Harabasz Index. Дані для аналізу було отримано з відкритого&#xD;
джерела й вони містили інформацію про психоемоційний стан студентів. У ході дослідження було встановлено,&#xD;
що базове перекодування категоріальних ознак без урахування їхньої семантики та контексту негативно&#xD;
впливало на якість кластеризації, знижуючи точність поділу та ускладнюючи інтерпретацію результатів.&#xD;
Натомість використання доменно-орієнтованих підходів до кодування забезпечувало формування кластерів&#xD;
із чіткішими межами та логічнішою внутрішньою структурою. Додатково було виявлено, що зміна послідовності&#xD;
застосування кластеризації та редукції розмірності позначається на збереженні локальних взаємозв’язків у&#xD;
даних. Проаналізовано, що різні підходи змінюють як кількість, так і якість кластерів, що відображається у&#xD;
значеннях оцінкових метрик. Практична цінність результатів полягає у можливості їх застосування фахівцями&#xD;
з аналізу даних та машинного навчання для підвищення точності сегментації складних категоріальних даних.</summary>
    <dc:date>2025-01-01T00:00:00Z</dc:date>
  </entry>
  <entry>
    <title>Adaptive similarity assessment metric for intelligent failure diagnostics in ship power plants</title>
    <link rel="alternate" href="https://er.chdtu.edu.ua/handle/ChSTU/9059" />
    <author>
      <name>Vychuzhanin, Vladimir</name>
    </author>
    <author>
      <name>Vychuzhanin, Alexey</name>
    </author>
    <author>
      <name>Вичужанін, Володимир</name>
    </author>
    <author>
      <name>Вичужанін, Олексій</name>
    </author>
    <id>https://er.chdtu.edu.ua/handle/ChSTU/9059</id>
    <updated>2026-03-25T01:01:04Z</updated>
    <published>2025-01-01T00:00:00Z</published>
    <summary type="text">Title: Adaptive similarity assessment metric for intelligent failure diagnostics in ship power plants
Authors: Vychuzhanin, Vladimir; Vychuzhanin, Alexey; Вичужанін, Володимир; Вичужанін, Олексій
Abstract: Prompt and accurate diagnosis of failures in ship power plants (SPPs) is essential for ensuring maritime&#xD;
safety, minimising operational risks, and optimising maintenance strategies. With increasing system complexity,&#xD;
heterogeneous data sources, and limited historical failure records, conventional diagnostic methods often prove&#xD;
insufficient, especially in scenarios involving rare or ambiguous faults. The purpose of this study was to develop&#xD;
an interpretable, adaptive, and probabilistically grounded methodology for assessing similarity between failure&#xD;
cases within SPPs for use in intelligent decision support systems. The proposed method integrates Euclidean,&#xD;
Jaccard, and logistic similarity metrics with Bayesian inference, temporal degradation modelling, frequency-based&#xD;
weight correction, and contextual smoothing of affected subsystems. The model employs L-BFGS-B optimisation to&#xD;
automatically adjust metric weights according to diagnostic relevance. Numerical experiments based on synthetic&#xD;
case data revealed high classification accuracy: 96% for failures related to cooling system overheating, 84% for&#xD;
bearing degradation cases, and 92% for fuel supply irregularities. Even with a 40% reduction in training data&#xD;
volume, the performance drop did not exceed 7%, indicating strong resilience to data sparsity. The visualisation of&#xD;
decision boundaries demonstrated the model’s ability to distinguish overlapping failure classes while preserving&#xD;
semantic interpretability. Weight optimisation results identified “failure type” as the dominant factor, while “risk&#xD;
category” and “affected subsystems” had negligible impact and were excluded. Bayesian aggregation further&#xD;
improved the credibility of diagnostic conclusions by combining local similarity with global statistical priors.&#xD;
The developed methodology can be effectively applied by marine engineers, ship operators, and developers&#xD;
of intelligent diagnostic platforms for fault detection, root cause analysis, and predictive maintenance under&#xD;
conditions of uncertainty and incomplete information. Its modular structure also allows extending it to other&#xD;
complex technical domains beyond SPPs.; Своєчасна та точна діагностика несправностей в суднових енергетичних установках (СЕУ) є&#xD;
надзвичайно важливою для забезпечення безпеки на морі, мінімізації експлуатаційних ризиків та оптимізації&#xD;
стратегій технічного обслуговування. Зі збільшенням складності систем, гетерогенності джерел даних&#xD;
та обмеженості історичних записів про несправності традиційні методи діагностики часто виявляються&#xD;
недостатніми, особливо в ситуаціях, пов’язаних з рідкісними або неоднозначними несправностями. Метою&#xD;
цього дослідження була розробка інтерпретованої, адаптивної та ймовірнісно обґрунтованої методології&#xD;
для оцінки схожості випадків несправностей у СЕУ для використання в інтелектуальних системах підтримки&#xD;
прийняття рішень. Запропонований метод інтегрує евклідову, джакардову та логістичну метрики схожості&#xD;
з байєсівським виведенням, моделюванням тимчасової деградації, корекцією ваги на основі частоти та&#xD;
контекстним згладжуванням уражених підсистем. Модель використовує оптимізацію L-BFGS-B для автоматичного&#xD;
коригування ваги метрик відповідно до діагностичної релевантності. Чисельні експерименти на основі&#xD;
синтетичних даних випадків показали високу точність класифікації: 96 % для відмов, пов’язаних з перегрівом&#xD;
системи охолодження, 84 % для випадків деградації підшипників і 92 % для порушень у подачі палива. Навіть&#xD;
при 40 % скороченні обсягу навчальних даних падіння продуктивності не перевищило 7 %, що свідчить про&#xD;
високу стійкість до розрідженості даних. Візуалізація меж прийняття рішень продемонструвала здатність моделі&#xD;
розрізняти перекривні класи відмов, зберігаючи семантичну інтерпретованість. Результати оптимізації ваги&#xD;
визначили «Тип відмови» як домінуючий фактор, тоді як «Категорія ризику» та «Уражені підсистеми» мали&#xD;
незначний вплив і були виключені. Байєсівське агрегування ще більше підвищило надійність діагностичних&#xD;
висновків, поєднавши локальну схожість із глобальними статистичними апріорними даними. Розроблена&#xD;
методологія може бути ефективно застосована морськими інженерами, операторами суден та розробниками&#xD;
інтелектуальних діагностичних платформ для виявлення несправностей, аналізу першопричин та прогнозного&#xD;
технічного обслуговування в умовах невизначеності та неповної інформації. Її модульна структура також&#xD;
дозволяє розширити її застосування на інші складні технічні галузі, крім СЕУ.</summary>
    <dc:date>2025-01-01T00:00:00Z</dc:date>
  </entry>
</feed>

