Please use this identifier to cite or link to this item:
https://er.chdtu.edu.ua/handle/ChSTU/5868| Title: | Automation of error detection in code using machine learning |
| Other Titles: | Автоматизація виявлення помилок у коді за допомогою машинного навчання |
| Authors: | Sokol, Olena Сокол, Олена |
| Keywords: | decision trees;sequence analysis;anomaly detection;generative transformers;clustering and classification algorithms;neural network applications;дерева рішень;аналіз послідовностей;пошук аномалій;генеративні трансформери;алгоритми кластеризації та класифікації;використання нейронних мереж |
| Issue Date: | 2025 |
| Publisher: | Вісник Черкаського державного технологічного університету |
| Abstract: | The objective of this study was to develop approaches for the automated detection of coding errors
through machine learning algorithms. The research examined five primary approaches: classification using decision
trees, sequence analysis with recurrent neural networks, anomaly detection through clustering algorithms, a
generative approach with transformers, and deep learning using convolutional neural networks. Each approach
was evaluated on a five-point scale based on a systematic analysis of advantages and disadvantages, considering
performance metrics. The results included examples of the implementation of these approaches, an analysis
of their strengths and weaknesses, and assessments of their effectiveness. Transformers demonstrated high
accuracy in complex cases, effectively processing large volumes of data and identifying errors in intricate code
structures. This approach received a rating of 5 due to its high accuracy and efficiency in handling large and
complex datasets. Decision tree algorithms, despite their speed and simplicity, had limited effectiveness in largescale tasks, particularly for complex software structures. Meanwhile, clustering algorithms proved versatile in
anomaly detection, though their accuracy depended on the correct selection of clustering parameters. These
algorithms received a rating of 3 due to their limited effectiveness in complex tasks and scalability issues. The
approach based on recurrent neural networks showed good results in sequence analysis but was sensitive to
long sequences and the vanishing gradient effect, which reduced its accuracy. Convolutional neural networks
efficiently handled visual representations of code but had limited capability in considering sequence context.
Neural network-based approaches received a rating of 4, as they are effective in specific tasks but have limitations
related to resource consumption and contextual analysis. Thus, the results confirmed that for automated error
detection in large and complex programs, the most effective approach is the use of generative models, such as
transformers, which can process substantial data volumes with high accuracy. Мета роботи полягала в розробці підходів до автоматизованого виявлення помилок у коді шляхом використання алгоритмів машинного навчання (ML). У дослідженні розглянуто п’ять основних підходів: класифікація за допомогою дерев рішень, аналіз послідовностей з використанням рекурентних нейронних мереж, пошук аномалій через алгоритми кластеризації, генеративний підхід з трансформерами та глибоке навчання з використанням згорткових нейронних мереж. Для кожного підходу проведено оцінювання за п’ятибальною шкалою, яке базувалося на систематичному вивченні переваг і недоліків, з урахуванням показників виконання. Результати включають приклади реалізацій цих підходів, аналіз переваг та недоліків, а також оцінки їх ефективності. Трансформери продемонстрували високу точність у складних випадках, ефективно обробляючи великі обсяги даних і виявляючи помилки в складних структурах коду. Цей підхід отримав оцінку 5 балів завдяки своїй здатності до високої точності та ефективності в роботі з великими і складними даними. Алгоритми дерев рішень, незважаючи на свою швидкість і простоту, мали обмежену ефективність у масштабних задачах, особливо для складних програмних структур. В той же час, алгоритми кластеризації показали свою універсальність у виявленні аномалій, однак їх точність залежала від правильності вибору параметрів кластеризації. Ці алгоритми отримали оцінки 3 бали через обмежену ефективність у складних задачах та проблеми з масштабованістю. В свою чергу, підхід на основі рекурентних нейронних мереж продемонстрував хороші результати при аналізі послідовностей, але був чутливий до довгих послідовностей та ефекту зникання градієнта, що знижувало його точність. Згорткові нейронні мережі ефективно працювали з візуальними репрезентаціями коду, але мали обмежену здатність до врахування контексту послідовностей. Підходи на основі нейронних мереж отримали оцінки 4 бали, оскільки ефективні в специфічних задачах, але мають обмеження, пов’язані з ресурсами та контекстуальним аналізом. Таким чином, результати підтвердили, що для автоматизованого виявлення помилок у великих і складних програмах найбільш ефективним є використання генеративних моделей, таких як трансформери, що здатні обробляти значні обсяги даних з високою точністю. |
| URI: | https://er.chdtu.edu.ua/handle/ChSTU/5868 |
| ISSN: | 2306-4412 (print) 2708-6070 (online) |
| DOI: | https://doi.org/10.62660/bcstu/1.2025.35 |
| Volume: | 30 |
| Issue: | 1 |
| First Page: | 35 |
| End Page: | 47 |
| Appears in Collections: | том 30, №1/2025 |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| титул.pdf | 269.53 kB | Adobe PDF | ![]() View/Open | |
| зміст.pdf | 123.86 kB | Adobe PDF | ![]() View/Open | |
| 5.pdf | 3.91 MB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.


