Please use this identifier to cite or link to this item:
https://er.chdtu.edu.ua/handle/ChSTU/8249| Title: | Розробка системи виявлення та відстеження об'єктів на платформі Raspberry Pi |
| Authors: | Філіпов, Віталій Вікторович Прудкий, Владислав Вікторович |
| Keywords: | платформа Raspberry Pi;cистема комп'ютерного зору;compoter vision;інтернет речей;мережа |
| Issue Date: | 2023 |
| Abstract: | В даній роботі розроблено виявлення та відстеження об'єктів на платформі Raspberry Pi. Перевагою системи є можливість її масштабування, модернізації та контролю через Інтернет. Запропонована розробка здатна вирішити актуальні проблеми, адже може використовуватися в сфері БПЛА та поніторингу |
| URI: | https://er.chdtu.edu.ua/handle/ChSTU/8249 |
| Appears in Collections: | 172 Електронні комунікації та радіотехніка (Телекомунікації) |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Б_172_Прудкий_Філіпов.pdf Restricted Access | 2.51 MB | Adobe PDF | View/Open Request a copy |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
Extracted text
Форма № Н-9.02
ЧЕРКАСЬКИЙ ДЕРЖАВНИЙ ТЕХНОЛОГІЧНИЙ УНІВЕРСИТЕТ
(повне найменування вищого навчального закладу)
факультет електронних технологій і робототехніки
(назва факультету)
кафедра робототехнічних і телекомунікаційних систем та кібербезпеки
(повна назва кафедри)
До захисту допущенко
Завідувач кафедри
д.т.н., професор _________ В.В. Палагін
«___» __________________ 2023 року
Пояснювальна записка
до кваліфікаційної роботи
освітнього ступеня
бакалавр
(освітній рівень)
на тему: “ Розробка системи виявлення та відстеження об'єктів на
платформі Raspberry Pi ”
Виконав: студент 4 курсу, групи СКТК-18
Спеціальність – 172 «Телекомунікації та
радіотехніка»
Освітня програма – «Телекомунікації»
Прудкий В.В.
(прізвище та ініціали)
Керівник Філіпов В.В.
(прізвище та ініціали)
Рецензент
(прізвище та ініціали)
Черкаси – 2023 року
Форма № Н-9.01
ЧЕРКАСЬКИЙ ДЕРЖАВНИЙ ТЕХНОЛОГІЧНИЙ УНІВЕРСИТЕТ
Факультет електронних технологій і робототехніки
Кафедра радіотехніки, телекомунікаційних і робототехнічних систем
Освітній рівень бакалавр
Спеціальність 172 Телекомунікації та радіотехніка
(шифр і назва)
Освітня програма: «Телекомунікації»
(шифр і назва)
ЗАТВЕРДЖУЮ
Завідувач кафедри В.В. Палагін
“_____” ___________________ 2023 року
З А В Д А Н Н Я
НА ДИПЛОМНИЙ ПРОЕКТ (РОБОТУ) СТУДЕНТУ
Прудкому Владиславу Вікторович
(прізвище, ім’я, по батькові)
1. Тема проекту (роботи) Розробка системи виявлення та відстеження об'єктів
на платформі Raspberry Pi
керівник проекту (роботи) Філіпов Віталій Вікторович, к.т.н.
(прізвище, ім’я, по батькові, науковий ступінь, вчене звання)
затверджені наказом вищого навчального закладу від “28” лютого 2023 року № 45/04
2. Строк подання студентом проекту: 12.06.2023 р.
3. Вихідні дані до проекту (роботи) Rasspberry Pi, Python, OpenCV,
система відстеження об'єктів на платформі Raspberry Pi.
4. Зміст розрахунково-пояснювальної записки (перелік питань, які потрібно
розробити) Загальні відомості системи комп’ютерного зору, їх структура..
Платформа Raspberry Pi для реалізації системи комп’ютерного зору.
Реалізація системи відстеження об'єктів. Висновок.
5. Перелік графічного матеріалу (з точним зазначенням обов’язкових креслень,
плакатів) Піксельна діаграма даних. Масив значень пікселів. Процес зберігання
пікселів в пам’яті. Зберігання кольорового зображення. Традиційна система
комп’ютерного зору. Загальна архітектура системи «computer vision».
Архітектура системи «розпізнавання облич». Завдання комп’ютерного зору.
Вейвлет Хаара. Інтегральне значення пікселя. Сумування «слабких»
класифікаторів. Послідовність фільтрів. ASM. Угасання стабілізованих
образів. Етапи Face Recognition. Структурна схема проекту. Встановлення
бібліотеки OpenCV. Interfacing Options, VNC – enable, VNC – client, Raspbian
PIXEL, інсталяція ПЗ motion, відеопотік.
.VNC
6. Консультанти розділів проекту (роботи)
Підпис, дата
Прізвище, ініціали та посада
Розділ завдання завдання
консультанта
видав прийняв
7. Дата видачі завдання 15.01.2023 р.
КАЛЕНДАРНИЙ ПЛАН
№ Назва етапів дипломного Строк виконання Примітка
з/п проекту (роботи) етапів проекту
(роботи)
Інформаційно-технічний пошук та 20.02.23–
1.
огляд літератури 15.03.23
Загальні відомості про системи
комп’ютерного зору. Структура, 16.03.23 –
2.
інструменти для реалізації, задачі, що 30.03.23
виконує комп’ютерний зір.
Аналіз методів реалізації системи 01.04.23 –
3.
комп’ютерного зору. 07.04.23
Платформа Raspberry Pi для реалізації 12.04.23 –
4.
системи комп’ютерного зору. 20.04.24
Реалізація системи Face recognition на 21.04.23–
5.
платформі Raspberry Pi. 30.04.23
6. Оформлення пояснювальної записки 30.04.23 –
10.05.23
Оформлення графічного матеріалу 25.05.23 –
7.
10.06.23
Студент Прудкий В.В.
( підпис ) (прізвище та ініціали)
Керівник проекту (роботи) Філіпов В.В.
( підпис ) (прізвище та ініціали)
ЗМІСТ
ВСТУП ..................................................................................................................... 5
РОЗДІЛ 1. ПАТЕНТНИЙ ПОШУК ТА ОГЛЯД НАЯВНИХ РІШЕНЬ. ............. 7
1.1 Штучні нейронні мережі (ШНМ). ................................................................ 7
1.2 Типи нейронних мереж для роботи із зображеннями. ............................. 14
1.3 Згорткові нейронні мережі .......................................................................... 15
1.4 Принцип згортки зображень. ...................................................................... 27
РОЗДІЛ 2. АЛГОРИТМИ РОЗПІЗНАВАННЯ ОБРАЗІВ ДЛЯ СИСТЕМИ
ВИЯВЛЕННЯ ТА ВІДСТЕЖЕННЯ ОБ'ЄКТІВ .................................................. 29
2.1 Етапи розпізнавання образів ....................................................................... 29
2.2 Метод Віоли-Джонса ................................................................................... 33
РОЗДІЛ 3. РОЗРОБКА ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ТА
НАЛАШТУВАННЯ RASPBERRY PI .................................................................. 39
3.1 Встановлення середовища розробки Microsoft Visual Studio ..................... 39
3.2 Встановлення бібліотеки OpenCV ................................................................. 40
3.3 Створення програмного забезпечення .......................................................... 42
3.4 Запуск програми на Raspberry Pi ................................................................... 45
3.5 Перевірка працездатності системи ................................................................ 46
РОЗДІЛ 4. Охорона праці ..................................................................................... 48
4.1 Аналіз небезпек та шкідливостей, які виникають під час проведення робіт
в приміщенні лабораторії ..................................................................................... 48
4.2 Способи і засоби захисту працівників лабораторії від ураження
електричним струмом ........................................................................................... 53
СКТК18.023083.248 ПЗ
Змн. Арк. № докум. Підпис Дата
Розроб. Прудкий В.В. Розробка системи виявлення Літ. Арк. Акрушів
Перевір. Філіпов В.В. 3 67
та відстеження об'єктів на
Реценз. платформі Raspberry Pi.
Н. Кон тр. Філіпов В.В. ЧДТУ 2023
Пояснювальна записка
Затверд.
ВИСНОВОК ........................................................................................................... 65
СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ ....................................................... 66
ДОДАТКИ .............................................................................................................. 68
Арк.
СКТК18.023083.248 ПЗ
4
Змн. Арк. № докум. Підпис Дата
ВСТУП
Розпізнавання різних речей на зображення останнім часом стало дуже
актуально. Пошук за зображенням, пошук схожих зображень, визначення
об'єктів. Проте найцікавішою сферою стало розпізнавання об’єктів, яке
поширюється повсюдно, починаючи з розваг, закінчуючи системами безпеки.
Прикладом першого є додаток Snapchat, де використовуються маски для
редагування фото. На приклад другого можна навести китайську систему
«Скайнет», яка аналізує камери спостереження, встановлені містом, і
допомагає знайти злочинця [1].
У будь-якому випадку завдання з виявлення об’єктів та відстеження
об’єктів складається з кількох етапів. Перший етап – детектування, він полягає
у пошуку області на зображенні. Другим етапом є екстракція ознак, тобто
перетворення вхідних даних з детектованої області вектора вихідних ознак.
Далі йде селекція ознак або редукція простору ознак. Останнім етапом
виконується порівняння отриманих ознак із базою даних еталонних ознак та
визначення класу об'єкта, якщо є. Як клас у цьому випадку виступає
особистість об’єкта [2].
Обробку даних можуть ускладнювати небажані фактори, такі як шуми,
погане освітлення та інші. Слід також зауважити, що ці фактори можуть бути
мінливими, що призводить до складності складання математичної моделі для
обчислень. Незважаючи на те, що нам відома структура об’єктів, розташування
основних елементів може структура об’єкту може змінюватися, наприклад,
колір або форма, що у свою чергу призводить до різноманітних
невизначеностей на етапі обробки [3]. З цієї причини ідентифікація потребує
досить якісного алгоритму обробки даних.
Великий внесок зробило використання нейронних мереж та машинного
навчання для виявлення та відстеження об’єктів. Машинне навчання виконує
Арк.
СКТК18.023083.248 ПЗ
5
Змн. Арк. № докум. Підпис Дата
розпізнавання за допомогою нематематичних методик, тобто вміння обробляти
дані щодо абстрактних правил чи побудова нових правил [4].
На основі всього вищесказаного можна зробити висновок про
актуальність дослідження методів та алгоритмів виявлення та відстеження
об’єктів. Основною метою даної дипломної роботи є розробка програмно–
апаратного комплексу для виявлення відстеження та розпізнавання об’єктів.
Арк.
СКТК18.023083.248 ПЗ
6
Змн. Арк. № докум. Підпис Дата
РОЗДІЛ 1. ПАТЕНТНИЙ ПОШУК ТА ОГЛЯД НАЯВНИХ РІШЕНЬ.
Розробка системи виявлення та відстеження об'єктів на платформі
Raspberry Pi, не можлива без застосування нейронних мереж, так як всі існуючі
принципи побудови таких систем побудовані на принципі машинного
навчання, які базуються на застосуванні нейронних мереж. Тому у даному
розділі розглянемо теоретичні основи принципів роботи та методів навчання
штучних нейронних мереж, також розглянемо існуючі типи нейронних мереж
та наведено більш докладний опис згорткових нейронних мереж, які
використовуються у вирішенні поставлених у завдань роботі.
1.1 Штучні нейронні мережі (ШНМ).
Перша модель нейронної мережі була створена в 1943 році двома
вченими Уолтером Піттсом (Walter Pitts) і Уорреном Мак-Каллоком (Warren
McCulloch), які досліджували передачу даних та сигналів усередині мозку за
допомогою нейронів. На основі цих досліджень була побудована перша проста
машина, яка обчислює результат логічних та арифметичних дій [5]. У машині
були перемикачі, що імітували роботу біологічних нейронів - клітин, які
отримують, обробляють та передають інформацію через електричні сигнали.
Арк.
СКТК18.023083.248 ПЗ
7
Змн. Арк. № докум. Підпис Дата
Рис. 1.1 – Структура біологічного нейрона.
Оскільки штучний нейрон - це математична модель біологічного
нейрона, він має схожі з ним функції:
а) Прийом інформації з кількох входів;
б) Підсумовування всіх сигналів та їх обробка;
в) Передача результату на вихід.
Уявити штучний нейрон можна як моделі, зображеної рис.1.2.
Арк.
СКТК18.023083.248 ПЗ
8
Змн. Арк. № докум. Підпис Дата
Рис. 1.2 - Схема штучного нейрона.
де:
а – вхідні нейрони, сигнали яких йдуть на вхід суматора;
б – суматор вхідних сигналів;
в - обчислювач передавальної функції;
г - нейрони, на входи яких подається вихідний сигнал.
Нейрон починає обробку отриманих сигналів відразу після надходження
на вхід [6]. Математична модель нейрона має нелінійну функцію активації,
представлену у формулі (1.1), в якій аргументом виступає сума всіх вхідних
сигналів:
де: х – вхідні значення;
а – вагові коефіцієнти.
Функція активації характеризує залежність вихідного сигналу суми
вхідних сигналів. Найімовірніше, що значення функції перебувають у межах
Арк.
СКТК18.023083.248 ПЗ
Змн. 9
Арк. № докум. Підпис Дата
[-1,1], якщо це гіперболічний тангенс, або [0,1] для сигмоїду. Важливим є
монотонне зростання функції з огляду на те, що деякі алгоритми, що
використовуються в машинному навчанні, вимагають безперервно
диференційовану функцію для всієї числової осі.
У 1957 році Френком Розенблатом (Frank Rosenblatt) був розроблений
перцептрон, модель штучного нейрона, вихід якого набуває лише значення 0
або 1. Однак основною відмінністю від попередніх моделей була наявність так
званих ваг - чисельних значень, що характеризують важливість кожного з
входів та відповідних їм значень . Крім того, виважена сума всіх входів
порівнювалася з пороговим значенням (threshold), від результату порівняння
залежало значення на виході. Система рівнянь, що описує модель перцептрону
представлена у формулі (1.2):
Рис. 1.3 – Графік функції активації перцептрону.
Нейронні мережі, що базуються на перцептронах, складно навчати.
Зважаючи на те, що вихід бінарний, то навіть невелика зміна одного з входів,
якщо мережа досить велика, може призвести до різких та непередбачуваних
змін на виході. Таку мережу складно аналізувати. Однак перцептрони є базою
Арк.
СКТК18.023083.248 ПЗ
10
Змн. Арк. № докум. Підпис Дата
для нейронів інших типів, функція активації яких має більш плавний графік
зміни стану [4].
За типом функції активації виділяють такі типи нейронів:
а) Одиничний стрибок (частковий випадок перцептрону), формула (1.3):
(1.3)
б) Сігмоїд, формула (1.4):
(1.4)
в) Гіперболічний тангенс, формула (1.5):
. (1.5)
У кожній формулі а – кут нахилу графіка функції. Сігмоїд являє собою
розвинений перцептрон. Вихід перцептрону змінюється не стрибком, а
поступово, з кутом нахилу а. Графік сигмоїда представлений малюнку 1.4.
Рис. 1.4 – Графік функції сигмоїду.
Арк.
СКТК18.023083.248 ПЗ
Змн. 11
Арк. № докум. Підпис Дата
Однак найбільш поширений нейрон, графік якого гіперболічний тангенс,
так як він захоплює негативні значення в діапазон [-1;1], що найбільш зручно
для обробки. Самостійно нейрон виконується лише одну функцію. Але для
вирішення складних логічних, математичних чи інших дій необхідно об'єднати
нейрони у мережу. Виділяють три типи нейронів, які мають однакову
структуру, але різне призначення:
а) вхідні – необхідні введення сигналу у мережу, мають єдиний вхід;
б) вихідні – можуть мати необмежену кінцеву кількість входів та один
вихід, розташований на периферії мережі та вивідний результат обчислень на
вихід;
в) приховані – знаходяться у внутрішніх шарах нейронної мережі. Вони
приймають сигнал, обробляють його та передають далі по мережі;
г) нейрони усунення – дозволяють змістити графік функції по осі Х,
єдині нейрони, спрямовані назад, у попередній шар, і не мають вагового
коефіцієнта.
На малюнку 1.5 представлена структура найпростішої нейронної мережі.
На малюнку позначені Ik - вхідні нейрони, Hi - приховані, і вихідний нейрон -
O.
Рис. 1.5 – Структура нейронної мережі.
Арк.
СКТК18.023083.248 ПЗ
12
Змн. Арк. № докум. Підпис Дата
На малюнку 1.5 є 2 вхідні нейрони, сигнали з яких надходять у
прихований шар. Дана мережа є мережею прямого поширення, оскільки
сигнал проходить від початку до кінця. Подібні мережі використовуються
завдання класифікації. Слід зазначити, що нейрони усунення допустимо не
відзначати у схемі, але їх потрібно враховувати при обчисленні.
Таким чином, для деякої мережі з n шарами, з урахуванням вхідних і
вихідних нейронів, з вагами W(1) та функцією активації A(m) для кожного з
шарів, і нейронами усунення b(1) ітераційна формула матиме вигляд формули
(1.6):
де:
ƒ-активаційна функція;
(W, b) – параметри мережі.
Арк.
СКТК18.023083.248 ПЗ
13
Змн. Арк. № докум. Підпис Дата
1.2 Типи нейронних мереж для роботи із зображеннями.
З усього різноманіття нейронних мереж, можна окремо виділити ті,
основним завданням яких є обробка зображень. Найчастіше використовувані з
них:
а) згорткові нейронні мережі (convolutional neural networks, CNN) -
спрямовані на завдання пошуку та класифікації образів на зображенні;
б) розгортаючі нейронні мережі (deconvolutional networks, DN) -
застосовуються при генерації зображень за вихідними даними або зображень
із загальним класифікатором;
в) глибинні згорткові зворотні графічні мережі (deep convolutional inverse
graphics networks, DCIGN) – спрямовані для створення зображень, що мають
кілька класифікаторів, на базі тренувальної вибірки графічних даних для всіх
класифікаторів зокрема. Може працювати як у прямому, так і зворотному
напрямках;
г) глибинна згорткова нейронна мережа (deep convolutional neural)
networks, DCNN) – є згортковою нейронною мережею, що має на виході
мережу прямого поширення. Основним завданням є пошук образу та його
класифікація. На основі даних типів нейронних мереж для виконання даної
роботи та досягнення поставленого завдання найбільш підходящими є
згорткові та глибинні згорткові нейронні мережі.
Арк.
СКТК18.023083.248 ПЗ
14
Змн. Арк. № докум. Підпис Дата
1.3 Згорткові нейронні мережі
Далі будуть розглянуті структури, властивості та гіперпараметри
згорткових нейронних мереж. Спеціалізація згорткових нейронних мереж
вказує на основні вимоги до їхньої архітектури. У зображеннях входом є кожен
піксель, для кожного з яких відповідно необхідна своя вага. зображенню
розміром 100х100 пікселів із трьома каналами кольору необхідно 100 * 100 * 3
= 30 000 ваги на прихованому рівні. Зі збільшенням розміру кількість ваги
збільшується в рази, що означає ускладнення навчання. Навчання таких мереж
є недоцільним та складним.
Як було зазначено вище для зображення вхідним сигналом є безліч
пікселів, отриманих із пристрою, що реєструє відео. Сучасні системи
реєстрації відео є цифровою відеокамерою. Яка являє собою блок обробки та
зберігання інформації. Тобто, як показано на рис. 1.7, це ланцюг з об'єктиву,
цифрової матриці, підсилювача, аналого-цифрового перетворювача, процесора
та пристрої зберігання інформації.
Єдина особливість полягає лише в тому, що відео це функція циклічного
запису зображень. Ця особливість полягає в тому, що кожен наступний кадр
починає записуватися поверх старого, автоматично стираючи останній.
Головна відмінність цифрової камери полягає в тому, що відео інформація,
зібрана на світлочутливому елементі, перетворюється з аналогової форми в
цифрову, і згодом система вже працює з цифровим сигналом, тобто з набором
нулів та одиниць. Основним завданням для збору відеоінформації є
перетворення світла в електричний сигнал.
Також потрібно зробити це так, щоб потім можна було відтворити цю
інформацію, відновити зображення з набіру цифрових сигналів. Як видно із
схеми рис 1.7, першим елементом камери є об'єктив. Це комплекс лінз та
діафрагм, який дозволяє пропорційно змінити розміри реального зображення,
щоб кожна його частина рівномірно лягла на матрицю відеокамери. Також
Арк.
СКТК18.023083.248 ПЗ
15
Змн. Арк. № докум. Підпис Дата
об'єктив частково визначає кут огляду камери. На рис 1.8 представлений
об'єктив камери.
Рис. 1.7 – Принцип роботи цифрового запису зображень.
Рис. 1.8 – Об'єктив камери.
Потім потоки світла, що проходять через об'єктив, падають на матрицю.
При цьому зазвичай на кожен піксель падає різна кількість світла, отже, у
кожному пікселі накопичується різна кількість заряду, який згодом
Арк.
СКТК18.023083.248 ПЗ
16
Змн. Арк. № докум. Підпис Дата
посилюється, з аналогової форми перетворюється на цифрову за допомогою
аналогово-цифрового перетворювача. Після АЦП виходить цифровий сигнал,
який надходить у процесор, де він обробляється компресується та надходить у
пам'ять для зберігання та подальшої обробки.
Один із способів для перетворення світла в сигнал заснований на ефекті
під назвою фотоефект. Суть цього способу полягає в тому, що при падінні
світлового потоку на фотодіод або якийсь інший фотоелемент, виникає
електричний струм, який також називають фотострумом. Тобто, при спуску
затвора, мільйони крихітних осередків фоточутливого елемента
висвітлюються певною кількістю світла, і перетворюють, це світло в
фотострум незалежно від кольору падаючого світла, так як більшість
фотоелементів не сприймають кольоровість, а сприймають лише яскравість.
Також слід зазначити, що сила струму залежатиме лише від інтенсивності
падаючого світлового потоку. Отже, що яскравіше світло, то буде більший
струм.
Для того щоб отримати з даного світлового потоку кольорове зображення
використовується процес, який називається кольоровою інтерполяцією.
Принцип дії цього процесу полягає у тому, що програмне забезпечення
цифрової камери аналізує отриману інформацію з сусідніх осередків, і за
складним алгоритмом розраховує кольоровість кожного осередку. Цей процес
є дуже важливим у отриманні підсумкової картинки, оскільки він однаково з
якістю світлочутливих елементів впливає на якість.
Виходячи з того, що інтенсивність падаючого світла та величина
фотоструму пов'язані прямо пропорційно, між ними є строга математична
залежність. І на основі цього перетворення заснований принцип дії багатьох
фоточутливих елементів.
Однак існують різні технології виготовлення світлочутливих сенсорів та
залежно від технології вони по-різному здійснюють завдання накопичення та
зберігання фотоелектронів. Існують дві основні технології перетворення
Арк.
СКТК18.023083.248 ПЗ
Змн. 17
Арк. № докум. Підпис Дата
світла в сигнал. Прилади із зарядовим зв'язком, як правило, є дуже якісними.
Це пов'язано з тим, що вони мало схильні до внутрішніх шумів, так як
використовують процес зарядового зв'язку та передає тільки електричний
заряд. Сам процес зарядового зв'язку менше схильний до шумів інших
електронних компонентів і має низький опір. Як наслідок, вихідний сигнал з
приладу із зарядовим зв'язком (ПЗЗ), має менший шум порівняно з КМОП
датчиком. Однак недолік цієї технології полягає в тому, що при передачі заряду
між зарядовим колодязем і виходом датчика втрачається частина електронів,
передача заряду не на 100% є ефективною.
Будова ПЗЗ-датчика є легованим напівпровідником. р-типу, тонкий шар
напівпровідника n-типу, тонкий шар діелектрика, та електрод із
полікристалічного кремнію, який виконує функцію затвора. В якості
легованого напівпровідника використовується кремній р-типу. Легування – це
процес додавання до чистого напівпровідника атомів. домішки, за рахунок
яких підвищується кількість дірок, і, отже, їх стає надміру. Відповідно, тому
що в напівпровіднику р-типу основним носієм заряду є дірки, то при подачі на
затвор (електрод) позитивного потенціалу, всі дірки почнуть відштовхуватися
від нього, під дією електричного поля, яке проникає в напівпровідник через
діелектричний ізолятор. Чим сильніше подати напругу на затвор, тим сильніше
відштовхуватимуться дірки від нього, отже збільшиться збіднена область
(область, де носії заряду відсутні). Як правило, основним носієм інформації є
фотоелектрони, отже вони накопичуються в освіченій збідненій області, та
несуть інформацію про яскравості цього пікселя. Чим більше фотоелектронів
накопичилося, тим вище яскравість цього пікселя.
Наочно принципова будова ПЗЗ-датчика показано рис. 1.9.
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. 18
№ докум. Підпис Дата
Рис. 1.9 – Структура ПЗЗ-матриці.
Сам процес протікання електронів відбувається за рахунок зміни
потенціалу на сусідніх затворах. Наприклад, якщо на сусідньому затворі
потенціал вищий, то, отже, і потенційна яма (збіднена область) там буде
глибше, отже, фотоелектрони (носії інформації) перетікають туди, і так далі до
підсилювача.
Тонкий шар напівпровідника n-типу служить для того, щоб частково
позбутися впливу внутрішніх дефектів, отже, через його використання
підвищується чіткість одержуваного зображення. Також його використання
знижує величину темного струму, який протікає по світлочутливому елементу,
при відсутності падаючих фотонів.
Наступний тип датчика – це КМОП-датчики. Варто зазначити, що даний
тип датчика побудований за однойменною КМОП-технологією, а дана
технологія широко застосовується для створення різних мікросхем для
цифрових приладів. Звідси можна зробити висновок, що одним з переваг
Арк.
СКТК18.023083.248 ПЗ
19
Змн. Арк. № докум. Підпис Дата
даного датчика буде нижча ціна, ніж на ПЗЗ датчики, для виробництва яких у
свою чергу необхідна дорога виробнича база та спеціалізовані технологічні
процеси.
Принципова відмінність КМОП-датчика від ПЗЗ-датчика є процес
зчитування інформації. У КМОП матрицях можна зчитувати інформацію з
кожного пікселя окремо та незалежно. З цієї умови можна виділити ще кілька
додаткових переваг, крім малої вартості. Перша з них – це особливість будови
датчика, яка дозволяє розташувати блок обробки інформації прямо на кристалі.
Також можна сказати і про те, що КМОП-датчики використовують меншу
кількість додаткових компонентів, і як наслідок вони менш габаритні, ніж ПЗЗ-
датчики. Значною особливістю є те, що КМОП-датчики не потребують великої
кількості енергії, отже, вони дешевші в експлуатаційному плані.
Варто зазначити, що фотоелемент використовується підкладка з
кремнію р-типу, як і в ПЗЗ-датчиках. Усередині утворюється потенційна яма,
яку згодом потраплятимуть наші електрони. Кількість цих електронів також
залежатиме від сили падаючого світла. А витяг інформації про падаюче світло
з пікселя в технології КМОП сильно відрізняється від технології, що
використовується у ПЗЗ-датчиках.
Як уже говорилося раніше, ми можемо зчитувати інформацію незалежно
із кожного пікселя. Це можливо за рахунок будови самого пікселя, зокрема за
рахунок транзистора скидання. Технологія зчитування інформації в КМОП-
технології полягає в тому, що при спрацьовуванні затвору на транзисторі
скидання, надходить сигнал скидання і він відкривається. Всі фотоелектрони,
що накопичилися, протікають по ньому на вихід датчика. Таким чином ми
можемо зчитувати інформацію з будь-якого пікселя незалежно і в будь-якому
порядку, і інформація з пікселя відразу надходить на вихід датчика подальшої
обробки.
Арк.
СКТК18.023083.248 ПЗ
20
Змн. Арк. № докум. Підпис Дата
Розвиток цієї технології пов'язані з тим, що ми можемо розташувати
кілька транзисторів на одному пікселі. Як наслідок стало можливим проводити
обробку отриманої інформації відразу всередині датчика.
Достатньо лише інтегрувати на дані мікросхеми ті пристрої, які нам
потрібні (наприклад, підсилювач). Структура КМОП датчика представлена
малюнку 1.10.
Рис. 1.10 – Структура КМОП-матриці.
Як уже говорилося раніше, ми можемо зчитувати інформацію незалежно
із кожного пікселя. Це можливо за рахунок будови самого пікселя, а в зокрема,
за рахунок транзистора скидання. Технологія зчитування інформації в КМОП-
технології полягає в тому, що при спрацьовуванні затвора на транзистор
скидання надходить сигнал скидання і, отже, він відкривається. Всі
фотоелектрони, що накопичилися, протікають по ньому на вихід датчика.
Таким чином ми можемо зчитувати інформацію з будь-якого пікселя незалежно
і в будь-якому порядку, і інформація з пікселя відразу надходить на вихід
датчика подальшої обробки. Розвиток цієї технології пов'язані з тим, що ми
можемо розташувати кілька транзисторів на одному пікселі. Як наслідок стало
можливим роводити обробку отриманої інформації відразу всередині датчика.
Арк.
СКТК18.023083.248 ПЗ
21
Змн. Арк. № докум. Підпис Дата
Достатньо лише інтегрувати на дані мікросхеми ті пристрої, які нам потрібні
(наприклад, підсилювач).
Слід зазначити, що КМОП-датчики мають певні недоліки. Через те, що
всі операції протікають на одному пікселі відразу, це призводить до появі
додаткових шумів під час роботи додаткових схем, розміщених на кристалі.
Для усунення цього недоліку перед світлочутливими елементами поставили
мікролінзи, що збирають світло, а самі світлочутливі елементи стали
розташовувати на звороті від провідників та транзисторів. Також слід
зазначити, що сучасні КМОП-сенсори потребують кадрового затвору. При
використанні рядкового затвора зображення рухомих об'єктів буде
розмиватись, так як він призводить до строкового зміщення зображення і в
кожний момент часу фіксуватиметься лише частина цього зображення.
Кадровий затвор дозволяє уникнути цього ефекту. Він експонує всі пікселі
сенсора одночасно протягом рівного проміжку часу. Реалізація цього трохи
ускладнює структуру нашого датчика. Тому що ми експонуємо все пікселі
одночасно, то нам слід додати елемент пам'яті до кожного піксель. Як правило,
цим елементам пам'яті служить додатковий конденсатор. Це веде до того, що
розмір нашого пікселя збільшується. Але КМОП-технології розвинені
достатньо, щоб зробити розмір пікселя прийнятним для зйомки і Full HD-
якості [9].
Як говорилося спочатку, будь-який датчик може відтворити тільки
чорно-біле зображення. Тобто він лише показує яскравість падаючого на кожен
піксель світла. Якщо світло дуже яскраве, то колір буде прагнути до білого, а
якщо світло не падає на піксель взагалі, ми отримаємо чорний колір. Для того,
щоб наша цифрова камера могла побудувати кольорове зображення придумали
перед кожним пікселем ставити світлофільтри, які пропускають світло певного
кольору. Як правило використовуються світлофільтри зеленого, синього та
червоного кольорів. Також їхнє розташування залежить від обраної моделі
розташування світлофільтрів. Як правило однією з основних таких моделей є
Арк.
СКТК18.023083.248 ПЗ
22
Змн. Арк. № докум. Підпис Дата
модель Байєра, яку також називають GRGB, RGBG, або (якщо треба
підкреслити діагональне розташування червоного та синього пікселів) RGGB,
що показано на рисунках 1.10-1.11.
Як видно з малюнка в моделі Байєра світлофільтри різних кольорів.
розташовані у шаховому порядку, при цьому зелених світлофільтрів у два рази
більше ніж сині чи червоний. Це обумовлено тим, що людське око найкраще
реагує на зелений колір. Принцип дії цього фільтра полягає в тому, що через
кожен фільтр проходить лише одна третина всього світлового потоку, а решта
відсікається, і при цьому пікселі будуть сприймати падаюче світло як чорно-
біле. Відповідно ця частина світлового потоку, яка пройшла після фільтрації,
характеризуватиме кількість світла, того кольору, що і світлофільтр, через який
пройшов наш світло. Потім беруться чотири сусідні осередки 2х2 (червоний,
зелений, синій, зелена) і створюються чотири чорно-білих канали. Інформація
з цих осередків надходить у процесор за даними каналами, і в результаті
інтерполяції розраховується колір кожної комірки.[10]
Рис. 1.10 – Світлофільтр RGBG.
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. № докум. Підпис Дата 23
а - мікролінзи, b - фільтр кольору cфотодіод d - міліони стлових сенсорів.
Рис. 1.11 – Принцип роботи RGBG світлофільтру.
Проблема будь-якого фільтра "Байєра" в тому, що він схильний,
знижувати роздільну здатність та якість зображення, в першу чергу,
утворюючи спотворення зображення. Це явище утворюється при накладенні
двох структур з регулярним малюнком. По суті це биття частот, а кольоровий
малюнок виникає саме через чергування кольорових осередків на фільтрі. Щоб
зменшити цей ефект, в 90% камер перед сенсором ставлять спеціальний
оптичний фільтр нижніх просторових частот (ОФНПЧ) "АА" (anti aliasing),
розміщується перед елементами матриці, який розмиває зображення.
Природно при цьому сильно втрачається роздільна здатність зображень, що
отримується шляхом інтерполяції, зате певною мірою йде спотворення.
Кількість пікселів - це роздільна здатність нашого зображення. Воно
визначає кількість точок, яку згодом побачимо на екрані. Однак це ще не
говорить про те, що чим більша роздільна здатність матриці, тим більше
обов'язково якіснішим буде наша картинка. Можливо так, що мега пікселів на
матриці багато, а якість знімка все одно невисока: він не різке, не контрастне,
потопає в цифровому шумі - перешкодах. Якість зображення залежить не
Арк.
СКТК18.023083.248 ПЗ
24
Змн. Арк. № докум. Підпис Дата
тільки від роздільної здатності в мега пікселях, а й від фізичного розміру самої
матриці. Саме за дрібні деталі має відповідати висока роздільна здатність
матриці.
Також важливим є розмір цих пікселів. Він визначається двома
характеристиками: фізичний розмір матриці та кількість пікселів. Щоб
отримати розмір матриці, потрібно її розмір поділити на кількість пікселів, і
ми матимемо розмір одного пікселя. Доведено, що розмір пікселя (відстань між
пікселями) вже досяг своєї фізичної межі, що становить 1 мкм. Подальше
зменшення розміру пікселя втрачає сенс, оскільки довжина світлової хвилі
становить від 039 до 078 мкм; і при відстані між пікселями менше 0,78 мкм
(червоне світло), сусідні пікселі будуть показувати те саме.
Чутливість - під чутливістю розуміється ставлення значення
електричного сигналу, що виробляється датчиком, до його рівня освітленості
зараз. Значення електричного сигналу вимірюється в вольтах, а освітленість у
люксах на секунду. Для кольорових датчиків зображення значення чутливості
вказується окремо для різних довжин хвиль (монохроматична чутливість до
потоку випромінювання шириною 1 нм). Також може використовуватись
сумарна чутливість у всьому спектральному діапазоні (болометрична
чутливість). У багатьох чорно–білих датчиків дуже висока чутливість до
інфрачервоного діапазону. Спектральна чутливість кольорових датчиків
зображення близька до чутливість людського ока.
При призначенні тієї чи іншої чутливості насправді в матриці ніяких змін
не відбувається, а змінюється коефіцієнт аналогового підсилення сигналу з
фотодатчиків перед подачею його на вхід аналого-цифрового перетворювача.
Чим більше чутливість, що вибирається, відрізняється від реальної
світлочутливості матриці, тим більше сигнал. Але підсилення сигналу може
негативно зашкодити підсумковому зображенні – з'являється "Шум" у вигляді
випадкових завад.
Арк.
СКТК18.023083.248 ПЗ
25
Змн. Арк. № докум. Підпис Дата
Динамічний діапазон – це відношення максимального вихідного сигналу
датчика до власного рівня шуму, дБ. Людське око має динамічний діапазон
близько 200 дБ. Жоден штучний прилад не має настільки високе значення
цього параметра.
Відношення сигнал/шум - це величина, яка показує скільки разів наш
корисний сигнал перевершує шуми. Для оптимальної картинки ця величина
має бути не менше ніж 45 дБ. При такому відношенні сигнал/шум ми не
помічатимемо спотворення на картинці, викликані шумами.
Шум у матриці визначається випадковим (тепловим) рухом електронів, а
сигнал інтенсивністю світлового потоку, часом експозиції (Накопичення
заряду) і площею світлочутливого елемента. Відповідно, чим вище параметри,
що утворюють сигнал, тим краще співвідношення сигнал/шум за інших рівних
умов.
Шуми в КМОП-матриці неминучі, оскільки кожен піксель крім
світлочутливого елемента має свою схему обробки сигналу. Відповідно, через
те, що всі пікселі розташовані дуже близько один до одного, вплив ланцюгів
кожного пікселя неминучі. Також варто зазначити, що струм, що йде з пікселів,
також впливає. Усунення даної проблеми коригуються, переважно, внутрішнім
розведенням КМОП-схеми. Коли клітинка матриці скинута в початковий стан,
її ємнісний елемент повністю заряджений, і цей заряд витікає різними
шляхами. Існує кілька чинників, які впливають такий струм.
Також слід сказати, що з кожного осередку підсилюється отримана
відеоінформація і відповідно підсилюватиметься і шум.
Шум може виникати і через природне коливання температури довкілля.
Арк.
СКТК18.023083.248 ПЗ
26
Змн. Арк. № докум. Підпис Дата
1.4 Принцип згортки зображень.
На рис. 1.12 представлена спрощена схема згортки архітектури
нейронної мережі.
Рис. 1.12 – Архітектура згорткової нейронної мережі.
Зліва знаходяться вхідні нейрони, подані сигналами відповідних
пікселів. Далі відбувається згортка на каскаді, що звужується. Нейронів, що
розташовані на внутрішніх шарах. У правій частині знаходиться нейронна
мережа прямого поширення та вихідні нейрони [4].
З кожним новим шаром кількість нейронів зменшується, для зручності
обчислень зменшення пропорційною до ступеня числа 2. Слід зазначити
операція згортки застосовується вже на етапі зчитування зображення:
згорткова матриця проходить за зображенням з верхнього лівого кута,
зсуваючись на один піксель за крок. При цьому матриця ваги для різних
нейронів не змінюється, а результат проходження матриці по полю проходить
етап лінійної ректифікації, метою якої є відсікання зайвих даних у вхідному
каналі.
Шари згортки йдуть по черзі зі шарами су дискретизації, на яких
відбувається зменшення розмірності вхідних карт ознак. З кількох поруч
нейронів, що стоять, вибирається найбільше значення, яке стає новим
Арк.
СКТК18.023083.248 ПЗ
27
Змн. Арк. № докум. Підпис Дата
нейроном на новій, створюваній таким шляхом карті ознак [7]. Приклад
згортки представлений на рис. 1.13.
Рис. 1.13 – Згортка зображення.
В результаті кожного шару згортки та субдискретизації зменшується
розмір зображення, що в кінці дає на вихід мережі невелику кількість
параметрів, визначальні абстрактні поняття самої мережі. Дані подаються далі
на входи підключеної далі мережі прямого розповсюдження, яка виконує
обробку результату.
Після подібної обробки вхідного зображення розміром 100х100 з 3-ма
каналами кольору, при ядрі згортки розміром 3х3 та 6-ти каналами на виході
мережі необхідно знайти 9*3*6=162 параметри.
Арк.
СКТК18.023083.248 ПЗ
28
Змн. Арк. № докум. Підпис Дата
РОЗДІЛ 2. АЛГОРИТМИ РОЗПІЗНАВАННЯ ОБРАЗІВ ДЛЯ СИСТЕМИ
ВИЯВЛЕННЯ ТА ВІДСТЕЖЕННЯ ОБ'ЄКТІВ
У другому розділі розглянемо приклади різних алгоритмів та методів
виявлення та розпізнання об'єктів на зображенні як математичних, так і на
основі нейронних мереж.
2.1 Етапи розпізнавання образів
Для розпізнавання образів на вихідному зображенні потрібні ідеальні
умови, зважаючи на наявність різних шумів, які призводять до похибкам та
помилкам. Тому для використання реальних зображень попередньо необхідно
провести обробку зображення та зробити попередній пошук області, де є
об'єкти. Для пошуку областей з об'єктом та відсікання непотрібних областей
використовуються алгоритми, які називаються фільтрами. Найчастіше вони
застосовують до всіх точок єдине перетворення. Нижче представлені фільтри,
від найпростішого до складного:
а) бінаризація зображення на порозі. Даний спосіб є найпростішим і
найшвидшим, він використовує значення певного кольору на зображенні, при
цьому на гістограмі відзначається деяке граничне значення цього кольору, і всі
кольори, які не підходять, виявляються нижчими порогами, далі просто не
відображаються. Даний метод підходить для пошуку на зображенні предметів
та зон одного кольору, виділення об'єктів на монотонному фоні;
б) фільтри низьких та високих частот. До обробки зображень можна
застосувати перетворення Фур'є та фільтри низьких та високих частот,
використовуються при обробці цифрових сигналів, так як зображення є
сигналом складного типу. Після перетворення використовується згортка з
готовим фільтром. В результаті такої обробки зображення позбавляються від
шумів, чи виносять їх як окремий канал інформації;
Арк.
СКТК18.023083.248 ПЗ
29
Змн. Арк. № докум. Підпис Дата
в) вейвлет-перетворення дуже схоже на попередній метод, але для
згортки застосовуються моделі патернів. Тоді основним завданням алгоритму
виступає вибір правильних патернів. До класичних патернів для аналізу даним
методом є: вейвлети Хаара, Добеші, Мейєра та мексиканська капелюх, що
представлені малюнку 2.1;
Рис. 2.1 – Вейвлети Хаара, Добеші, Мейєра, мексиканська капелюх.
г) фільтрації функцій - це математичний метод, в основі якого лежить
пошук функцій, які породжують кожну з багатьох точок вихідного зображення.
Для створення малюнка на основі математичних функцій використовуються
кола, параболи та прямі. Класичним для даного методу вважається
перетворення Хафа, або перетворення Радону, яке використовує для
інтерполяції швидке перетворення Фур'є;
д) фільтрація контурів – це набір фільтрів, що дозволяє знайти на
зображенні точки з максимальною відмінністю значення кольору від сусідніх.
При з'єднанні безлічі точок виділяє контури будь-яких ділянок об'єкта за
умови, що вони відрізняються від фону зображення. До таких фільтрам можна
віднести оператор Кенні, Собеля, Лапласа та ін. застосовуються до зображень
з високою роздільною здатністю. Всі вищезазначені методи можуть
використовуватися як самостійно, так і в комплексі з іншими, таке зумовлено
Арк.
СКТК18.023083.248 ПЗ
30
Змн. Арк. № докум. Підпис Дата
технічним завданням. Основним недоліком вважається значне збільшення часу
відповідно збільшення розміру зображення на вході.
Фільтри можна використовувати для подальшої логічної обробки.
Формальне завдання обробки формулюється так: перехід від набору точок до
об'єктів або їх характеристик. Далі наведено основні методи таких переходів:
а) математична морфологія – це безпосереднє використання теорії
множин, а також логічних операцій над множинами, до множини пікселів
вхідного зображення. Доповненням до вихідного зображення стає кілька
спеціальних патернів, які є бінарними, оскільки пікселі двокольорові.
Подальша робота над зображенням відбувається через логічні операції над
обома множинами пікселів. До таким логічним операціям відносяться: ерозія,
замикання, нарощування та розмикання. За допомогою морфологічної обробки
знаходять межі об'єкта, прибирають шум, видаляють зайві об'єкти малого
розміру та інші дії, тому найчастіше цей метод застосовується до роботи у
графічних редакторах;
б) контурний аналіз - метод, що володіє простою логікою, що багато
об'єктів можна визначити за їх контурами, наприклад літак. Мінусом цього
методу є те, що для точного визначення йому необхідні ідеальні умови;
в) відстеження спеціальних точок – до особливих точок відноситься
безліч об'єктів, яке повністю залежить від поставленого завдання та
безпосередньо об'єкт пошуку. Як такі точки можуть бути прийняті локальні
екстремуми на зображенні, максимуми дисперсії, різкі кути та інші об'єкти та
їх параметри. Цей метод можна застосувати при відстеженні руху у відео
потоці, об'єднання зображення з різних камер, стабілізація зображень. Але
широкий діапазон використання призводить до складності обчислень і
необхідності великої множини точок, щоб розпізнати об'єкт коректніше. Таким
безліччю точок повинні бути показники, що точно ідентифікують об'єкт, тобто
унікальні. Тому при складності обчислень даний метод є найбільш точним,
через велику кількість інформації.
Арк.
СКТК18.023083.248 ПЗ
31
Змн. Арк. № докум. Підпис Дата
На основі розпізнаних властивостей, представленого на зображенні
об'єкта проводиться його подальша класифікація. Для прийняття вірного
рішення застосовуються принципи навчання, які були описані в попередньому
розділі. Перед початком навчання наявні дані логічного аналізу зіставляються
з вихідними даними навчання [6]. Є деякий простір ознак, що належить
вихідному зображенню. Кожен з представлених ознак має власну вагу, тобто
кількісне подання його важливості до ухвалення кінцевого рішення. В процесі
навчання весь простір ознак ділиться на області, кожна з яких належить до
одного із рішень. Після кожної ітерації відбувається черговий поділ та областей
стає більше, причому це дроблення відбувається не через зміну
співвідношення площ часток кожної ознаки у загальному просторі, а через
правильний перерозподіл областей простору кожної ознаки. Нижче наведено
приклад вибору, результатом якого може бути або 1, або 0. Наприклад, під час
перебування об'єкта на зображенні. На рис.2.2 представлено послідовний поділ
простору на області при різній кількості ітерацій, для 1, 7 та 40 ітерацій
відповідно, а також представлений графік збіжності помилки.
Рис. 2.2 – Поділ простору на області та графік збіжності.
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. № докум. Підпис 32
Дата
2.2 Метод Віоли-Джонса
На сьогоднішній день одним із найефективніших алгоритмів
розпізнавання є метод Віоли-Джонса, вперше реалізований у 2001 році Полом
Віолою (Paul Viola) та Майклом Джонсом (Michael Jones) [14]. Його перевага
полягає в швидкості розпізнавання, точності до 90% і мала кількості
помилкових спрацьовувань. Основним недоліком є розпізнавання обличь,
повернутих максимум на 30 градусів. При довільному вугіллі нахилу
ймовірність правильного розпізнавання різко знижується [15]. Ще одним
недоліком можна вказати довге навчання мережі та її класифікаторів при
використанні цього методу [16].
Для реалізації цього методу використовуються принципи, частина яких
вже розглянуто вище, а друга частина буде описана далі:
а) принцип скануючого вікна;
б) інтегральне уявлення вихідних зображень;
в) використання вейвлетів Хаара для виявлення об'єкта;
г) застосування бустера AdaBoost;
д) використання бінарного класифікатора;
е) з використанням каскадів ознак вікна, у яких особи не виявлені,
відсіваються.
Принцип скануючого вікна було розглянуто раніше. Вхідне зображення
є матрицею з розміром m*n, де кожен елемент поєднує в собі значення
характеристик колірного простору RGB, або може представлятися як значення
від 0 до 255. В останньому випадку представлене значення є результатом
склеювання всіх трьох компонентів за одне число. У процесі обробки скануюче
вікно пересувається по зображення. На кожній ітерації виявлення обличчя
відбувається шляхом запуску класифікатора всередині скануючого вікна, та у
разі виявлення особи, вікно з обличчям виділяється. Скануюче вікно являє
собою прямокутник, що має розмір, що змінюється, в початковий момент не
Арк.
СКТК18.023083.248 ПЗ
33
Змн. Арк. № докум. Підпис Дата
перевищуючи розмір зображення. Основними параметрами є x,y – координати
центру вікна, w,h – ширина та висота скануючого вікна, а – кут нахилу [16].
При цьому вхідне зображення використовується в інтегральному
вигляді, тобто у вигляді матриці, що має той самий розмір, але всі елементи
даної матриці розраховуються як сумарна інтенсивність пікселів, що
знаходяться ліворуч і вище за той, який необхідно розрахувати. В результаті
цього розрахунку можна розрахувати інтенсивність будь-якого випадкового
прямокутника матриці за обмежений час Наприклад візьмемо довільний
прямокутник, поданий на рис.2.3.
Формула розрахунку його яскравості:
Рис. 2.3 – Випадково обраний прямокутник у матриці.
Як основні ознаки класифікації об'єктів, виявлених на зображенні, що
застосовуються вейвлети Хаара. Об'єкт представляється як вектор ознак х = (fi
(x)), це ознаковий опис об'єкта. Кожна з ознак має область припустимих
значень Df. Тоді ознаковий простір для порівняння з пошуковим вікном матиме
вигляд безлічі:
Арк.
СКТК18.023083.248 ПЗ
34
Змн. Арк. № докум. Підпис Дата
Ознаками можуть виступати примітиви, як у нинішньому алгоритмі
застосовуються розширені примітиви Хаара, суть яких зводиться у накладенні
примітиву на вибрану область. Приклад примітивів представлений на рис.2.4.
Рис. 2.4 – Розширені примітиви Хаара.
Приклад їх накладення зображення наведено на рис. 2.5.
Рис. 2.5 – Знайдений примітив Хаара.
В алгоритмі Віоли-Джонса застосовується бустер, щоб зменшити
помилки щодо осіб, тобто помилкові спрацьовування. Бустинг був описаний
другій частині другого розділу, де було зазначено, що його суть полягає у
послідовному навчанні використовуваних класифікаторів на основі помилок
попередніх. Каскадна модель алгоритму є дерево рішень, що складається із
значень функції активації та загальних умов переходу [14]. На рис.2.6
Арк.
СКТК18.023083.248 ПЗ
35
Змн. Арк. № докум. Підпис Дата
представлений приклад дерева рішень, де f(x) та f1(x) є булеві функції, а y –
значення цільової функції.
Рис. 2.6 – Модель дерева рішень.
Всі вузли дерева рішень розташовуються так, що кожен подальший вузол
містить більше примітивів, ніж попередній. Таким чином обробка зображення
на початкових рівнях відбувається на порядок швидше і чим глибше обробка,
тим більше часу потрібно, проте на перших етапах виходить швидко відсікти
області, на яких не виявлено необхідних образів. При малій кількості шуканих
об'єктів та з поступовим навчанням всіх каскадів час на обробку значно
скорочується.
На рис.2.7 представлена схема обробки, складність якої розраховується
як О(x*y*z), де відповідно до кількості: x –етапів, y – приклади, z – ознаки.
При цьому слід врахувати, що завдяки бустингу кожен наступний каскад
розпізнавання підготовлений ще краще.
Арк.
СКТК18.023083.248 ПЗ
36
Змн. Арк. № докум. Підпис Дата
Рис. 2.7 – Каскадна модель пошуку.
Враховуючи все вищесказане, отримаємо алгоритм обробки:
а) виділення вікна на зображенні;
б) здійснити пошук першого класифікатора, і якщо він не виявлений,
відбувається перехід до пункту 3;
в) здійснити пошук другого, більш удосконаленого класифікатора і далі
продовжувати до останнього класифікатора. Якщо не зробить вихід із циклу,
отже, об'єкт виявлено;
г) зробити зсув вікна. Зробити зміну розміру вікна, після проходження
всього зображення.
Метод Віоли-Джонса може бути успішно вдосконалений, оскільки для
нього можна використовувати всі методи попередньої підготовки вхідного
зображення, що ґрунтуються на теорії обробки сигналів, що були розглянуті
попередніх розділах цієї роботи. Крім того, часто застосовується зміна
зображення у напівтоновому форматі, щоб унеможливити вплив на вибір
кольорів зображення.
Арк.
СКТК18.023083.248 ПЗ
Змн. 37
Арк. № докум. Підпис Дата
У випадках роботи на потужних ЕОМ можлива комбінація методу Віоли-
Джонса та виділення спеціальних точок. Для виявлення об'єкта
використовуються точки, вибір та специфіка яких визначається основними
характеристиками об'єкта Наприклад, для особи такими точками можуть
виступатиме рот, очі, ніс. Виділені патерни проходять алгоритм Віоли -
Джонса. Для прискорення цей метод застосовується тільки для вікон, де
класифікатор вже виявлено об'єкт. Крім того, можна використовувати
ітеративне поглиблення деяких спеціальних точок, як наприклад, для очей
можна окремо виділити зіниці та куточки очей.
Арк.
СКТК18.023083.248 ПЗ
38
Змн. Арк. № докум. Підпис Дата
РОЗДІЛ 3. РОЗРОБКА ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ТА
НАЛАШТУВАННЯ RASPBERRY PI
На основі вивченої та розглянутої у попередніх розділах теоретичної
бази, можна приступити до розробки власного програмного продукту. Мову
програмування вибрано Python.
Python – високорівнева мова програмування загального призначення,
орієнтована на підвищення продуктивності розробники та читання коду. Для
зручності мінімізовано синтаксис [17].
3.1 Встановлення середовища розробки Microsoft Visual Studio
Середовище розробки було обрано Microsoft Visual Studio, що являє
собою інтегроване середовище розробки програмного забезпечення та ряд
інших інструментів. З їх допомогою можна розробляти як консольні програми,
так і програми, що мають графічний інтерфейс, веб-сайти, веб-застосунки та
інші програмні продукти. Підтримуються такі платформи, як Windows,
Windows Mobile, Windows CE, NET Framework, Xbox, Windows Phone .NET
Compact Framework та Silverlight. Є відповідна підтримка багатьох сучасних
мов програмування, зокрема і Python. Дане середовище розробки є найбільш
зручним і безкоштовним, що досить важливо. Розробка проводиться на
платформі Windows 10. Для установки Python у Microsoft Visual Studio
необхідно вказати всі необхідні бібліотеки та мови у програмі встановлення.
Відповідні установки представлені рис. 3.1.
Арк.
СКТК18.023083.248 ПЗ
39
Змн. Арк. № докум. Підпис Дата
Рис. 3.1 – Встановлення середовища розробки.
3.2 Встановлення бібліотеки OpenCV
В якості основної бібліотеки була обрана OpenCV. OpenCV
(OpenSourceComputerVision) – це бібліотека, основним призначенням якої є
робота із зображеннями, комп'ютерний зір та обробка зображень та відео в
реальному часі. Спочатку була розробкою компанії Intel, проте пізніше цю
розробку включилися WillowGarage, а ще пізніше Itseez, який після цього був
придбаний Intel. Бібліотека поставляється безкоштовно і є кросплатформною
[18].
OpenCV написана мовою С++, хоча зберігає інтерфейс старішого мови
С. Є прив'язка до Python, що є найважливішим в рамках справжньої роботи,
але також є прив'язки і до Java та MATLAB/OCTAVE. API для різних
інтерфейсів можна знайти в онлайн-джерелах.
Офіційно проєкт OpenCV був запущений в 1999 році компанією
IntelResearch.
Перша альфа-версія була видана на конференції IEEE з розпізнавання
образів і загалом комп'ютерного зору 2000 року. Пізніше з 2001 по 2005 роки
було випущено п'ять бета-версій. І лише 2006 року була випущено версію 1.0.
Арк.
СКТК18.023083.248 ПЗ
40
Змн. Арк. № докум. Підпис Дата
Друга версія OpenCV 2 була випущена у жовтні 2009 року, вона мала
великі зміни в інтерфейсі С++, метою яких було спрощення, включення нових
функцій та покращення реалізацій для вже існуючих методів та функцій. На
даний момент офіційні релізи відбуваються кожні півроку.
У 2012 році підтримку OpenCV взяв на себе комерційний фонд
OpenCV.org. Він же здійснює підтримку користувача сайту даної бібліотеки. У
2016 році Intel викупила Itseez, який є провідним розробником бібліотеки
OpenCV.
Дана бібліотека включає роботу з нейронними мережами, методи
обробки зображень, високошвидкісне матричне обчислення, методи
машинного зору, відстеження об'єктів у реальному часі, обробка тривимірних
зображень.
У бібліотеки відкритий код, а також безліч доступних навчальних
джерел, які корисні під час виконання даної роботи. Для встановлення цієї
бібліотеки в Microsoft Visual Studio під Python, достатньо виконати
встановлення додаткових пакетів через оточення Python.
На малюнку 3.2 представлено вікно оточення Python, через яке
виробляється установка бібліотеки.
Арк.
СКТК18.023083.248 ПЗ
41
Змн. Арк. № докум. Підпис Дата
Рисунок 3.2 – Встановлення бібліотеки OpenCV.
3.3 Створення програмного забезпечення
Для зручності виконання ідентифікації об’єктів код програми був розділений
на два різні етапи:
а) вибір бази даних;
б) ідентифікація вхідного зображення згідно з базою даних.
Для навчання нейронної мережі та розпізнавання образів насамперед
необхідно створити навчальну вибірку, тобто зробити базу даних, що
складається з фотографій об’єктів. Тому було вирішено використати бібліотеку
COCO, дану бібліотеку навчили ідентифікувати цілу купу звичайних
повсякденних предметів і тварин, які мають свій id-номер. Вона заснована на
архітектурі MobileNetV3 і була навчена на наборі даних Common Objects in
Context (COCO). Модель спеціально розроблена для завдань виявлення
об’єктів у реальному часі на мобільних і вбудованих пристроях з обмеженими
обчислювальними ресурсами.
Арк.
СКТК18.023083.248 ПЗ
Змн. 42
Арк. № докум. Підпис Дата
Набір даних COCO є широко використовуваним еталонним тестом для
виявлення об’єктів і складається з різних типових об’єктів у повсякденних
сценах. Метою моделі є ідентифікація та визначення місцезнаходження
об’єктів на зображеннях, надання координат обмежувальної рамки та міток
класу для кожного виявленого об’єкта.
Використовуючи цю попередньо навчену модель, розробники можуть
використовувати її можливості для виконання завдань виявлення об’єктів без
необхідності навчання моделі з нуля. Його можна використовувати в таких
додатках, як системи спостереження, робототехніка, безпілотні автомобілі та
інші програми комп’ютерного зору в режимі реального часу, які вимагають
можливостей виявлення об’єктів.
Рис.3.4 показує зміст папки з проєктом, де файл
ssd_mobilenet_v3_large_coco_2020_01_14. pbtxt – база даних, файл coco.names
імена обєктів, файл object-ident.py – файл проекту.
Рис. 3.4 – Вміст папки з проєктом
Після вибору бази даних тепер можна перейти до написання проекту
програми мовою Python, але перед цим побудуємо логічну структуру роботи
програми рис.3.5.
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. № докум. Підпис Дата 43
Рис. 3.5 – Структурна схема програми, розпізнавання та відстеження образів.
Відповідно до структурної схеми було написано програмний код, який
представлений у Додатку А. Програма приймає вхідний потік із веб–камери
спочатку шукає наявність об’єктів, як таких. Якщо було виявлено об’єкт,
програма виділяє їх у рамку і звіряє його з базою даних. Якщо у базі даних
знайшовся збіг, то змінна id набуває значення, яке присвоєно об’єкту із збігом.
Відповідно до значення id на екран буде виведено назву об’єктіву. За
відсутності збігів та за умовчанням id має значення, що дорівнює 0, і на екран
буде виведено назву, що стоїть першим в вектор імен, тобто «person». Важливо
помітити, що обробка відео потоку ведеться покадрово, тобто кожен новий
кадр буде оброблено лише тоді, коли закінчено попередню ітерацію
розпізнавання.
Арк.
СКТК18.023083.248 ПЗ
44
Змн. Арк. № докум. Підпис Дата
3.4 Запуск програми на Raspberry Pi
Raspberry Pi – одноплатний комп’ютер, який розроблений для навчання
інформатики, на основі цієї бюджетної системи. Проте пізніше отримав більш
широке застосування. Основним розробником є Raspberry Pi Foundation.
Усього за п'ять років було продано понад 12,5 мільйонів таких пристроїв.
Для запуску програми на платформі Raspberry Pi, передбачається, що
операційна система Raspbian вже встановлена на Raspberry Pi, етапи
встановлення операційної системи та допоміжних елементів у цій роботі не
розглядаються.
Raspbian — це операційна система, основою якої є Debian. На
сьогоднішній день існує кілька версій Raspbian, такі як, наприклад, Raspbian
Stretch та Raspbian Jessie. Офіційно Raspbian представлена з 2015 року
Raspberry Pi Foundation як основна операційна система Raspberry Pi. Raspbian
була створена Майком Томпсоном та Пітером Грін як самостійний та
незалежний проект. Початкова збірка була виконана у червні 2012 року. Ця
операційна система активно розробляється та удосконалюється. Raspbian є
максимально оптимізованої під процесори ARM, які мають низьку
продуктивністю та застосовувані в Raspberry Pi. Для запуску програмного
продукту даної дипломної роботи необхідне встановлення бібліотеки OpenCV
на Raspberry Pi. Для цього необхідно в командному рядку ввести наступні
команди, що представлені малюнку 3.6. Це триватиме тривалий час, проте
після виконання установки можна буде відразу запустити написану раніше
програму.
Арк.
СКТК18.023083.248 ПЗ
45
Змн. Арк. № докум. Підпис Дата
Рисунок 3.6 – Команди для встановлення бібліотеки OpenCV.
3.5 Перевірка працездатності системи
Щоб переконатися, що програма працює правильно, необхідно провести
експериментальні дослідження. На рис.3.7 представлене помилкове
розпізнання образів та некоректна результати роботи системи.
Рисунок. 3.7 – Помилкове визначення об’єктів.
Арк.
СКТК18.023083.248 ПЗ
46
Змн. Арк. № докум. Підпис Дата
Ймовірною причиною помилок є недостатнє навчання системи, через
брак навчального матеріалу, або ж неточності зображення. Для підвищення
якості роботи системи потрібно збільшувати кількість навчального матеріалу
(фотографій), а також їх гарного максимально можливого підвищення їх
якості. Результати коректної роботи системи подано на рис.3.8.
Рисунок 3.8 – Коректне розпізнавання об’єктів.
Арк.
СКТК18.023083.248 ПЗ
47
Змн. Арк. № докум. Підпис Дата
РОЗДІЛ 4. Охорона праці
4.1 Аналіз небезпек та шкідливостей, які виникають під час проведення
робіт в приміщенні лабораторії
В даній роботі розробляється система виявлення та відстеження
об’єктів. Проектування системи проводиться в проектно-технічній
лабораторії, в якій також проводяться роботи з ремонту та налагоджування
різноманітних приладів з використанням вимірювальних електронних
приладів на робочому місці наладчика. Саме тому необхідно створити
раціональні та безпечні умови праці цього працівника під час роботи з
обладнанням в лабораторії.
Проаналізуємо фактори, що впливають на здоров'я і працездатність
співробітника, який працює в лабораторії. За рівнем фізичних навантажень
дана робота відноситься до категорії I б, оскільки потребує деякого фізичного
навантаження при роботі з електрифікованим інструментом.
Робоче місце співробітника є постійним і представляє собою стіл (для
вільного переміщення інженера за столом встановлено рухоме крісло, яке
повторює анатомію тіла людини), в лівій і правій частині якого встановлені
електровимірювальні та інші прилади: осцилограф, мілівольтметр, блок
живлення та персональний комп'ютер. Робоче місце знаходиться в окремій
лабораторії, мебльованій столами зі встановленими на них обладнанням,
зокрема ПК. Монітори комп'ютерів розміщені так, щоб відстань від очей
користувача до екрану складала не менше 70 cм, кут зору 30о, для мінімізації
впливу випромінювання на зір.
Розміри лабораторії становлять: ширина – 4,5 м, довжина – 8 м, висота
стелі – 3 м, площа приміщення складає 36 м2. Лабораторія розрахована на
максимальну кількість працюючих 4 особи. Звідси площа, яка припадає на
одну людину, дорівнює: 9 м2. Об’єм приміщення складає: 108 м3. Звідси об'єм,
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. 48
№ докум. Підпис Дата
який припадає на одну людину, дорівнює 27 м3, що відповідає вимогам ДБН
В.2.2.28-2010.
Лабораторія розташована в північній частині корпусу підприємства,
стіни мають світле забарвлення із високим коефіцієнтом відбиття світла, колір
має матову структуру.
В лабораторії в холодний період року функціонує система
централізованого водяного опалення, яка відповідає ДБН В.2.5.67-2013
«Опалення, вентиляція та кондиціювання». Для її забезпечення встановлено 5
сучасних радіаторів Korado, що підтримують нормативну температуру повітря
в холодний період року.
Фактори мікроклімату в робочому приміщенні мають дуже важливе
значення, оскільки вони безпосередньо впливають на здоров’я та самопочуття
співробітника. Згідно з ДСН 3.3.6.042-99 нормативні значення основних
факторів мікроклімату наступні:
1. Температури повітря:
- в теплий період року – 23 - 25 °С (допустима – 20 - 28 °С). ;
- в холодний період року – 22 - 24 °С (допустима – 21 - 25 °С).
2. Вологість повітря:
- в теплий період року – 40 - 60 %;
- в холодний період року – 40 - 60 %.
3. Швидкість руху повітря:
- в теплий період року – 0,1 м/с (допустима – 0,1 - 0,2 м/с) ;
- в холодний період року – 0,1 м/с (допустима – менше 0,1 м/с) .
Фактичні значення даних параметрів становлять відповідно:
1. Температури повітря:
- в теплий період року – 23 - 25 °С ;
- в холодний період року –21 - 24 °С .
2. Вологість повітря:
- в теплий період року – 52 - 58 %;
Арк.
СКТК18.023083.248 ПЗ
49
Змн. Арк. № докум. Підпис Дата
- в холодний період року – 54 - 58 %.
3. Швидкість руху повітря:
- в теплий період року – 0,1 м/с;
- в холодний період року – 0,1м/с.
Фактичні параметри мікроклімату повністю відповідають нормативним
вимогам згідно з ДСН 3.3.6.042-99.
Проектно-технічна лабораторія - це приміщення з однобічним
природним освітленням, північно-східною орієнтацією віконних отворів.
Природне освітлення забезпечується крізь вікна. Розміри чотирьох вікон
приміщення однакові і становлять 1,31,4 м.
Згідно з ДБН В.2.5-28-2018 нормування природного освітлення
проводиться за допомогою коефіцієнта природного освітлення (КПО), розряд
зорової праці – II в, найменший об’єкт розрізнення – 0,25 мм, що відповідає
дуже високому ступеню точності зорової праці. Контрастність найменшого
об’єкту розрізнення та фонів: між текстом на моніторі та фоном, між текстом
на аркуші паперу та аркушем, букв на клавіатурі, між платою та деталями є
середньою. Фактичне значення КПО становить 30-35 %, що відповідає
вимогам ДБН В.2.5-28-2018.
Для темного часу доби передбачене штучне освітлення. При штучному
освітленні нормується величина освітленості в люксах (Лк), яка вибирається в
залежності від характеристик зорової праці з урахуванням найменшого
розміру об'єкта розрізнення, фону, контрасту об'єкта розрізнення з фоном.
Лабораторія обладнана двома світлодіодними світильниками, кожний з
яких має дві люмінесцентні лампи. Фактичний рівень штучного освітлення
становить 328-345 лк, що повністю відповідає нормативному рівню в 300 лк
згідно з ДБН В.2.5-28-2018.
Головним джерелом шуму в приміщенні лабораторії є вентилятор
охолодження в системному блоці комп’ютера, осцилографа та принтер. Згідно
з ДСН 3.3.6.037-99 «Санітарні норми рівнів шуму на робочих місцях»
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. 50
№ докум. Підпис Дата
нормативне значення еквівалентного рівня шуму при даному видові діяльності
та типу робочого місця складає 60 дБА, а рівень фактичного шуму становить
42-45 дБА, що відповідає нормативному.
Умови праці інженерів - розробників при роботі з обладнанням крім
стану параметрів виробничого середовища, визначаються також
характеристиками використовуваного устаткування, якістю робочих
матеріалів у робочій зоні, конструкцією робочих меблів та її розмірними
характеристиками. Тип робочого крісла обирається у відповідності до ДСТУ
7951:2015 «Дизайн і ергономіка. Крісло оператора. Загальні ергономічні
вимоги» та в залежності від тривалості роботи: при тривалій - масивне, при
короткочасній - крісло легкої конструкції, в якому легко пересуватися.
Ширина столу 0,9 м, усі предмети, що знаходяться на ньому розташовані на
відстані не більш 75 см від працівника, отже вони знаходяться в робочій зоні.
Приміщення лабораторії відноситься до 2 класу приміщень: приміщення
з підвищеною небезпекою ураження людини електричним струмом (оскільки
в приміщенні струмопровідна залізобетонна підлога) - ПУЕ-17. Обладнання,
встановлене в ньому живиться напругою 220 В і споживає потужність менше
ніж 2500 Вт. Деяке обладнання, зокрема осцилограф, мілівольтметр,
системний блок ПК, має металевий корпус, тому згідно з ДСТУ Б В.2.5-
82:2016 в лабораторії повинні бути передбачені заходи, щодо захисту
працівників від ураження електричним струмом.
Під час роботи з електрообладнанням працівник зобов'язаний
виконувати ряд правил, а саме:
- при раптовому припиненні подачі електроструму потрібно негайно
вимкнути електрообладнання;
- категорично забороняється ремонтувати електрообладнання,
вмикати та вимикати його, якщо це не передбачено в ході роботи;
- категорично забороняється проводити будь-які перемикання на
головному розподільному щиті;
Арк.
СКТК18.023083.248 ПЗ
51
Змн. Арк. № докум. Підпис Дата
- не знімати запобіжні кожухи;
- у випадку виявлення неполагодженого електрообладнання,
вимірювальних приладів і дротів, терміново вимкнути напругу;
- прилади керування та вимірювальні прилади слід розміщувати таким
чином, щоб було зручно проводити вимірювання, не перегинаючись через
прилади та провідники;
- у випадку враження електричним струмом слід терміново
звільнити потерпілого від дії струму і прийняти міри по наданню першої
допомоги, при необхідності викликати лікаря.
Лабораторія відноситься до приміщень з категорією
вибухопожежонебезпеки типу В, згідно з ДСТУ Б В.1.1-36:2016 (горючі та
важкогорючі рідини, тверді горючі та важкогорючі речовини, а також
речовини, здатні горіти тільки при взаємодії з водою, киснем повітря або один
з одним.). В даному приміщенні забезпечуються необхідні заходи щодо
протидії виникнення пожежонебезпечних ситуацій згідно з НАПБ А.01.001-
2014 «Правила пожежної безпеки в Україні». План евакуації розміщений на
стіні з вільним доступом до неї. Для попередження пожеж в ній
використовується електрична пожежна сигналізація променевого типу та
димові датчики у кількості 8 шт відповідно до ДБН В.2.5.56-2014.
Приміщення обладнане порошковим вогнегасником ВП-5У, який
закріплений у підставці на стіні поряд з дверима (Правила експлуатації та
типові норми належності вогнегасників).
З усіма працівниками перед допуском до роботи проводять вступний та
первинний інструктажі згідно типового положення про навчання з питань
охорони праці (ДНАОП 0.00-4.12-05). Допуск до роботи відбувається після
проведення перевірки знань із вступного та первинного інструктажів.
Перевірка здійснюється згідно затвердженого переліку запитань.
Вступний інструктаж з питань охорони праці проводиться з усіма
працівниками, які щойно прийняті на роботу (постійну або тимчасову)
Арк.
СКТК18.023083.248 ПЗ
52
Змн. Арк. № докум. Підпис Дата
незалежно від їх освіти, стажу роботи за цією професією або посади.
Первинний інструктаж проводиться з працівниками на робочому місці до
початку роботи. Запис про проведення інструктажу робиться у спеціальному
журналі.
Повторний інструктаж проводиться на робочому місці з усіма
працівниками та студентами: на роботах з підвищеною небезпекою – 1 раз у
квартал, на інших роботах – 1 раз на півріччя.
В результаті проведеного аналізу можливо зробити висновок про те, що
найбільш важливим чинником, що впливає на безпеку праці інженера-
розробника є можливість його ураження електричним струмом. Тому
необхідно розробити заходи захисту працівників від ураження електричним
струмом.
4.2 Способи і засоби захисту працівників лабораторії від ураження
електричним струмом
Для забезпечення захисту від ураження електричним струмом в
електроустановках повинні застосовуватися технічні способи і засоби захисту.
Вибір того або іншого способу або засобу захисту (або їх поєднань) в
конкретній електроустановці і ефективність його застосування залежать від
цілого ряду чинників, зокрема від:
- номінальної напруги;
- роду, форми і частоти струму електроустановки;
- способу електропостачання (від стаціонарної мережі, від автономного
джерела живлення електроенергією);
- режиму нейтралі джерела трифазного струму (середньої точки джерела
постійного струму) - ізольована нейтраль, заземлена нейтраль;
- виду виконання (стаціонарні, пересувні, переносні);
- умов зовнішнього середовища;
Арк.
СКТК18.023083.248 ПЗ
53
Змн. Арк. № докум. Підпис Дата
- схеми можливого включення людини в ланцюг протікання струму
(прямий однофазний, прямий двофазний дотик; включення під напругу
кроку);
- виду робіт (монтаж, наладка, випробування) і ін.
Крім того, за принципом дії, всі технічні способи захисту поділяються
на:
- що знижують до допустимих значень напруги дотику і кроку;
- що обмежують час дії струму на людину;
- що запобігають прямому дотику до струмопровідних частин.
Класифікація технічних способів і засобів захисту від ураження
електричним струмом в електроустановках наведена на рисунку 9.1.
Основними технічними засобами захисту є:
- захисне заземлення;
- автоматичне відключення живлення (занулення);
- пристрої захисного відключення.
Заземлення знижує до безпечної величини напругу відносно землі
металевих частин електроустановки, які опинилися під напругою при
пошкодженні ізоляції.
Захисне заземлення – навмисне електричне з'єднання із землею або її
еквівалентом неструмопровідних частин електроустановки, які можуть
опинитися під напругою унаслідок замикання на корпус або з інших причин
(індуктивний вплив сусідніх струмопровідних частин, винесення потенціалу,
розряд блискавки і т. ін.). Електричний опір такого з'єднання має бути
мінімальним (не більше 4 Ом для мереж з напругою до 1000 В і не більше 10
Ом для інших). При цьому корпус електроустановки і обслуговуючий її
персонал знаходитимуться під рівними, близькими до нуля, потенціалами
навіть при пробої ізоляції і замиканні фаз на корпус.
Призначення захисного заземлення - усунення небезпеки ураження
струмом у разі дотику до корпусу електроустановки і іншим
Арк.
СКТК18.023083.248 ПЗ
54
Змн. Арк. № докум. Підпис Дата
неструмопровідним металевим частинам, що опинилися під напругою
унаслідок замикання на корпус і з інших причин.
Розрізнюють два типи заземлення: виносне і контурне.
Виносне заземлення характеризується тим, що заземлювач (елемент
заземлюючого пристрою, що безпосередньо контактує із землею) винесений
за межі майданчика, на якому встановлено устаткування. Такий спосіб
використовується для заземлення устаткування механічних і складальних
цехів. Виносне заземлення називають також зосередженим.
Суттєвий недолік виносного заземлення – віддаленість заземлювача від
устаткування, що захищається, тому заземлюючі пристрої цього типу
застосовуються лише при малих струмах замикання на землю, зокрема в
установках до 1 кВ, де потенціал заземлювача не перевищує значень
допустимої напруги дотику.
Перевагою виносного заземлення є можливість вибору місця
розміщення електродів заземлювача з найменшим опором ґрунту (сирий,
глинистий, в низинах і т. ін.).
Необхідність у влаштуванні виносного заземлення може виникнути в
наступних випадках:
- при неможливості за яких-небудь причин розмістити заземлювач на
території, що захищається;
- при високому опорі землі на даній території (наприклад, піщаний або
скелястий грунт) і наявності поза цією територією місць із значно кращою
провідністю землі;
- при розосередженому розташуванні устаткування (наприклад, в
гірських виробках), що заземлюється.
Контурне заземлення складається з декількох зєднаних заземлювачів,
розміщених по контуру (периметру) майданчика, на якому знаходиться
устаткування, що заземлюється, а також усередині цього майданчика. Такий
тип заземлення застосовують в установках вище 1 кВ. Контурне заземлення
Арк.
СКТК18.023083.248 ПЗ
55
Змн. Арк. № докум. Підпис Дата
називається також розподіленим. Принцип дії захисного заземлення –
зниження до безпечних значень напруги дотику і кроку, обумовлених
замиканням на корпус та іншими причинами. Це досягається шляхом
зменшення потенціалу заземленого устаткування (зменшенням опору
заземлювача), а також шляхом вирівнювання потенціалів опори, на якій
знаходиться людина, і заземленого устаткування (підйомом потенціалу опори,
на якій знаходиться людина, до значень, близьких до значення потенціалу
заземленого устаткування).
У мережах змінного струму із заземленою нейтраллю напругою до 1 кВ
захисне заземлення як основний захист від ураження електричним струмом
при непрямому дотику не застосовується, оскільки воно не ефективне.
Сфера застосування захисного заземлення:
- електроустановки напругою до 1 кВ в трифазних трипровідних
мережах змінного струму з ізольованою нейтраллю (система IT);
- електроустановки напругою до 1 кВ в однофазних двопровідних
мережах змінного струму ізольованих від землі;
- електроустановки напругою до 1 кВ в двопровідних мережах
постійного струму з ізольованою середньою точкою обмоток джерела струму
(система IT);
- електроустановки в мережах напругою вище 1 кВ змінного і постійного
струму з будь-яким режимом нейтралі або середньої точки обмоток джерел
струму.
Заземлення електроприладів. Металеві корпуси електроустановок і
приладів обов'язково мають бути заземлені шляхом з'єднання з нульовим
дротом електромережі. Використання металевих труб і інших деталей
водопроводу, опалювальній або каналізаційній мережі для заземлення
(занулення) заборонено.
Арк.
СКТК18.023083.248 ПЗ
56
Змн. Арк. № докум. Підпис Дата
Рисунок 4.1 - Класифікація технічних способів і засобів захисту від ураження
електричним струмом в електроустановках
Занулення - навмисне електричне з'єднання з глухо заземленою
нейтраллю трансформатора в трифазних мережах металевих
неструмопровідних частин, які можуть опинитися під напругою. В мережах
однофазного струму частини електроустановки з'єднуються з
глухозаземленим виводом джерела струму, а мережах постійного струму – із
заземленою точкою джерела. При зануленні нейтраль заземлюється у джерела
живлення. Ця система має найбільше розповсюдження. Воно вважається за
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. № докум. Підпис Дата 57
основний засіб забезпечення електробезпеки в трифазних мережах із
заземленою нейтраллю напругою до 1000 В.
В мережі із зануленням слід розрізняти нульові захисний і робочий
провідники. Для з'єднання відкритих провідних частин споживача
електроенергії з глухозаземленою нейтральною точкою джерела
використовується нульовий захисний провідник. Нульовим захисним
провідником називається провідник, що сполучає зануляємі частини
споживачів (приймачів) електричної енергії із заземленою нейтраллю джерела
струму. Нульовий робочий провідник використовують для живлення струмом
електроприймачів і теж сполучають із заземленою нейтраллю, але через
запобіжник.
Використовувати нульовий робочий дріт як нульовий захисний не
можна, оскільки при перегоранні запобіжника всі приєднані до нього корпуси
можуть опинитися під фазною напругою! Занулення необхідно для
забезпечення захисту від ураження електричним струмом при непрямому
дотику за рахунок зниження напруги корпусу до землі і швидкого відключення
електроустановки від мережі.
Сфера застосування занулення:
- електроустановки напругою до 1 кВ в трифазних мережах змінного
струму із заземленою нейтраллю (система TN – S; звичайно це мережі 220/127,
380/220, 660/380 В);
- електроустановки напругою до 1 кВ в однофазних мережах змінного
струму із заземленим виводом;
- електроустановки напругою до 1 кВ в мережах постійного струму із
заземленою середньою точкою джерела.
Принцип дії занулення. При замиканні фазного дроту на занулений
корпус електроспоживача утворюється ланцюг струму однофазного короткого
замикання (тобто замикання між фазним і нульовим захисним провідниками).
Струм однофазного короткого замикання викликає спрацьовування
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. 58
№ докум. Підпис Дата
максимального струмового захисту, внаслідок чого відбувається відключення
пошкодженої електроустановки від живлячої мережі. Крім того, до
спрацьовування максимального струмового захисту відбувається зниження
напруги пошкодженого корпусу щодо землі, що пов'язане із захисною дією
повторного заземлення нульового захисного провідника і перерозподілом
напруги в мережі при протіканні струму короткого замикання.
Тому, занулення забезпечує захист від ураження електричним струмом
при замиканні на корпус за рахунок обмеження часу проходження струму
через тіло людини і за рахунок зниження напруги дотику.
Надійність занулення визначається в основному надійністю нульового
захисного провідника. У зв'язку з цим потрібна ретельна прокладка нульового
захисного провідника, щоб унеможливити його обрив. Крім того, в нульовому
захисному провіднику забороняється ставити вимикачі, запобіжники і інші
пристрої, здатні порушити його цілісність. При з'єднанні нульових захисних
провідників між собою повинен забезпечуватися надійний контакт.
Приєднання нульових захисних провідників до частин електроустановок, що
підлягають зануленню, здійснюється зваркою або болтовим з'єднанням,
причому, значення опору між зануляющим болтом і кожною доступною
дотику металевою неструмопровідною частиною електроустановки, яка може
опинитися під напругою, не повинно перевищувати 0,1 Ом. Приєднання має
бути доступне для огляду. Нульові захисні дроти і відкрито прокладені нульові
захисні провідники повинні мати відмітне забарвлення: по зеленому фону
жовті смуги.
В процесі експлуатації занулення опір петлі «фаза-нуль» може мінятися,
отже, необхідно періодично контролювати значення цього опору.
Вимірювання опору петлі «фаза-нуль» проводять як після закінчення
монтажних робіт, тобто при приймально-здавальних випробуваннях, так і в
процесі експлуатації в терміни, встановлені в нормативно технічній
Арк.
СКТК18.023083.248 ПЗ
59
Змн. Арк. № докум. Підпис Дата
документації, а також при проведенні капітальних ремонтів і реконструкцій
мережі.
Розрахунок занулення має на меті визначити умови, при яких воно
надійно виконує покладені на нього завдання, - швидко відключає
пошкоджену установку від мережі і в той же час забезпечує безпеку дотику
людини до зануленого корпусу в аварійний період.
Захисним відключенням називається автоматичне відключення
електроустановок при однофазному дотику до частин, що знаходяться під
напругою, неприпустимою для людини, і (або) при виникненні в
електроустановці струму витоку (замикання), що перевищує задані значення.
Призначення захисного відключення – забезпечення електробезпеки, що
досягається за рахунок обмеження часу дії небезпечного струму на людину.
Захист здійснюється спеціальним пристроєм захисного відключення (ПЗВ),
який забезпечує електробезпеку при дотику людини до струмопровідних
частин устаткування, дозволяє здійснювати постійний контроль ізоляції,
відключає установку при замиканні струмопровідних частин на землю. Для
захисту людей від ураження електричним струмом застосовуються ПЗВ із
струмом спрацьовування не більше 30 мА.
Сфера застосування захисного відключення: електроустановки в
мережах з будь-якою напругою і будь-яким режимом нейтралі. Найбільше
поширення захисне відключення набуло в електроустановках,
використовуваних в мережах напругою до 1 кВ із заземленою або ізольованою
нейтраллю.
Принцип роботи ПЗВ полягає в тому, що він постійно контролює
вхідний сигнал і порівнює його із заданою величиною. Якщо вхідний сигнал
перевищує цю величину, то пристрій відключає захищену електроустановку
від мережі. Як вхідні сигнали пристроїв захисного відключення
використовують різні параметри електричних мереж, які несуть в собі
інформацію про умови ураження людини електричним струмом. ПЗВ реагує
Арк.
СКТК18.023083.248 ПЗ
60
Змн. Арк. № докум. Підпис Дата
на «струм витоку» і протягом сотих доль секунди відключає електрику,
захищаючи людину від ураження електричним струмом, воно уловлює
щонайменший витік струму і розмикає контакти.
Рисунок 4.2 – Області застосування, переваги та недоліки пристроїв
захисного вимкнення різноманітних типів
Арк.
СКТК18.023083.248 ПЗ
Змн. 61
Арк. № докум. Підпис Дата
Конструктивно ПЗВ бувають двох видів:
- електронні, залежні від напруги живлення, їх механізм для виконання
операції відключення потребує енергії, що отримується або від
контрольованої мережі, або від зовнішнього джерела;
- електромеханічні, незалежні від напруги живлення, вони дорожче
електронних ПЗВ, але мають більшу чутливість. Джерелом енергії, необхідної
для функціонування таких ПЗВ є сам вхідний сигнал – диференціальний
струм, на який воно реагує.
Рисунок 4.3 - Схема пристрою захисного вимкнення
Всі ПЗВ за вхідним сигналом класифікують на декілька типів:
- що реагує на напругу корпусу щодо землі;
- що реагує на диференціальний (залишковий) струм;
- що реагує на комбінований вхідний сигнал;
- що реагує на струм замикання на землю;
Арк.
СКТК18.023083.248 ПЗ
62
Змн. Арк. № докум. Підпис Дата
- що реагує на оперативний струм (постійний; змінний 50 Гц);
- що реагує на напругу нульової послідовності.
Застосування ПЗВ повинне здійснюватися відповідно до Правил
улаштування електроустановок (ПУЕ).
Для захисту людини від ураження струмом пропонується ПЗВ Schneider
iLD Acti9. Модульні диференціальні вимикачі Schneider iID Acti 9 iID
забезпечують повну координацію з автоматичними вимикачами, що гарантує
абсолютний захист людей від ураження електричним струмом, а устаткування
– від пошкодження і загоряння, а також підвищену безперебійність роботи.
Ці пристрої мають наступні характеристики:
- електробезпека класу 2: постійна безпека для операторів і
некваліфікованого персоналу;
- завадозахищений диференційний захист: краща безперебійність
роботи, особливо з апаратами нового типу Si (надзавадозахищений) в мережах
з високим рівнем завад та у важких умовах навколишнього середовища;
Рисунок 4.4 – Диференційний вимикач навантаження Schneider iLD K4P 25A
- уставка спрацьовування 30 мА: захист людей при прямому дотику
(відповідно до МЕК 60364);
Арк.
СКТК18.023083.248 ПЗ
63
Змн. Арк. № докум. Підпис Дата
- уставки спрацьовування 100 мА, 300 мА, 500 мА: додатковий захист
обладнання від загоряння і захист людей від непрямого дотику (відповідно до
МЕК 60364);
- виконання селективного захисту: забезпечує коректну селективність
між декількома диференційними вимикачами – першим спрацьовує пристрій
захисту, найближчим до місця пошкодження;
- повна координація захисту з автоматичними вимикачами Acti9 і Multi9;
- відповідність стандарту МЕК/EN 61008-1, підтверджене офіційними
національними органами з сертифікації;
- придатні для секціонування в промислових електроустановках у
відповідності зі стандартом МЕК/EN 60947-2;
- робоча напруга: 400 В змінного струму, напруга ізоляції: 500 В.
Застосування пристроїв:
- захист в будь-яких промислових і громадських будівлях від:
ураження електричним струмом, відповідна МЕК 60364 і національним
стандартам;
- захист від небезпеки загоряння, викликаного протіканням струму
витоку з електричних установок через конструкції будівлі.
Технічні характеристики модульного диференційного
вимикача iID Acti 9 iID:
Кількість полюсів: 4 полюси
Номінальний вимикаючий диференційний струм: 30 мА
Номінальний струм: 25 А
Тип : АС
Спосіб монтажу: монтаж на DIN рейку
Мінімальний/максимальний перетин проводу, що підключається: 1 / 25мм2
Арк.
СКТК18.023083.248 ПЗ
64
Змн. Арк. № докум. Підпис Дата
ВИСНОВОК
У ході проведеної роботи було проведено огляд теорії розпізнавання
образів та ідентифікації людей. Згідно з даними найбільш зручним і швидким
у реалізації та застосуванні є метод Віоли-Джонса, на основі якого і було
виконано цю дипломну роботу. Цей метод базується на технології нейронних
мереж, яка значно спрощує завдання детектування об'єктів.
Відповідно до поставленого завдання був розроблений власний алгоритм
розпізнавання обєктів, процес створення якого та подальша перевірка якого
представлені у третій розділі. При використанні відкритого ресурсу бібліотеки
OpenCV програмний продукт працює успішно.
Згідно з вищесказаним можна зробити висновок, що всі поставлені в на
початку роботи завдання були виконані успішно. Отримані результати
показують, що технологія штучних нейронних мереж дозволяє швидко
вирішити задачу виявлення та розрізнення об’єктів, що може бути використане
практично повсюдно у житті людини. Проте слід зазначити, що у цій роботі
були використані нейронні мережі найпростішої архітектури, та при
ускладнення архітектури нейронних мереж, застосування ширших моделей,
застосуванні додаткових методів можна досягти більшої точності при
розпізнаванні образів. Крім того розвиток нейронних мереж призводить до
підвищення вимог до апаратних можливостям ЕОМ.
Арк.
СКТК18.023083.248 ПЗ
65
Змн. Арк. № докум. Підпис Дата
СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ
1. Г.А. Кухарев,Н.Л. Щеголева., Системы распознавания человека по
изображению лица /– СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 2006. – 176 с.
2. Van Veen F. The neural network zoo //The Asimov Institute, 2016.
3. McCulloch W. S., Pitts W. A logical calculus of the ideas immanent in
nervous activity //The bulletin of mathematical biophysics. – 1943. – Т. 5. – №. 4. –
С. 115–133.
4. Ripley B. D. Pattern recognition and neural networks. – Cambridge
university press, 2007.
5. LeCun Y. et al. Gradient-based learning applied to document
recognition //Proceedings of the IEEE. – 1998. – Т. 86. – №. 11. – С. 2278–2324.
6. Viola P., Jones M. Rapid object detection using a boosted cascade of
sim-ple features //Computer Vision and Pattern Recognition, 2001. CVPR 2001.
Pro79 ceedings of the 2001 IEEE Computer Society Conference on. – IEEE, 2001.
– Т. 1. – С. 137–138.
7. Viola P., Jones M. J. Robust real-time face detection //International
joural of computer vision. – 2004. – Т. 57. – №. 2. – С. 137–154.
8. Gary Bradski, Adrian Kaehler. Learning OpenCV. Computer vision
with the OpenCV library. 2008.
9. RASPBERRY PI 3 MODEL B+. URL: https://www.digikey.com/en/
products/detail/raspberry-pi/RASPBERRY-PI-3-MODEL-B/8571724 (дата
звернення 05.04.2021 р).
10. Install TensorFlow. URL: https://www.tensorflow.org/install (дата
звернення 17.04.2021 р.).
11. TensorFlow Datasets: a collection of ready-to-use datasets. URL:
https://www.tensorflow.org/datasets (дата звернення 17.04.2021 р.)
12. Магда Ю. Raspberry Pi. Руководство по настройке и применению.
Litres. 2017 р. 161 с.
Арк.
СКТК18.023083.248 ПЗ
66
Змн. Арк. № докум. Підпис Дата
13. Slaughter D.C. Autonomous robotic weed control systems: A review.,
Comput. Electron. Agric. / Slaughter, D.C.; Giles, D.K.; Downey, D. // 2008, P. 63
– 78.
14. Shalal N. A review of autonomous navigation systems in agricultural
environments. In Proceedings of the SEAg 2013: Innovative Agricultural
Technologies for a Sustainable Future, Barton, Australia, / Low, T.; McCarthy, C.;
Hancock, N. // 22–25 September 2013, Available: http://eprints.usq.edu.au/24779/.
15. Mousazadeh, H. A technical review on navigation systems of
agricultural autonomous off-road vehicles / Mousazadeh, H., J. Terramech. // 2013,
P. 211–230.
16. Meyer G.E. Verification of color vegetation indices for automated crop
imaging applications. / Meyer G.E., Camargo-Neto J. //, 2008 Comput. Electron., P.
293.
17. Zheng, L. Mean-shift-based color segmentation of images containing
green vegetation./ Zheng, L., Zhang, J.; Wang, Q. // Comput. Electron. Agric. 2009,
P. 93–98.
18. Wikipedia. Autonomous cars. [Online]. Available:
https://en.wikipedia.org/wiki/ Autonomous car.
19. U. Z. A. Hamid “Current collision mitigation technologies for
advanced driver assistance systems ˆaa survey,” / U. Z. A. Hamid, K. Pushkin, H.
Zamzuri, D. Gueraiche, and M. A. A. Rahman // PERINTIS eJournal, vol. 6, no. 2,
2016.
20. НПАОП 0.00-7.15-18 «Вимоги щодо безпеки та захисту здоров’я
працівників під час роботи з екранними пристроями». Київ. 2018.
21. Катренко Л.А., Катренко А.В. Охорона праці в галузі
комп’ютинґу. Львів: Магнолія-2006. 2012. 544 с.
22. Бедрій Я. Основи охорони праці користувачів персональних
комп’ютерів: навчальний посібник для студентів ВНЗ та інженерів-практиків.
Навчальна книга-Богдан. 2014. 144 с.
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. 67
№ докум. Підпис Дата
ДОДАТКИ
Додаток А
Арк.
СКТК18.023083.248 ПЗ
Змн. Арк. № докум. 68
Підпис Дата
Програмний код моделі виявлення відстеження та розпізнавання
об’єктів
Арк.
СКТК18.023083.248 ПЗ
69
Змн. Арк. № докум. Підпис Дата