Телефон: 8(962) 7600-119

ОПРЕДЕЛЕНИЕ И ОЦЕНКА ОПТИМАЛЬНОГО АЛГОРИТМА РАСПОЗНАВАНИЯ ОБРАЗОВ ДЛЯ ДИАГНОСТИКИ КАРИЕСА

УДК 616-079.1

 

Определение и оценка оптимального алгоритма

распознавания образов для диагностики кариеса

 

А.Ю. Шанина, студентка

Новгородский государственный университет имени Ярослава Мудрого

(173017, Россия, г. Великий Новгород, ул. Большая Санкт-Петербургская, 41)

E-mail: Artitova99@yandex.ru

 

Аннотация. В данной статье проведена оценка различных алгоритмов распознавания образов для диагностики кариеса по рентгеновским снимкам, а также определен оптимальный алгоритм по параметру усреднённой средней точности распознавания (mAP).

Ключевые слова: искусственный интеллект, стоматология, диагностика, лечение, профилактика, инновации.

 

Введение

 

В современном мире медицина активно применяет технологии искусственного интеллекта и компьютерного зрения для диагностики заболеваний. В частности, распознавание образов является важной задачей, когда речь идет о выявлении кариеса. В данной статье будет рассмотрена эффективность алгоритмов распознавания образов для диагностики кариеса и возможность применения. Рассмотрим как базовые методы распознавания образов, так и новые разработки в этой области. Кроме того, будут рассмотрены преимущества и недостатки различных методов и предложены рекомендации по выбору оптимального алгоритма для диагностики кариеса.

 

Основные методы распознавания образов для диагностики кариеса

 

Распознавание образов является одной из самых перспективных областей развития в медицине [1]. В стоматологии распознавание образов может найти применение в диагностике, лечении и профилактике заболеваний полости рта. Рассмотрим подробнее, как ИИ может быть применен в стоматологии.

Диагностика

Для начала рассмотрим использование ИИ в диагностике заболеваний полости рта. Наиболее часто встречающимся заболеванием является кариес. Для определения заболеваний полости рта используются методы визуальной оценки и рентгенологические исследования. Однако визуальная оценка не всегда позволяет точно определить наличие заболевания и его степень, а рентгенологические исследования могут нанести вред здоровью пациента. Именно здесь ИИ может оказаться очень полезным.

Одним из методов использования ИИ в диагностике заболеваний полости рта является анализ изображений. При этом ИИ используется для анализа рентгеновских снимков и фотографий зубов и десен [2], [3]. Нейронные сети, обученные на большом количестве данных, могут с большой точностью определять наличие кариеса и других заболеваний полости рта.

Одним из проектов, использующих ИИ в стоматологии, является «Диагностика кариеса» от компании Dental Monitoring. Этот проект использует ИИ для определения наличия кариеса на фотографии зубов. На основе данных, полученных в результате анализа, пациентам предоставляется точная диагностика и рекомендации по лечению.

Лечение

Кроме диагностики ИИ может быть использован для повышения эффективности лечения заболеваний полости рта. Например, при лечении пародонтоза может быть использован ИИ для определения оптимального курса лечения, который будет наиболее эффективным для каждого конкретного пациента.

Еще одним примером применения ИИ в лечении заболеваний полости рта является создание индивидуальных протезов и имплантатов. Используя ИИ, можно создавать протезы и имплантаты, которые идеально подходят для каждого пациента, учитывая его индивидуальные анатомические особенности и потребности [4].

Профилактика

Кроме диагностики и лечения ИИ может быть использован для профилактики заболеваний полости рта. Например, при помощи ИИ можно разрабатывать индивидуальные программы профилактики для каждого пациента, учитывая его анатомические особенности, образ жизни и пищевые привычки.

Целью данной работы является определение и оценка оптимального алгоритма распознавания образов для диагностики кариеса по рентгеновским снимкам полости рта.

Многие исследования показали, что компьютерные программы, основанные на алгоритмах распознавания образов, могут повысить точность диагностики кариеса. Такие программы могут быстро и точно анализировать рентгеновские снимки и определять наличие кариеса даже на ранних стадиях развития.

Однако не все алгоритмы одинаково эффективны, и выбор наилучшего из них может быть сложной задачей.

Методы распознавания образов:

R-CNN (Region-based Convolutional Neural Networks) – это метод распознавания объектов в изображениях. Он состоит из двух основных компонентов [5]:

– Генерации кандидатов на объекты в изображении (region proposals);

– Классификации и локализации найденных объектов с помощью Convolutional Neural Networks (CNN).

Генерация кандидатов на объекты происходит с помощью алгоритма Selective Search. Он использует сложную комбинацию разных методов, чтобы распознать потенциальные области, где находятся объекты. Затем, каждая область сжимается до стандартного размера и пропускается через предварительно обученную свёрточную нейронную сеть, которая для каждой области распознает, насколько она является объектом, и выдает вероятности наличия различных классов в данной области.

В отличие от стандартных алгоритмов распознавания объектов, R-CNN обрабатывает всех кандидатов на объекты по отдельности, что приводит к высокой нагрузке на память и большому времени обработки. Кроме того, R-CNN влечет за собой значительные затраты на обучение и требует большого количества данных для построения качественной модели.

Однако, несмотря на эти недостатки, R-CNN оказался эффективным методом распознавания объектов в изображениях с высокой точностью. Его успех заложил основу для разработки более эффективных алгоритмов, таких как Fast R-CNN и Faster R-CNN, которые улучшили производительность метода, сократили время обучения и увеличили точность распознавания объектов.

Fast R-CNN – это улучшенная версия алгоритма R-CNN для распознавания объектов в изображениях. За счет оптимизации и ускорения, Fast R-CNN значительно превосходит R-CNN по производительности и точности.

В отличие от R-CNN, где каждая область изображения обрабатывается отдельно, Fast R-CNN использует свёрточную сеть для обработки всего изображения один раз. Кроме того, Fast R-CNN предлагает новый метод объединения признаков (RoI), который позволяет использовать свойства каждого признака для повышения точности и сокращения времени обработки изображений.

В Fast R-CNN первоначально обрабатывается изображение целиком с помощью CNN. Классификация и локализация объектов осуществляются в одном проходе, что снижает затраты времени на вычисления и увеличивает скорость обработки.

Одним из новых улучшений Fast R-CNN является предварительная обработка данных в виде кэширования особенностей, что позволяет повторно использовать данные и ускоряет процесс обучения.

Fast R-CNN показывает высокую точность и быстродействие в сравнении с R-CNN, а также высокие показатели скорости обработки объектов.

Region-based Fully Convolutional Network (R-FCN) – это метод обнаружения объектов в изображениях, основанный на использовании полносвязных свёрточных сетей. Он был представлен исследовательской группой из Microsoft Research Asia в 2016 году и продемонстрировал превосходную точность сегментации объектов.

Один из основных недостатков предыдущих методов обнаружения объектов – это то, что они требовали повторной обработки одной и той же части изображения для каждого кандидата на объект. Это создавало большую нагрузку на вычислительные ресурсы и замедляло процесс обработки изображений. Метод R-FCN решает эту проблему, используя полностью сверточную архитектуру сети.

Другим улучшением метода R-FCN является использование дополнительного модуля «position-sensitive» (PS) в выходных слоях сети для локализации объектов. Этот модуль разделяет каждый RoI на более мелкие части и определяет, в какой части карты объекта находится. Это позволяет более точно определить положение объекта и увеличить точность обнаружения.

Метод R-FCN продемонстрировал высокую производительность и точность в обнаружении объектов на изображениях. Более того, этот метод быстро обрабатывает изображения, благодаря использованию полностью свёрточной архитектуры сети и использованию PS-модуля локализации объекта.

You Only Look Once (YOLO) – это метод обнаружения объектов в изображениях, который был представлен в 2016 году и является одним из наиболее быстрых и эффективных методов обнаружения объектов [5].

Особенностью YOLO является то, что он использует единственную свёрточную нейронную сеть, которая пропускается через весь массив изображения. Это значит, что обработка изображения и обнаружение объектов происходят быстрее, так как нет необходимости повторно обрабатывать одни и те же области изображений.

В процессе обработки изображения, сеть разбивается на сетку пикселей, и каждый пиксель предсказывает наличие объекта в соответствующей области. Далее для каждого пикселя процесс классификации и определения координат объекта происходит в рамках заданного значения порога. Если максимальное значение сигнала сети в пространственном поле превышает порог, то мы считаем, что объект обнаружен в данной области, и начинаем определять класс объекта и его координаты.

Одним из преимуществ YOLO является его скорость. Этот метод способен быстро обрабатывать изображения, что делает его идеальным выбором для обработки в режиме реального времени. Еще одним преимуществом является то, что YOLO дает прогноз на основе всего изображения, что значит, что состояние объекта будет обновляться на всем изображении и не будет глухих или неопределённых зон в отличие от методов Region-based.

Недостатком YOLO является слабая точность определения мелких объектов на изображении, затруднения в работе с пересекающимися объектами.

InternImage-H – это инновационная технология, разработанная компанией Internexa, которая предназначена для распознавания больших объемов изображений в режиме реального времени. InternImage-H может быть использована в различных сферах, где требуется обработка большого количества изображений.

Основными преимуществами технологии InternImage-H являются:

  • Высокая скорость обработки. InternImage-H способна обрабатывать до 5 000 изображений в секунду, что позволяет ей работать в режиме реального времени.
  • Высокая точность распознавания. В основе технологии InternImage-H лежат алгоритмы машинного обучения и нейросетей, которые обеспечивают высокую точность распознавания изображений.
  • Расширяемость. Технология InternImage-H легко масштабируется и может быть адаптирована в соответствии с требованиями конкретной задачи.
  • Гибкость. InternImage-H может использоваться для различных задач обработки изображений, в том числе для распознавания объектов, лиц, символов и т.д.
  • Простота использования. InternImage-H имеет интуитивно понятный интерфейс и может быть легко интегрирована с другими приложениями и системами.

Технология InternImage-H может быть использована во многих областях, где требуется обработка больших объемов изображений, например, в медицине, системах безопасности, транспорте и т.д. Она может помочь автоматизировать м5ногие процессы и увеличить эффективность работы систем компьютерного зрения.

Single Shot MultiBox Detector (SSD) – это метод компьютерного зрения для обнаружения объектов на изображениях [5]. Он был разработан компанией Google и был представлен в 2016 году.

Основное преимущество метода SSD заключается в том, что он способен быстро и точно находить объекты на изображениях. Он использует сверточные нейронные сети для извлечения признаков объектов из изображений, после чего применяется метод MultiBox для создания детектора объектов, который может быстро обнаруживать объекты разных типов и размеров.

SSD может работать на изображениях любого размера и в режиме реального времени, что делает его широко применимым в различных областях, таких как автоматическое распознавание номерных знаков, системы безопасности и распознавание людей на видео.

Основными преимуществами SSD являются:

  • Высокая скорость работы;
  • Высокая точность обнаружения объектов;
  • Работа с различными типами изображений;
  • Наличие открытого исходного кода, что позволяет разработчикам исследовать и усовершенствовать алгоритм;
  • Легкость в использовании и интеграции с другими системами.

SSD успел завоевать популярность и широко используется в различных приложениях.

 

Оценка эффективности алгоритмов распознавания образов

 

Оценка эффективности алгоритмов распознавания образов – это важный этап при разработке систем компьютерного зрения для автоматического распознавания различных объектов, лиц, символов и т.д. Она позволяет определить точность работы алгоритма, оценить скорость обработки и оптимальные параметры его настройки.

Для оценки эффективности алгоритмов распознавания образов используются различные метрики. Одна из самых распространенных метрик – это точность (precision) и полнота (recall). Точность означает долю правильно распознанных объектов относительно общего количества обнаруженных объектов. Полнота определяет долю правильно распознанных объектов относительно общего количества настоящих объектов на изображении. Однако, часто алгоритмы распознавания образов сравниваются по показателю усреднённой средней точности – mAP (mean average precision), данный показатель представляет собой усреднённую площадь под графиком зависимости точности от полноты для всех элементов опорной выборки, способ расчёта mAP представлен на рисунке 1.

 

 

Рис. 1. График зависимости полноты распознавания объектов от заданной точности

 

Таким образом, применяя методику, указанную выше, был проведён сравнительный анализ различных моделей распознавания на базе опорной выборки PASCAL VOC 2007. Результаты тестирования представлены в таблице 1.

 

Таблица 1

Результаты тестирования рассматриваемых алгоритмов распознавания образов

на опорной выборке PASCAL VOC 2007

№ п/п

Наименование алгоритма

Вид нейронной сети

Усреднённая средняя точность mAP ( %)

Возможность

распознавания

в реальном масштабе времени

1

SSD

Одиночная глубокая нейронная сеть

81.6

Нет

2

YOLO

Сверточная

63.4

Да

3

Fast R-CNN

Сверточная

70.0

Нет

4

R-CNN

Сверточная

58.5

Нет

5

InternImage-H

Сверточная

94

Да

6

R-FCN

Сверточная

82

Нет

 

Анализируя данные, представленные в таблице № 1, можно сделать вывод, что:

  • Наиболее популярными являются алгоритмы распознавания образов на базе свёрточных нейронных сетей.
  • Распознавать изображения в реальном масштабе времени из представленных алгоритмов могут YOLO и InternImage-H, что позволяет проводить диагностику в процессе снятия снимков.
  • Самые высокие результаты по параметру усредненной средней точности распознавания самые высокие показатели у алгоритма InternImage-H.

Таким образом, по результатам проведённого анализа можно сделать вывод, что оптимальным алгоритмом, для решения задачи диагностики с точки зрения точности распознавания кариеса является InternImage-H. Он позволяет проводить диагностику в реальном масштабе времени, с высокой точностью.

 

 

СПИСОК ЛИТЕРАТУРЫ

  1. 27.01.18 / [Электронный ресурс]. – Режим доступа: https://vc.ru/future/32237-budushchee-uzhe-nastupilo-kak-iskusstvennyy-intellekt-primenyaetsya-v-medicine (дата обращения 01.03.23).
  2. 08.07.22 / [Электронный ресурс]. – Режим доступа: https://pubmed.ncbi.nlm.nih.gov/35885796/ (дата обращения 10.03.23).
  3. 11.11.20 / [Электронный ресурс]. – Режим доступа: https://pubmed.ncbi.nlm.nih.gov/33176533/ (дата обращения 12.03.23).
  4. 14.04.20 / [Электронный ресурс]. – Режим доступа: https://pubmed.ncbi.nlm.nih.gov/32295304/ (дата обращения 17.03.23).
  5. 09.07.18 / [Электронный ресурс]. – Режим доступа: https://habr.com/ru/articles/709432/ (дата обращения 25.03.23).

 

REFERENCES

  1. 27.01.18 / [Electronic resource]. – Access mode: https://vc.ru/future/32237-budushchee-uzhe-nastupilo-kak-iskusstvennyy-intellekt-primenyaetsya-v-medicine (accessed on 01.03.23).
  2. 08.07.22 / [Electronic resource]. – Access mode: https://pubmed.ncbi.nlm.nih.gov/35885796/ (accessed on 10.03.23).
  3. 11.11.20 / [Electronic resource]. – Access mode: https://pubmed.ncbi.nlm.nih.gov/33176533/ (accessed on 12.03.23).
  4. 14.04.20 / [Electronic resource]. – Access mode: https://pubmed.ncbi.nlm.nih.gov/32295304/ (accessed on 17.03.23).
  5. 09.07.18 / [Electronic resource]. – Access mode: https://habr.com/ru/articles/709432/ (accessed on 25.03.23).

 

Материал поступил в редакцию 22.05.23

 

 

DETERMINATION AND EVALUATION OF THE OPTIMAL PATTERN

RECOGNITION ALGORITHM FOR THE DIAGNOSIS OF CARIES

 

A.Iu. Shanina, Student

Novgorod State University named after Yaroslav the Wise,

(173017, Russia, Veliky Novgorod, Bolshaya St. Petersburg Street, 41)

E-mail: Artitova99@yandex.ru

 

Abstract. This article evaluates various pattern recognition algorithms for the diagnosis of caries from X-ray images, as well as determines the optimal algorithm for the parameter of averaged average recognition accuracy.

Keywords: artificial intelligence, dentistry, diagnostics, treatment, prevention, innovation.