Телефон: 8(962) 7600-119

ПЕРСПЕКТИВНОСТЬ ИСПОЛЬЗОВАНИЯ GPT ЧАТ-БОТОВ ДЛЯ ДИАГНОСТИКИ ТЕНДИНИТА СУХОЖИЛИЯ ДЛИННОГО СГИБАТЕЛЯ ПЕРВОГО ПАЛЬЦА СТОПЫ У ДЕТЕЙ

УДК 617.585

 

Перспективность использования GPT чат-ботов

для диагностики тендинита сухожилия длинного

сгибателя первого пальца стопы у детей

 

И.О. Еренков, кандидат медицинских наук, врач-травматолог-ортопед

МЧУ «Отраслевой клинико-диагностический центр ПАО «Газпром»

(197229, Россия, г. Санкт-Петербург, вн.тер. г. Муниципальный Округ Лахта-ольгино,

пр-кт Лахтинский, д. 2, к. 3, стр. 1)

E-mail: erenkov_i@mail.ru

 

Аннотация. Вариабельность клинической картины при тендините сухожилия длинного сгибателя первого пальца стопы в детском возрасте на фоне занятий различными видами спорта обязывает к более пристальному вниманию при осмотре детей с жалобами на боли в области голеностопного сустава и стопы. Последующее применение методов инструментальной диагностики способствует окончательной постановке диагноза. При этом использование программных приложений различных нейросетей, функционал которых дополнен методами машинного обучения, предоставляет новые возможности для диагностического поиска.   Материалы и методы. Представлены результаты обследований 20 детей с болями в области заднего отдела голеностопного сустава и в области стоп в различных локациях, с подозрением на тендинит сухожилия длинного сгибателя первого пальца стопы. Для последующего анализа медицинской информации об изучаемых пациентах в качестве оценщиков были привлечены два чат-бота, использующие GPT технологии - GPT-5 и DeepSeek-R1. Результаты. Анализ полученных результатов проводился по индивидуальным показателям, а также с использованием каппы Коэна и каппы Флейсса. Значения показателей составили от 0.65, вплоть до отрицательных значений, в зависимости от исследуемого аспекта. Заключение. GPT чат-боты находят свое применение в диагностике некоторых патологий голеностопного сустава и стопы у детей. Однако их использование требует разумного подхода к интерпретации и критическому анализу представляемой информации.

Ключевые слова: GPT чат-бот, искусственный интеллект, GPT-5, DeepSeek R1, тендинит сухожилия сгибателя, дети.

 

Введение

Расширение функционала искусственного интеллекта, увеличивающийся в последние годы, способствует оптимальному планированию и реализации активностей повседневной значимости, а также совершенствованию возможностей по решению задач профессиональной направленности, приоритетным из которых, являются диагностические методы обследования [14]. Реализация такой возможности зависима от корректности проводимого машинного обучения на начальном этапе, а также способностью уже самой нейросетью, в последующем, активировать процесс самообучения [16]. При этом разнообразие клинической картины, типичной, например, для некоторых отклонений развития и функционирования костно-мышечной системы у детей, вероятно, может создавать затруднения для программных приложений нейросетей по интерпретации тех или иных клинических проявлений. Одним из таких нарушений, отмеченное в области заднего отдела голеностопного сустава и на уровне стопы является тендинит сухожилия длинного сгибателя 1 пальца стопы (FHL-тендинит), проявляющийся либо в виде самостоятельного состояния, либо на фоне заднего импиджмент синдрома голеностопного сустава (PAI-синдром) [6]. Предпосылками к развитию тендинита длинного сгибателя первого пальца стопы помимо чрезмерных повторяющихся движений и/или длительных перенапряжений, возникающих при физических активностях, в том числе и профессионального характера, являются также особенности топографического позиционирования сухожилия в виде его частичного лоцирования в ограниченных пространствах. К таким структурам на уровне заднего отдела голеностопного сустава относится межбугорковая борозда заднего отростка таранной кости, ограниченная сзади плотной соединительно-тканной пластинкой (retrotalar pulley) толщиной до 1,5 мм, окружающее сухожилие длинного сгибателя первого пальца стопы, а также соответствующий костно-фиброзный канал удерживателя сухожилий сгибателей (Retinaculum musculorum flexorum) (зона 1) [17]. В области среднего отдела стопы по медиальному краю в проекции ладьевидной кости – место близкого прилегания сухожилий длинного сгибателя пальцев стопы, длинного сгибателя 1 пальца стопы и квадратной мышцы подошвы – узел Генри (Master knot of Henry) (зона 2) [19]. На уровне первого плюснефалангового сустава - в борозде, ограниченной сесамовидными костями и межсесамовидной связкой (зона 3) [4]. Присутствие различных анатомических вариаций заднего отростка таранной кости, вариабельность формирования добавочных костных и мягко-тканных структур, вероятность проявлений таких патологий как апофизит бугра пяточной кости и тендинит ахиллого сухожилия, способствуют разнообразию клинической картины в заднем отделе голеностопного сустава не только при FHL-тендините, но и при развитии PAI-синдрома [11]. Поэтому целью исследования явилось изучение возможностей программных приложений различимых нейросетей в диагностике тендинита сухожилия длинного сгибателя первого пальца стопы у детей.

Материалы и методы

Были изучены 120 историй болезней детей, обращавшихся в период с января 2021 года по июнь 2025 года с жалобами на боли заднем отделе голеностопного сустава и в области стопы в различных локациях. Из общего количества было отобрано 20 историй болезней детей (10 мальчиков и 10 девочек) в возрасте от 7 до 17 лет (средний возраст – 12 лет 4 месяца), у которых данные первичного осмотра сопоставлялись с клинической картиной FHL-тендинита, с последующим подтверждением либо исключением данного диагноза по результатам проведенных дообследований и дифференциальной диагностики с другими состояниями. В изучаемой группе 19 из 20 детей регулярно посещали спортивные секции – футбол и танцы (по 4 человека соответственно), баскетбол, волейбол, теннис, контактные виды спорта (в каждом виде по 2 ребенка), легкая атлетика, спортивная гимнастика, фитнес-студия (в каждом виде по 1 ребенку).  Длительность болей в области голеностопных суставов и стоп у всех 20 детей (у 3 детей в обоих суставах, у остальных либо в левом, либо в правом) отмечалась от 1 недели (2 детей) до 6 лет (1 ребенок), в среднем – 15 месяцев, возникавшие во время физических активностей, преимущественно, при занятиях спортом (у 19 из 20 детей). Сводные данные представлены в таблице 1.

 

Таблица 1

Особенности клинической картины обследуемых пациентов

 

пациент

локация болей

Jack-тест

FHL strech test

ахиллово сухожилие

по задней поверхности дистального отдела голени

в зонах 2 и 3

задний край медиальной лодыжки

задний отростк таранной кости

сочетанная

1

 

 

 

 

 

*

Y

 

2

 

 

 

*

 

 

N

N

3 и 4

 

*

 

 

 

 

N

 

5 и 9

 

 

 

 

*

 

N

 

6 и 17

*

 

 

 

 

 

N

N

7,10,11,14

 

 

 

*

 

 

N

Y

8

*

 

 

 

 

 

N

 

12 и 18

 

 

*

 

 

 

Y

Y

13, 15 и 16

 

 

 

 

 

*

N

Y

19 и 20

 

 

*

 

 

 

Y

Y

 

Примечание; Y – положительное значение, при проведении теста отмечены изменения; N – отрицательное значение, при проведении теста отклонений не выявлено.

 

Исходя из результатов анамнеза и данных первичного осмотра, с проведением мануальных диагностических тестов (Jack-тест у всех пациентов, Flexor hallucis longus strech test – кроме пациентов 1, 3, 4, 5, 8 и 9) PAI-синдром – был заподозрен у пациентов 1, 2, 3, 4, 5, 9, тендинит ахиллого сухожилия – у пациентов 6, 8, 17, у остальных детей – FHL-тендинит. При повторном осмотре были проведены мануальные диагностические тесты в полном объеме всем детям. По данным рентгенологических обследований голеностопных суставов – патологий у обследуемых детей обнаружено не было. По данным ультразвукового обследования ахиллого сухожилия, диагноз тендинит ахиллого сухожилия был подтвержден у пациентов 6 и 17. МРТ-исследования голеностопных суставов (МРТ-исследование) были проведены всем детям с подозрением на PAI-синдром и пациенту 8 в связи сохраняющимся болевым синдромом и отсутствием отклонений по данным сонографического обследования ахиллого сухожилия. По результатам проведенных магнитно-резонансных томографий у пациента 1 был диагностирован апофизит бугров пяточных костей, а у пациентов 2 и 8 – PAI-синдром. У остальных пациентов по результатам МРТ-исследования выявлен FHL-тендинит.

Учитывая разнообразие клинической картины, результаты анамнеза и данных первичного осмотра, сведения по каждому из 20 детей были резюмированы и предложены для последующего анализа двум программным приложениям нейросетей по типу чат-бота, использующие различные модификации технологии GPT (Generative Pre-trained Transformer - генеративный предобученный трансформер), основанную на архитектуре трансформера с методикой самообучения и технологию обработки естественного языка (NLP) – для понимания запросов и генерации ответов (GPT чат-бот) [10]. Были отобраны технические модели, специализирующиеся по поддержке принятия медицинских решений, – GPT-5 чат-бот (GPT-5) и DeepSeek-R1 чат-бот (DSR-1), разработанные компаниями OpenAI Global LLC и Hangzhou DeepSeek Artificial Intelligence Co., Ltd. соответственно [12, 18]. После загрузки сведений о 20 обследуемых пациентах, исключая данные о результатах рентгенологических, сонографических и томографических обследованиях, обоим GPT чат-ботам были заданы 2 вопроса: «Соответствует ли клиническая картина FHL-тендиниту?», «Необходимо ли проведение МРТ исследования голеностопного сустава для исключения PAI-синдрома?». Формат ответа предполагал значения «да» или «нет» по каждому пациенту в отдельности. Полученные данные представлены в таблице 2.

 

Таблица 2

Результаты мнений GPT чат-ботов

пациент

FHL-тендинит?

МРТ для исключения PAI-синдрома?

GPT-5

DSR-1

GPT-5

DSR-1

1

нет

да

нет

нет

2,3,4,6,10,17

нет

нет

нет

нет

5

 нет

нет

да

нет

7

да

нет

да

нет

8,9

нет

да

да

нет

11,14,16,20

да

да

да

да

12,13,18

да

да

нет

нет

15

да

да

да

нет

19

да

да

нет

да

 

Результаты и обсуждение

Полученные результаты между GPT чат-ботами оценивались с использованием каппы Коэна (Cohen’s Kappa), общий анализ мнений (исследователь и 2 GPT чат-бота) - с помощью каппы Флейсса (Fleiss’s Kappa). Коэффициенты по обоим показателям интерпретировались следующим образом: слабое согласие (k> 0–0.2), незначимое (k> 0.21–0.4), умеренное (k> 0.41–0.6), существенное (k> 0.61–0.8) и полное согласие (k> 0.81–1.0) [8]. По первому вопросу значения составили 0.61 и 0.65 соответственно, по второму вопросу - показатель каппы Коэна составил 0.37, с отрицательным значением каппы Флейсса (-0.03) – полное отсутствие согласия. В отношении диагностики FHL-тендинита оба GPT чат-бота продемонстрировали более уверенную компетенцию, полное совпадение во мнениях отмечено по 9 из 15 пациентов с подтвержденным диагнозом, по данным повторного клинического осмотра и инструментальных дообследований и по 3 из 5 пациентов, без подтвержденной клинической картины тендинита сухожилия длинного сгибателя 1 пальца стопы. При анализе промптов о необходимости проведения МРТ-исследования для исключения PAI-синдрома, мнения GPT чат-ботов совпали по 4 из 15 пациентам с подтвержденным FHL – тендинитом и по 2 из 5 пациентов с другими патологиями. В отношении пациентов 12,18 и 19,20 у которых боль локализовалась в зоне 2 и зоне 3 соответственно, интерпретацию клинической картины в пользу FHL-тендинита продемонстрировали оба GPT чат-бота. Различия в необходимости в проведении МРТ-исследования выявлены только по 19 пациенту. Более точные значения по первому вопросу были представлены чат-ботом GPT-5 - (15 правильных ответов против 13 ответов оппонента), по второму вопросу чат-ботом DSR-1 (12 правильных ответов против 10 ответов оппонента). При этом чат-ботом DSR-1 были даны правильные ответы по обоим вопросам в отношении пациента 9 несмотря на то, что при первичном осмотре у него был заподозрен PAI-синдром. Следует, также, отметить особенности клинической картины пациентов 3 и 4 с локациями болей по задней поверхности дистального отдела голени. Оба GPT чат-бота не интерпретировали первичные промпты данных пациентов как клиническую картину тендинита сухожилия длинного сгибателя первого пальца стопы, не подтвердив также необходимость в проведении МРТ-исследования. При повторном осмотре, с проведением Flexor hallucis longus strech тестов и инструментальных дообследований был выявлен FHL-тендинит в обоих случаях. Несмотря на положительные результаты мануальных диагностических тестов, при данной локации болей проведение МРТ-исследования является целесообразным с целью исключения других патологий [9]. Как показали результаты обследования в отношении пациентов 1 и 9, а также данные из научной литературы, игнорирование проведения мануальных тестов может вызвать последующее затруднение при постановке правильного диагноза и назначению избыточных инструментальных обследований [7, 13].  

Применение в медицине программных приложений различных нейросетей со сопоставлением их характеристик является распространенной тенденцией, согласно литературным данным [3, 5, 15]. Однако результатов сравнительных исследований чат-ботов GPT-5 и DSR-1 с позиции их применения в клинической практике в научных публикациях пока не представлены. Активная разработка и внедрение систем искусственного интеллекта в клиническую практику сопряжено, по мнению ряда исследователей с определенными рисками, одним из которых является «предсказуемый вред», как одно из проявлений негативных последствий при использовании данных программных разработок. В качестве мер профилактики предлагается соблюдение принципов безопасности и прозрачности алгоритмов. учёт этических аспектов, а также акцент на мультидисциплинарный подход с участием разработчиков, врачей и специалистов по этике [1, 2].

Заключение

Использование GPT чат-ботов с целью диагностики некоторых заболеваний в области голеностопного сустава и в области стопы у детей носит опосредованный характер, обусловленное тем, что достоверность получаемых сведений зависима от информационной наполняемости открытых источников и особенностей активации функционала машинного обучения. Кроме этого, корректность получаемых ответных данных от таких программных приложений коррелирует с уровнем полноты и значимости вводимой информации, сохраняя, тем не менее, перспективную направленность взаимоотношений между человеком и искусственным интеллектом.

 

СПИСОК ЛИТЕРАТУРЫ

1. Бегишев, И.Р., Шутова, А.А. Концепция «предсказуемого вреда» при разработке медицинских изделий на основе искусственного интеллекта // Медицинская этика. – 2025. – T.2. – C. 9-14. doi: 10.24075/medet.2025.006.

2. Ратнер, Н.П. Этика искусственного интеллекта: вызовы, риски и решения // Вестник науки. – 2023. – Т. 1. - № 10(67). – С. 308-318.

3. Chan, L. et al. Deepseek-R1 and GPT-4 are comparable in a complex diagnostic challenge: a historical control study // International Journal of Surgery. – 2025. – V. 111. – No 6. Pp. 4056-4059. doi: 10.1097/JS9.0000000000002386.

4. Fiacco, R.C. et al. Relationship Between the Intersesamoid Ligament and Sesamoid Bones in Cadaveric Feet with Hallux Valgus // Cureus. – 2017. – V. 9. – No 11. – Pp. 1819. doi: 10.7759/cureus.1819.

5. Han, N.Y. et al. Enhancing oncological surveillance through large language model-assisted analysis: a comparative study of gpt-4 and gemini in evaluating oncological issues from serial abdominal ct scan reports // Acad. Radiol. – 2025. – V. 32. – No 5. –Pp. 2385-2391. doi: 10.1016/j.acra.2024.10.050.

6. Ishibashi, M.A. et al. Posterior Ankle Impingement Syndrome // Clin. Podiatr. Med. Surg. – 2023. – V. 40. – No 1. – Pp. 209-222. doi: 10.1016/j.cpm.2022.07.014.

7. Kushare, I. et al. Causes of delayed diagnosis of posterior ankle impingement in the pediatric and adolescent population // J. Foot (Edinb). – 2021. –  V. 47. – Pp. 101799. doi: 10.1016/j.foot.2021.101799.

8. Mchugh, M.L. Interrater reliability: the kappa statistic // Biochem Med (Zagreb). – 2012. – V. 22. – No 3. – Pp. 276-82.  doi: 10.11613/BM.2012.031.

9. Meter, J. et al. Pigmented villonodular synovitis of the flexor hallucis longus tendon: A rare cause of leg pain in a 12-year-old girl // Radiol. Case Rep. – 2024. – V. 19. – No 4. – Pp. 1258-1262. doi: 10.1016/j.radcr.2023.12.053.

10. Ouyang, L. et al. Training language models to follow instructions with human feedback // Advances in neural information processing systems. – 2022. – V. 35. – Pp. 27730-27744.

11. Pota, K. et al. Evaluation of the relations between foot and ankle pathologies and anatomic variations with magnetic resonance imaging of 849 study population // Jt. Dis. Relat. Surg. – 2025. – V. 36. – No 2. – Pp. 394-407. doi: 10.52312/ jdrs.2025.2146.

12. Puspitasari, F.D. et al. Deepseek Models: A Comprehensive Survey of Methods and Applications // Techrxiv. – 2025. doi: 10.36227/techrxiv.174198511.15158242/v1.

13. Ribbans, W.J. et al. The management of posterior ankle impingement syndrome in sport: a review // Foot Ankle Surg. – 2015. – V. 21. – No 1. – Pp. 1-10. doi: 10.1016/j.fas.2014.08.006.

14. Shaheen, M.Y. Applications of Artificial Intelligence (AI) in healthcare: A review //ScienceOpen Preprints. – 2021. doi: 10.14293/s2199-1006.1.sor-.ppvry8k.v1.

15. Singhal, K. et al. Toward expert-level medical question answering with large language models // Nat. Med. – 2025. – V. 31. – No 3. – Pp. 943-950. doi: 10.1038/s41591-024-03423-7.

16. Tehrani, S.S.M. et al. Visual transformer and deep CNN prediction of high-risk COVID-19 infected patients using fusion of CT images and clinical data // BMC Med. Inform. Decis. Mak. – 2023. – V. 23. – No 1. – P. 265. doi: 10.1186/s12911-023-02344-8.

17. Tzioupis, C. et al. Identification of the retrotalar pulley of the Flexor Hallucis Longus tendon // J. Anat. – 2019. – V. 235. – No 4. – Pp. 757-764. doi: 10.1111/joa.13046.

18. Wang, S. et al. Capabilities of gpt-5 on multimodal medical reasoning // Arxiv. Preprint. – 2025. – arxiv. P. 2508.08224.

19. Zhao, X.Y. et al. Anatomical Study of the Compositions and Internal Connections of the Chiasma Plantare (Master Knot of Henry): Exploring Its Possible Clinical Impact // J. Foot Ankle Surg. – 2019. – V. 58. – No 6. – Pp. 1235-1244. doi: 10.1053/j.jfas.2018.09.032.

 

REFERENCES

1. Begishev I.R., Shutova A.A. Koncepcia «predskazuemogo vreda» pri razrabotke medicinskih izdeliy na osnove iskusstvennogo intellekta [The concept of predictable harm in development of ai-powered medical devices medical ethics]. Medicinskaya etika [Medical ethics]. 2025. V.2. Pp. 9-14. doi: 10.24075/medet.2025.006. (In Russ.).

2. Ratner N.P. Etika iskusstvennogo intellekta: vyzovy, riski i resheniya [Ethics of artificial intelligence: challenges, risks and solutions]. Vestnik nauki. 2023. V. 1. No.10(67). Pp. 308-318. (In Russ.).

3. Chan L. et al. Deepseek-R1 and GPT-4 are comparable in a complex diagnostic challenge: a historical control study. International Journal of Surgery. 2025. V. 111. No 6. Pp. 4056-4059. doi: 10.1097/JS9.0000000000002386.

4. Fiacco R.C. et al. Relationship Between the Intersesamoid Ligament and Sesamoid Bones in Cadaveric Feet with Hallux Valgus. Cureus. 2017. V. 9. No 11. P. 1819. doi: 10.7759/cureus.1819.

5. Han N.Y. et al. Enhancing oncological surveillance through large language model-assisted analysis: a comparative study of gpt-4 and gemini in evaluating oncological issues from serial abdominal ct scan reports. Acad. Radiol. 2025. V. 32. No 5. Pp. 2385-2391. doi: 10.1016/j.acra.2024.10.050.

6. Ishibashi M.A. et al. Posterior Ankle Impingement Syndrome. Clin. Podiatr. Med. Surg. 2023. V. 40. No 1. Pp. 209-222. doi: 10.1016/j.cpm.2022.07.014.

7. Kushare I. et al. Causes of delayed diagnosis of posterior ankle impingement in the pediatric and adolescent population.  J. Foot (Edinb). 2021. V. 47. P. 101799. doi: 10.1016/j.foot.2021.101799.

8. Mchugh M.L. Interrater reliability: the kappa statistic. Biochem Med (Zagreb). 2012. V. 22. No 3. Pp. 276-82.  doi: 10.11613/BM.2012.031.

9. Meter J. et al. Pigmented villonodular synovitis of the flexor hallucis longus tendon: A rare cause of leg pain in a 12-year-old girl. Radiol. Case Rep. 2024. V. 19. No 4. Pp.1258-1262. doi: 10.1016/j.radcr.2023.12.053.

10. Ouyang L. et al. Training language models to follow instructions with human feedback. Advances in neural information processing systems. 2022. V. 35. Pp. 27730-27744.

11. Pota K. et al. Evaluation of the relations between foot and ankle pathologies and anatomic variations with magnetic resonance imaging of 849 study population. Jt. Dis. Relat. Surg. 2025. V. 36. No 2. Pp. 394-407. doi: 10.52312/ jdrs.2025.2146.

12. Puspitasari F.D. et al. Deepseek Models: A Comprehensive Survey of Methods and Applications. Techrxiv. 2025. doi: 10.36227/techrxiv.174198511.15158242/v1.

13. Ribbans W.J. et al. The management of posterior ankle impingement syndrome in sport: a review. Foot Ankle Surg. 2015. V. 21. No 1. Pp. 1-10. doi: 10.1016/j.fas.2014.08.006.

14. Shaheen M.Y. Applications of Artificial Intelligence (AI) in healthcare: A review. ScienceOpen Preprints. 2021. doi: 10.14293/s2199-1006.1.sor-.ppvry8k.v1.

15. Singhal K. et al. Toward expert-level medical question answering with large language models. Nat. Med. 2025. V. 31. No 3. Pp. 943-950. doi: 10.1038/s41591-024-03423-7.

16. Tehrani S.S.M. et al. Visual transformer and deep CNN prediction of high-risk COVID-19 infected patients using fusion of CT images and clinical data. BMC Med. Inform. Decis. Mak. 2023. V. 23. No 1. P. 265. doi: 10.1186/s12911-023-02344-8.

17. Tzioupis C. et al. Identification of the retrotalar pulley of the Flexor Hallucis Longus tendon. J. Anat. 2019. V. 235. No 4. Pp. 757-764. doi: 10.1111/joa.13046.

18. Wang S. et al. Capabilities of gpt-5 on multimodal medical reasoning. Arxiv. Preprint. 2025. arxiv. P. 2508.08224.

19. Zhao X.Y. et al. Anatomical Study of the Compositions and Internal Connections of the Chiasma Plantare (Master Knot of Henry): Exploring Its Possible Clinical Impact. J. Foot Ankle Surg. 2019. V. 58. No 6. Pp. 1235-1244. doi: 10.1053/j.jfas.2018.09.032.

 

Материал поступил в редакцию 28.03.26

 

 

Potential of GPT-Based Chatbots for Diagnostic

of Flexor Hallucis Longus Tendinitis in ChildreN

 

I.O. Erenkov, Cand. Sci. (Med.), Paediatric Orthopaedist

Medical Private Institution Branch Clinic and Diagnostic Center of Public Joint Stock Company Gazprom

(197229, Russia, St. Petersburg, Municipal District Lakhta-olgino, Prospect Lakhtinsky, 2, c. 3, building 1)

E-mail: erenkov_i@mail.ru

 

Abstract. The variability of clinical presentations of flexor hallucis longus tendinitis in childhood, especially when playing various sports, necessitates careful clinical assessment in children presenting with complaints of ankle joint and foot pain. The subsequent application of instrumental diagnostic methods is contributed to the final diagnosis. At the same time, the implementation of software applications based on neural networks, enhanced with machine learning algorithms, offers new opportunities of the diagnostic search. Materials and Methods. The results of examinations of 20 children with pain in the posterior ankle and various sites of the foot, with suspected tendinitis of the flexor hallucis longus tendon, are presented. For subsequent analysis of the medical records, two GPT-based chatbots—GPT-5 and DeepSeek-R1—were engaged as independent raters. Results. Data analysis was performed using individual diagnostic assessments, as well as Cohen’s kappa and Fleiss’ kappa statistics. Agreement values ranged from 0.65 to negative scores, depending on the aspect assessed. Conclusion. Modern GPT-based chatbots, such as GPT-5 and DeepSeek-R1, show promise in assisting to diagnostics of certain disorders of the ankle joint and foot in pediatric patients. However, their use requires careful interpretation and critical appraisal of the generated information.

Keywords: GPT chatbot, artificial intelligence, GPT-5, DeepSeek-R1, flexor hallucis longus tendinitis, children.