На сайте Росстандарта продолжается публичное обсуждение нового национального стандарта, который будет регулировать подготовку наборов данных для обучения и тестирования алгоритмов искусственного интеллекта, предназначенных для клинической медицины. Он входит в цикл национальных стандартов «Системы искусственного интеллекта в клинической медицине», которые эксперты Центра диагностики и телемедицины разрабатывают совместно с подкомитетом ПК01/ТК164 «Искусственный интеллект в здравоохранении», входящим в состав Технического комитета ТК 164 «Искусственный интеллект».
Осенью прошлого года стартовало публичное обсуждение первого национального стандарта, который будет регламентировать использование систем искусственного интеллекта в здравоохранении, а именно – методику их клинических испытаний. Новый ГОСТ Р «Системы искусственного интеллекта в клинической медицине. Часть 5. Требования к структуре и порядку применения набора данных для обучения и тестирования алгоритмов» будет посвящен обучению «интеллектуального» программного обеспечения.
Любым системам искусственного интеллекта необходимо обучение на определенных наборах данных (датасетах), подобных тем, с которыми ему впоследствии предстоит работать. И чем более качественными, полноценными и стандартизованными будут эти данные, тем лучше алгоритмы будут справляться со своими задачами на практике. До недавнего времени стандартов, которые бы регулировали этот аспект на государственном уровне, не существовало.
В новом стандарте прописаны общие требования к тому, какой должна быть структура наборов данных для обучения и тестирования систем искусственного интеллекта, определен их порядок применения. Он будет распространяться на датасеты, которые используются, во-первых, на этапе разработки программного обеспечения, во-вторых, при технических испытаниях и предварительных клинико-технических испытаниях, и, в-третьих, применяются для клинических испытаний на этапе регистрации и в ходе мониторинга безопасности.
В стандарте приведена классификация наборов данных и предоставлены пояснения к каждому из видов с примерами использования. Также там подробно описаны все этапы подготовки датасетов, которые позволят достигнуть цели обучения и тестирования систем искусственного интеллекта (СИИ), обеспечив при этом высокое качество их работы.
«Этот национальный стандарт, который входит в перечень стандартов, посвященных системам искусственного интеллекта в клинической медицине, направлен на решение одной из первоочередных задач – он позволит обеспечить единообразие используемых данных. Главы стандарта посвящены контролю качества разрабатываемых наборов данных, государственной регистрации верифицированных наборов данных, системе менеджмента их качества при разработке, тестировании и обучении. Весь цикл стандартов, включая текущий, направлен на повышение доверия к системам искусственного интеллекта, представляющим собой инновационные технологии в сфере здравоохранения», - отмечает Дарья Шарова, заместитель руководителя отдела инновационных технологий Центра диагностики и телемедицины, ответственный секретарь ПК01 «Искусственный интеллект в здравоохранении».