Новая модель MedASR для медицинского диктовки и уязвимость в MongoDB

Система MedASR, обладающая 105 миллионами параметров, была обучена на 5000 часах обезличенной медицинской речи, что позволяет ей точно распознавать термины, используемые в клинических разговорах. Модель, построенная на архитектуре Conformer, фокусируется на расшифровке врачебных диктовок, избегая общих аудиозаписей. MedASR принимает моноаудио 16 кГц и генерирует текст, что делает её основой для голосовых приложений в здравоохранении. Она может быть настроена под специфические задачи, такие как работа в шумных помещениях или адаптация к акцентам. Важной частью использования является возможность передачи полученного текста в генеративные модели, например, для создания медицинских заметок.

Помогите проекту, поделитесь с друзьями ;)

Добавить комментарий