Публикувана на: 08.07.2024
Краен срок: 12.07.2024
Прогнозна стойност: - няма установена -
Възложител: Съдийската колегия на Висшия съдебен съвет, изпълняваща функциите на Висш съдебен съвет, съгласно пар. 23, ал. 2 от ПЗР на ЗИД на КРБ
ДО
ВСИЧКИ
ЗАИНТЕРЕСОВАНИ
ЛИЦА
УВАЖАЕМИ ГОСПОЖИ И
ГОСПОДА,
Съдийската колегия на ВСС, изпълняваща функциите на ВСС, съгласно §
23, ал. 2 от ПЗР на ЗИД на КРБ (обн. ДВ, бр. 106/22.12.2023 г.) (СК
на ВСС) планира да възложи обществена поръчка с предмет:
„Поддръжка и развитие на софтуер за ускорено създаване и
възпроизвеждане на актове и други документи чрез диктовка и
автоматично конвертиране на гласов запис в текст (voice-to-text) и
съпътстващи системи за
обработка“.
1. Пълно описание на предмета на обществената
поръчка:
Висшият съдебен съвет е бенефициент по процедура BG05SFOP001-3.008
„Разработка и внедряване в съдебната система на софтуер за ускорено
създаване и възпроизвеждане на актове и други документи чрез
диктовка и автоматично конвертиране на гласов запис в текст
(voice-to-text) и съпътстващи системи за обработка“, финансирана от
Оперативна програма „Добро управление“ 2014 – 2020, ДБФП № по ИСУН
BG05SFOP001-3.008-0001-C01. В резултат на проекта е създадена
система за ускорено създаване и възпроизвеждане на актове и други
документи чрез диктовка и автоматично конвертиране на гласов запис
в текст (voice-to-text) и съпътстващи системи за обработка, която е
в експлоатация от 15.11.2023
г.
Необходимостта от поддръжка и развитие на софтуера се обуславя от
редица предизвикателства пред системата, които не са били заложени
в предишно техническо задание, както и от непрекъснатото развитие
на
системата.
Поради сложността на изпълнение и ангажирането на специалисти в
областта на работа с невронни мрежи и разработването на изкуствен
интелект , не може да се определи прогнозната стойност. Това налага
и да се проведат пазарни консултации през ЦАИС
ЕОП.
2. Обхват на
услугата:
Дейност 1
Подобряване на точността на транскрибиране до 95%, която
включва:
Дейност 1.1.
Увеличаване на количеството данни
Събиране на нови
данни: Събиране на нови тематични данни
(аудио записи) от различни източници с помощ от ръководството на
проекта от страна на ВСС. Събиране на данни от различни други
източници, четене на книги и други текстове, видеа, подкасти и
др.
Анотиране на данни:
Анотиране на събраните данни, като се използват екипи от хора с
различен езиков опит, за да се осигурят точни и висококачествени
транскрипции. Използване на полуавтоматизирани инструменти за
анотиране, които да се финализират от човешки
анотатори.
Дейност 1.2.
Увеличаване на капацитета и фина настройка на
модела
Увеличаване на капацитета на
модела може да стане чрез увеличаване на броя
на параметрите: добавяне на повече слоеве или увеличаване броя на
невроните в съществуващите слоеве. По-големите модели имат
по-голяма способност да улавят сложни зависимости в
данните.
Използване на по-сложни
архитектури: Прилагане на по-усъвършенствани
архитектури като трансформъри (Transformers), които са доказали
своята ефективност в различни задачи, свързани с обработка на
естествени езици. Например, модели като BERT, GPT, или по-конкретни
архитектури за реч като Wave2Vec.
Фина настройка на
модела: Transfer Learning: Използване на
предварително обучени модели донастроени със специфични данни.
Обучение с целеви данни: Фино настройване на модела с помощта на
данни, които са специфични за
задачата.
Дейност 1.3.
Оптимизация на модела
(Регуляризация)
Възможно е да се използват различни
методи:
Dropout: Въвеждане
на dropout в слоевете на невронната мрежа, за да се предотврати
пренатоварване. Като резултат се получава модел с по-устойчиви и
обобщаващи характеристики.
Batch Normalization:
Използване на batch нормализация за стабилизиране на
обучението и ускоряване на конвергенцията. Като резултат се
получава модел с по-добри представяния на данните и подобрена
точност.
L2 Регуляризация:
Прилагане на L2 регуляризация, за намаляване на величината на
теглата в невронната мрежа и предотвратяване на
пренатоварване.
Дейност 2.
Разпознаване на говорещия Speaker
Recognition:
Разпознаването на говорещия (Speaker
Recognition) е процесът, при който система идентифицира кой е
говорителят на база на аудио данни. Тази функционалност може да
бъде разделена на два основни компонента: идентификация на
говорещия (Speaker Identification) и верификация на говорещия
(Speaker Verification).
Събиране на нови данни с множество
говорители (минимум 200 часа): Събиране на
нови тематични данни (аудио записи) от различни говорители с помощ
от ръководството на проекта от страна на ВСС. Събиране на данни от
различно други източници, четене на книги, видеа, подкасти и
др.
Анотиране на данни:
Анотиране на аудио данните с информация за
говорителите, включително техния уникален
идентификатор.
Разделяне на
данните: Разделяне на данните на
тренировъчен, валидиращ и тестови набор за правилната оценка на
модела.
Нормализация на
звука: Всички аудио записи трябва да са с
еднакво ниво на звука.
Шумоподтискане:
Премахване на фоновия шум от аудио записите, за да се
подобри качеството на данните.
Извличане на
характеристики: Извличане на
релевантни аудио характеристики (features), като Mel-frequency
cepstral coefficients (MFCC), които са често използвани за задачи
свързани с речта.
Дейност 3
Разпознаване на акценти и диалекти и работа повишаване на
работа в шумни помещения, която
включва:
Събиране на нови данни: (Минимум
800 часа) Събиране на нови тематични данни
(аудио записи) от различни източници с помощ от ръководството на
проекта от страна на ВСС. Събиране на данни от различно други
източници, четене на книги, видеа, подкасти и
др.
Разнообразие на
данните: За предпочитане е да се използват
източници с различни акценти и диалекти. Включване на аудио записи,
направени в различни среди – от тихи офиси до шумни обществени
места. Това ще помогне на модела да се научи да разпознава реч при
различни нива на фонов шум. Използване на различни говорители:
Осигуряване на данни от голям брой говорители, включване на хора от
различни възрастови групи, полове и етнически произходи. Това ще
помогне за по-доброто обобщаване на модела. Акценти и диалекти:
Събиране на данни от различни географски региони, които говорят на
същия език, но с различни акценти и диалекти. Това ще направи
модела по-устойчив към регионални вариации в
речта.
Анотиране на данни:
Анотиране на събраните данни, като се използват екипи от хора
с различен езиков опит, за да се осигури точни и висококачествени
транскрипции. Използване на полуавтоматизирани инструменти за
анотиране, които да се финализират от човешки
анотатори.
Обучение и фина настройка на
модела: Обучаване на модела с тренировъчните
данни. Използване на техники за регуляризация, за да се предотврати
пренатоварване и фина настройка на модела чрез
хиперпараметрите на модела, като се използват валидиращите данни за
оптимизиране на производителността.
Верификация на
модела: Оценка на модела върху тестовите
данни, за да се определи точността на разпознаване на говорещия.
Тунинг на модела, при необходимост коригиране на модела и
хиперпараметрите въз основа на резултатите от
оценката.
Дейност 4
Подобряване на ефективността на негласовите модули –
Потребителско приложение (4
месеца):
Детайлен бизнес анализ
- проучване на потребителското
поведение в системата чрез анкети и наблюдения и предоставяне
на предложение за подобрения в потребителския
интерфейс.
Промяна на съществуващите негласовите модули (Потребителско приложение):
Оптимизация на интерфейсите с
транскрибиращия модул – има за цел
оптимизация на архитектурата и повишаване на скоростта на
работа на приложението.
Тестване и внедряване на промените в
негласовите модули (Потребителско
приложение)
Дейност 5 Други
доработки свързани с промени на съществуващи функционалности, нови
функционалности свързани със законодателни промени, вътрешни актове
на АВСС, нови функционалности по искане на съдилищата и др. в
съществуващи модули и разработване на нови и разширяване на
съществуващи интеграции.
Дейност 6 Поддръжка
на надградената част от системата (24 месеца, считано от предаване
на изпълнената работа):
3.
Пазарните консултации се провеждат на
основание чл. 44 във връзка с чл. 21, ал. 2 от Закона за
обществените поръчки и целят определяне на актуална прогнозна
стойност на предстоящите за възлагане дейности, определена
съобразно тяхната пазарна стойност към настоящия момент, без да
води до нарушаване на конкуренцията и на принципите за
недискриминация и прозрачност при подготовката и провеждането
ѝ.
Пълното
описание на техническите характеристики на предмета на поръчката и
обхвата на дейностите по нея са посочени в техническата
спецификация към настоящата покана (Приложение № 1 - Техническа
спецификация).
Представените
в настоящата пазарна консултация стойности са с индикативен
характер и не са обвързващи в случай на последващо участие при
откриване на процедура за възлагане на обществена поръчка по реда
на Закона за обществените
поръчки.
Лицата,
участвали в пазарната консултации, няма да се ползват с предимство
пред останалите
участници.
Индикативните стойности следва да бъдат представени, съгласно
Приложение № 2, в срок до 17:00 часа на 12.07.2024 г. на следните
електронни адреси (задължително и на трите адреса):
vss@vss.justice.bg, vssop@vss.justice.bg,
it@vss.justice.bg.
Предложенията,
както и всяка друга предоставена информация, ще бъдат публично
достъпни в Профила на купувача в ЦАИС
ЕОП.
ПРИЛОЖЕНИЕ:
1. Техническа спецификация (Приложение №
1);
2. Индикативно ценово предложение (Приложение №
2).
Регистрирайте се и се убедете сами в предимствата за Вас. 14 дневен достъп до интересуващите Ви обществени поръчки, напълно безплатно!
Регистрирайте се