Nazioarteko kongresu eta jardunaldietan, geroz eta ohikoago da bat-bateko transkripzio automatikoak eskuragarri izatea zuzeneko hitzaldietan.
Teknologia hauek irisgarritasun-neurri gisa oso baliagarriak dira. Ez soilik entzumen-arazoak dituzten pertsonentzat edo arazo kognitiboak dituztenentzat, baita hizkuntza erabat menperatzen ez dutenentzat ere.
Euskaraz horrelako zeozer posible al da?
Orain arte ikusi ditudan adibideak ingelesez egiten dira. Duela gutxi euskarazko Whisper eredu berriak argitaratu nituela aprobetxatuz, esperimentu txiki bat egitea erabaki nuen. whisper-tiny-eu
bezalako eredu txiki eta arin bat erabiliz, gai izango ote gara euskarazko bat-bateko transkripzio automatikoa egiteko?
Whisper-streaming oinarri gisa
Whisper-streaming proiektua oinarri gisa hartu eta transkripzioak web interfaze baten bidez argitaratzeko aukera gehitu nion. Horrela, web orri hau overlay modura erabil daiteke ondoren OBS bezalako bideo grabaketa edo streaming aplikazioetan.
Emaitzak hurrengo bideoan ikus daitezke:
Eta orain zer?
Erabilitako whisper-streaming proiektuak, faster-whisper erabiltzen du azpitik. Beste alde batetik, oso gustoko dudan whisper.cpp alternatibarekin ere badago aukera bat-bateko transkripzioak egiteko. Biak alderatu nahiko nituzke, ea zein den azkarragoa.
Tamalez, ez dut uste denbora askorik izango dudanik honetarako…
ENUŔI
Momentuz, egindako proba hauek ez ahazteko, artikulu hau idazteaz gain, erabilitako kodea ENUŔI izeneko proiektuan utzi dut eskuragarri. Horrelako tresnekin probak egin nahi badituzu, jarri harremanetan!