Azken egunotan Nvidia Parakeet eredua euskarara doitzen aritu naiz, eta emaitza hemen argitaratu dut.

Helburua argia zen: euskarazko hizketa-ezagutza eredu arin bat edukitzea, exekuzio azkarrarekin eta hardware xumeagoan ere erabilgarria izateko.

Zehaztasuna eta abiadura

Argi esanda, eredu hau ez da nire euskarazko Whisper bertsio onena bezain zehatza:

Hala ere, badu abantaila handi bat: oso azkarra da, eta CPU hutsean exekutatu daiteke.

Zehaztasun maximoa behar bada, euskarazko Whisper Large v3 da aukera hobea; abiadura eta baliabide gutxiko exekuzioa lehenesten badira, Parakeet aukera oso interesgarria da.

ONNX formatuan erabiltzea gomendatua

Parakeet euskaraz modu praktikoan erabiltzeko, ONNX formatua gomendatzen dut.

Horretarako, jada bihurtutako fitxategiak hemen daude:

Horrela, integrazioa errazagoa da eta CPU inguruneetan ere errendimendu ona lor daiteke.

Fine-tuning prozesuari buruz

Entrenamenduari buruzko xehetasun gehiago, metrikak eta jarraipen grafikoak hemen:

Ondorio laburra

Gaur-gaurkoz, euskarazko STT erabilerarako:

  • Zehaztasuna lehenetsi nahi baduzu: whisper-large-v3-eu
  • Abiadura eta CPU erabilera lehenetsi nahi badituzu: parakeet-tdt-0.6b-v3-basque (ONNX bidez)