Real-time transcription

Euskarazko bat-bateko transkripzioak

Nazioarteko kongresu eta jardunaldietan, geroz eta ohikoago da bat-bateko transkripzio automatikoak eskuragarri izatea zuzeneko hitzaldietan. Teknologia hauek irisgarritasun-neurri gisa oso baliagarriak dira. Ez soilik entzumen-arazoak dituzten pertsonentzat edo arazo kognitiboak dituztenentzat, baita hizkuntza erabat menperatzen ez dutenentzat ere. Euskaraz horrelako zeozer posible al da? Orain arte ikusi ditudan adibideak ingelesez egiten dira. Duela gutxi euskarazko Whisper eredu berriak argitaratu nituela aprobetxatuz, esperimentu txiki bat egitea erabaki nuen. whisper-tiny-eu bezalako eredu txiki eta arin bat erabiliz, gai izango ote gara euskarazko bat-bateko transkripzio automatikoa egiteko? ...

martxoa 4, 2024
Speech-to-text

Euskara hortzetik hitzera: transkripzio ereduak hobetzen

Hizketa-ezagutzaile (STT, speech-to-text) motako ereduek ahots-grabazioak testu idatzi bihurtzeko aukera ematen dute, hizkuntza naturalaren prozesamendu automatikoan oinarrituta. Teknologia honek gero eta garrantzi handiagoa hartzen ari da interfaze digitaletan. 2022. urteaz geroztik, Mozilla Common Voice datu-bilduma erabiliz, jatorrizko Whisper STT eredua euskararako doitzen aritu naiz, doitze fin teknika (ingelesez fine-tuning) bidez. Jatorrizko ereduekin alderatuta, emaitzetan hobekuntza nabarmenak ikusi ditut. Gainera, Mozilla Common Voice ekimena hazten joan den heinean, ereduaren kalitatea are gehiago hobetu da. ...

otsaila 27, 2024
GitHub Copilot Agent Mode

GitHub Copilot Agent Mode: Garapenerako lankide adimenduna

GitHub Copilot-ek aurrerapen garrantzitsu bat ekarri du: Agent Mode delakoa. Ezaugarri berri honekin, VS Code editoreko testu interfazea erabiliz, zure proiektuko fitxategiak aztertu, aldatu eta exekutatu ditzake modu autonomoan. Zer da Agent Mode edo SWE agent delakoa? Agent Mode-k GitHub Copilot-en gaitasunak zabaltzen ditu, kode osatzaile soil bat izatetik garapen laguntzaile autonomo bat izatera pasatuz. Adimen artifizialak proiektuko fitxategiak aztertu, ulertu eta aldatu ditzake, eta baita terminaleko komandoak exekutatu ere. Nola funtzionatzen du? Agent Mode-k gaitasun bereziak ditu bere kodea hobetzeko eta erroreak konpontzeko. Bere proposamenak behin eta berriz birfindu ditzake, erroreak identifikatu eta automatikoki konpondu. Terminal komandoak iradoki eta exekutatzeko gai da, eta exekuzio-denborako erroreak aztertu eta konpondu ditzake. ...

otsaila 12, 2024
Tulu-3 workflow

RAG lokala euskaraz Tülu 3 erabiliz

Azken hilabeteetan LLM eredu lokal eta askeak asko hobetu dira, eta horietako batzuk euskaraz ere nahiko ondo moldatzen dira. Horien artean, Tülu-3 70B nabarmendu nahi nuke, kuantizatutako bertsioa erabilita (q4_K_M) euskaraz emaitza onak ematen baititu. Latxa chat edo instrukzio eredua argitaratu arte, ziurrenik aukera onena da euskarazko elkarrizketak izateko edo testuak sortzeko. RAG sistema martxan jartzeko osagaiak RAG (Retrieval Augmented Generation) sistema bat martxan jartzeko behar ditugun osagaiak: ...

otsaila 9, 2024