HF ereduak GGUF formatura bihurtu

Ereduak GGUF formatura bihurtu

Gida honetan HuggingFace webgunean argitaratuak dauden ereduak GGUF formatura bihurtzeko jarraibideak azaltzen dira. GGUF formatu honek ereduak gure ordenagailuan modu eraginkorrean erabiltzeko aukera eskaintzen du. Horretarako, Llama.cpp edo Ollama bezalako tresnak erabili ditzakegu. Llama.cpp deskargatu Gure ordenagailuan bertan GGUF formatura bihurtzeko, llama.cpp deskargatu beharko dugu lehenik eta behin, bertako bihurketa tresnak erabili ahal izateko. # Klonatu llama.cpp biltegia git clone https://github.com/ggml-org/llama.cpp.git Ingurunea prestatu Ingurunea prestatu eta beharrezko dependentziak instalatzeko, uv erabiliko dugu. Ez baduzu instalatu, instalatu beharko duzu. ...

2026(e)ko otsailaren 8(a)
Latxa VL eredua

Latxa VL eredu berriak

Duela gutxi HiTZ zentroak Latxa VL ereduak argitaratu zituen. Eredu hauek Qwen3-VL ereduetan oinarrituak daude eta ikusmenerako gaitasuna dute. Momentuz, bi tamaina ditugu eskuragarri, biak oso txikiak: 2B eta 4B parametro dituzten ereduak. Ondorenera aurkeztutako probak 4B ereduarekin eginak izan dira. Euskaraz dakiten ereduak Orokorrean, horrelako tamaina txikiko ereduek ingelesez txukun erantzuteko gaitasuna izan ohi dute soilik. Latxa VL eredu hauek, ordea, euskaraz egiteko entrenatuak izan dira. Euskaraz ulertzeko gai izan harren, sarri akats batzuk egiten ditu erantzunetan. ...

2026(e)ko otsailaren 7(a)
Kimu eredua

Kimu

Kimu izeneko hizkuntza eredua argitaratu berri du Orai-k. Gemma 2 ereduan oinarrituta, 2B eta 9B parametro dituzten ereduak sortu dituzte. Oinarrizko ereduari euskaraz egiteko beharrezko jakintza txertatzea lortu dute. Kimu-ko bi ereduak GGUF formatura bihurtu ditut eta Hugging Face biltegian jarri ditut eskuragarri. Modu honetara, Kimu eredua Llama.cpp edo Ollama bezalako aplikazioetan erabiltzea posible da. Aldi berean, @urtzai-k eredu hauek Ollama-ko eredu katalogoan argitaratu ditu, Ollama bidez erabilera errazagoa eginez. ...

2024(e)ko urriaren 13(a)
Real-time transcription

Euskarazko bat-bateko transkripzioak

Nazioarteko kongresu eta jardunaldietan, geroz eta ohikoago da bat-bateko transkripzio automatikoak eskuragarri izatea zuzeneko hitzaldietan. Teknologia hauek irisgarritasun-neurri gisa oso baliagarriak dira. Ez soilik entzumen-arazoak dituzten pertsonentzat edo arazo kognitiboak dituztenentzat, baita hizkuntza erabat menperatzen ez dutenentzat ere. Euskaraz horrelako zeozer posible al da? Orain arte ikusi ditudan adibideak ingelesez egiten dira. Duela gutxi euskarazko Whisper eredu berriak argitaratu nituela aprobetxatuz, esperimentu txiki bat egitea erabaki nuen. whisper-tiny-eu bezalako eredu txiki eta arin bat erabiliz, gai izango ote gara euskarazko bat-bateko transkripzio automatikoa egiteko? ...

2024(e)ko martxoaren 4(a)
Speech-to-text

Euskara hortzetik hitzera: transkripzio ereduak hobetzen

Hizketa-ezagutzaile (STT, speech-to-text) motako ereduek ahots-grabazioak testu idatzi bihurtzeko aukera ematen dute, hizkuntza naturalaren prozesamendu automatikoan oinarrituta. Teknologia honek gero eta garrantzi handiagoa hartzen ari da interfaze digitaletan. 2022. urteaz geroztik, Mozilla Common Voice datu-bilduma erabiliz, jatorrizko Whisper STT eredua euskararako doitzen aritu naiz, doitze fin teknika (ingelesez fine-tuning) bidez. Jatorrizko ereduekin alderatuta, emaitzetan hobekuntza nabarmenak ikusi ditut. Gainera, Mozilla Common Voice ekimena hazten joan den heinean, ereduaren kalitatea are gehiago hobetu da. ...

2024(e)ko otsailaren 27(a)