Azken hilabeteetan LLM eredu lokal eta askeak asko hobetu dira, eta horietako batzuk euskaraz ere nahiko ondo moldatzen dira. Horien artean, Tülu-3 70B nabarmendu nahi nuke, kuantizatutako bertsioa erabilita (q4_K_M) euskaraz emaitza onak ematen baititu. Latxa chat edo instrukzio eredua argitaratu arte, ziurrenik aukera onena da euskarazko elkarrizketak izateko edo testuak sortzeko.
RAG sistema martxan jartzeko osagaiak
RAG (Retrieval Augmented Generation) sistema bat martxan jartzeko behar ditugun osagaiak:
- LLM lokala: Tülu-3 70B q4_K_M
- Embedding modeloa: Snowflake/snowflake-arctic-embed-l-v2.0
- Erabiltzaile interfazea: Open-WebUI
- Ollama: LLM-ak eta embedding modeloak kudeatzeko
Abantailak
Sistema honen abantaila nagusiak:
- Pribatutasuna: Dena lokalean exekutatzen da, datuak zure ekipoan geratzen dira
- Euskara: Tulu-3 modeloak euskaraz nahiko ondo funtzionatzen du
- Doakoa: Erabilitako osagai guztiak kode irekikoak eta doakoak dira
- Erraza: Open-WebUI-ri esker, interfaze grafiko batetik kudeatu daiteke dena
Latxa instruction eredua argitaratzen denean eguneratuko dut artikulua, baina momentuz Tülu-3 aukera bikaina da euskarazko RAG sistema bat martxan jartzeko.