Euskalkiak identifikatzen
DR;TL (“Ez dut irakurri; luzeegia” bertsioa) NongoEuskara esperimentua sortu dut. Horretarako, datuak bilatu, fastText saikapen edo embedding eredua entrenatu, eta demo webgunetxo hau sortu dut. WebAssembly erabiliz, sortutako eredu hauek nabigatzailean exekutatzen dira. Azalpen luzea Badakigu hizkuntza eredu handiak (LLM) denetik egiteko gai direla. Nahiz eta, hasiera batean, ez ziren horretarako sortu, gaur egun gai dira programatzeko, itzulketak egiteko, audioa transkribatzeko, testu luzeak laburtzeko, etabar luze bat. Batzuetan, ordea, soluzio egokiena ez da beti LLM bat erabiltzea izango. Adibidez, itzulpen azkarrak eta sinpleak egiteko, badira LLMak baino itzultzaile neuronal arinagoak, baliabide gutxiago behar dituztenak. ...

