WesternArmenianLLM

RVogel101/WesternArmenianLLM

Python Stars: 0 Forks: 0 ML/AI

armenian-nlp language-model fine-tuning qlora multilingual-llm low-rank-adaptation text-cleaning mongodb

Summary

A project to create a bilingual Western Armenian-English large language model using QLoRA fine-tuning on Qwen 2.5 1.5B. It includes a data pipeline that reads from a centralized MongoDB database, performs text cleaning and language filtering, and prepares training splits. The workflow includes a mandatory audit for Eastern Armenian text leakage, a two-stage training process (pretraining and instruction fine-tuning), and plans for RAG and model serving.

View on GitHub

More in: Armenian Language AI Toolkit →

Similar Projects

Western-Armenian-Chat-Model

haigaz15/Western-Armenian-Chat-Model

A Western Armenian language model project using transformer architecture, implemented in Jupyter notebooks. Includes ...

Jupyter Notebook Stars: 2

EdikSimonian/armenian-gpt

ArmGPT is a student-friendly implementation of a GPT language model specifically trained on Armenian text. It's built...

Python Stars: 0

veganyogurt4u/hyw_augment

A Western Armenian NLP augmentation layer designed to improve LLM output quality by providing structured linguistic d...

Python Stars: 1

Armenian_Dialects

simonsazian/Armenian_Dialects

A project to create a website for translating text into various Armenian dialects, starting with converting Google Tr...

Python Stars: 0

armenian-learning-assistant-be

blbulyandavbulyan/armenian-learning-assistant-be

A Spring Boot backend for an Armenian language learning assistant that uses Spring AI with Gemini for phrase generati...

armenian_translator

mifefr/armenian_translator

An Android translation app for bidirectional French-Armenian conversation, featuring a split-screen interface with ro...

Kotlin Stars: 0