Дата Цуглуулалтын Дадлагажигч
May 29, 2025
байршил
Онлайн
хугацаа
6 сар
нээлттэй орон тоо
3
Бүртгэл Хаагдах Өдөр
6/30/25
Дадлагын тойм
Та хиймэл оюунд суурилсан Монгол-Англи орчуулгын системийн бүтээлд хувь нэмрээ оруулахыг хүсэж байна уу? Бид Монгол хэлний онцлогийг тусгасан дэлхийн түвшний хиймэл оюунд суурилсан Монголоос Англи хэлрүү орчуулах орчуулгын системийг бүтээх зорилготой. Энэхүү төслийн хүрээнд та дата цуглуулалт, шүүлт, болон анализ хийх ажлуудад оролцож, хиймэл оюуны хөгжүүлэлтийн бодит процессийг суралцах болно. Та зөвхөн дадлагын туршлага авахаас гадна UC Berkeley-ийн төгсөгчтэй холбогдон, олон улсын түвшний сүлжээ, мэргэжлийн хөгжлөө эхлүүлэх ховор боломжтой.
Дадлагын тайлбар
Монгол болон Англи хэлний өгөгдөл цуглуулах, цэвэрлэх, зохион байгуулах
Текстэн өгөгдлийг шүүж, ангилах, чанарын хяналт хийх
Дата боловсруулахад Python болон Google Workspace хэрэгслүүд ашиглах
Хэлний онцлогийг ойлгож, өгөгдлийг хэл шинжлэлийн талаас үнэлэх
Багийн бусад гишүүдтэй хамтран ажиллаж, өгөгдлийн урсгалыг сайжруулах
Суурь шаардлага
Python – өгөгдөл цэвэрлэх, боловсруулах, скрипт бичих
Pandas, NumPy – дата фреймтэй ажиллах, статистик дүн шинжилгээ
Google Sheets / Excel – дата ангилах, хянах, гар ажиллагаатай засвар
Google Docs / Notion – хамтын ажиллагаа болон тайлан хөтлөлт
Jupyter Notebook / Colab – код, график, үр дүнг тайлбарлан харуулах
Нэмэлтээр үнэлэгдэх чадварууд
Regex – текстэн өгөгдөл шүүж, боловсруулах
Hugging Face Transformers – LLM болон хэлний загварын хэрэглээний мэдлэг
LangChain, OpenAI API – LLM-тэй ажилласан туршлага (давуу тал)
MongoDB / SQL – өгөгдлийн сангаас мэдээлэл олборлох чадвар
Git ашиглан хувилбарын хяналт хийх чадвар
Нэмэлтээр хавсаргаж болох баримтууд
Өмнө ажилласан дата анализ эсвэл текст боловсруулалтын жишээ
GitHub линк (код, скрипт, өгөгдөл боловсруулах ажлууд байвал)
Python/Jupyter notebook файл (төслийн жишээ, тайлбартай байвал илүү давуу тал болно)
Судалгааны ажил эсвэл хэл шинжлэлтэй холбоотой бичвэрүүд
Resume
Хувийн вэбсайт эсвэл портфолио (байгаа бол)