Хиймэл оюунтай харилцах үед бидний яриа, бичгийн хэв маяг илүү товч, хураангуй хэлбэрт ордог. Хурдан, хялбар мэт боловч ийм байдлаар бичих нь хиймэл оюунд төдийлөн ойлгомжтой биш байж мэднэ.

Тодорхой байх тусам хиймэл оюун бидний хэлэх гээд буй санааг илүү сайн ойлгох мэт санагддаг ч эсрэгээрээ хиймэл оюун таны зорилгыг зөв таамаглахын тулд өгүүлбэрийн бүтэц, өнгө аяс, холбоо үгс зэрэг жижиг нарийн деталиудад анхаарлаа хандуулдгийг бас мартаж болохгүй. 

Нэр томьёоны тайлбар

Large Language Model буюу Том хэлний загвар

Асар их бичгийн өгөгдөл дээр суурилж, сургагдсан хиймэл оюуны систем бөгөөд өгүүлбэр дэх дараагийн үгийг магадлалаар таамаглаж, өгүүлбэрээ бүтээдэг. Жишээ нь ChatGPT, Claude, Gemini, Mistral.

Параметр

Нэг LLM тэрбум, зарим нь хэдэн зуун тэрбум параметртэй байдаг. Параметр их байх тусам загвар илүү юмсын нарийн хамаарлыг сурч чаддаг.

Fine-tuning

Бэлэн загварыг тодорхой сэдэв, хэрэглээнд нийцүүлэхийн тулд нэмэлт өгөгдлөөр дахин сургах үйл явц.

Хиймэл оюун "таамагладаг"

Амазоны судлаач Фүлэй Жан ба Жоу Ю нар 14,000 гаруй хүмүүсийн хиймэл оюунтай хаьцах харилцааг судалж үзэхэд хүмүүс хиймэл оюунтай харьцахдаа хүнтэй харьцаж байснаасаа 14.5%-иар эелдэг бус, 5.3%-ийн дүрмийн алдаатай, 1.4%-иар бага үгийн баялагтай бичдэг болох нь тогтоогджээ.

ChatGPT, Claude, Gemini зэрэг том хэлний загвар (LLM) нь ном, нийтлэл, бичлэг гэх мэт хүний бичсэн цэгцтэй өгүүлбэрүүдийг “сурч авдаг”. Ингэхдээ үгсийг ойлгодоггүй, харин өмнөх үгсийн дараа ямар үг бичигдэх өндөр магадлалтай таамагладаг.

Тухайлбал, Mistral 7B гэх нээлттэй эхийн хэлний загвар 7 тэрбум орчим параметртэй. Эдгээр нь үг, хэллэгийн хоорондын хамаарлыг тооцдог бичил тохиргоо гэсэн үг. Загвар нь илүү олон өгөгдөлд сурсан байх тусам үгийн дараалал, өгүүлбэрийн хэв маягийг илүү нарийн таамаглаж чадна. Гэхдээ тэр бүх мэдээлэл ихэвчлэн бүрэн бүтэн өгүүлбэр, дүрмийн хувьд алдаагүй өгүүлбэрүүдэд суурилдаг.

Эх сурвалж: The New Scientist

Ойлголцлын зөрүү

Дээр дурдсан судалгаанд Mistral-7B хэмээх хэлний загварыг ашиглажээ. Эхлээд түүнийг 13,000 хүн хоорондын харилцааны өгөгдөлд сургасан бөгөөд дараа нь 1,357 хүн болон хиймэл оюун харилцан ярианд туршсан байна. Судалгааны зорилго нь хиймэл оюун хэрэглэгчийн бичсэн мессежийг (жишээ нь “нислэг захиалах”, “буцаан олголт хүсэх”, “хүргэлт шалгах” гэх мэт) зөв тодорхойлж чадах эсэхийг шалгах байв.

Гэтэл хүмүүс хиймэл оюунтай харьцахдаа “8 цаг, нислэг, буцаа” гэх мэт богино, дүрмийн хувьд алдаатай өгүүлбэрүүд бичиж байсан нь бүрэн өгүүлбэрээр харилцах хүний хэлэнд суралцсан хиймэл оюуны хувьд буруугаар тайлбарлагдах хандлагатай байж. Энгийнээр хэлбэл, хиймэл оюуны модель хүний хэлийг сурчихаад байхад хүн өөрөө “роботлог” хэлээр тэдэнтэй харьцаад буй хэрэг.

олон хэлбэрийн өгүүлбэрт дасгах

Үүнийг засахын тулд тэд өөр нэг хиймэл оюун болох Claude 3.5 Sonnet-ийг ашиглан гурван янзаар бичвэрийг дахин боловсруулсан. Эхний хувилбарт, өгүүлбэрийг илүү урт, албан хэлбэрт оруулахад гүйцэтгэл 1.9 %-иар муудсан. Хоёр дахь, бүр богино хувилбар дээр 2.6 %-иар буурсан. Харин аль алиныг нь хослуулсан буюу олон төрлийн харилцах хэв маягийг хольсноор гүйцэтгэл 2.9 %-иар сайжирсан байна.

Үүний цаана хиймэл оюуны хэлний загвар ижил утгыг илэрхийлж буй олон хэлбэрийг таньж сурах нь юу юунаас илүү чухал гэсэн санаа явж буй. Хүмүүс “тасалбар буцаа”, “тасалбар буцааж өгөөч”, “буцаан олголт хүсэж байна” гэх гурван өгүүлбэрийг нэг утгатай гэж автоматаар ойлгодог. Харин хиймэл оюун зөвхөн иймэрхүү жишээнүүдийг хангалттай “сурсан” тохиолдолд л ижил утгатайгаар холбож чадна. Өөрөөр хэлбэл, хиймэл оюун төөрөлдөж байгаа нь утгыг нь “ойлгохгүй” байгаад биш яаж өгүүлбэрээ бичиж буй “хэлбэрийн” ялгаанаас үүдэлтэй.

Эх сурвалж: Fox News

Хиймэл оюунтай хэрхэн харьцах вэ? 

1. Бүтэн өгүүлбэрээр харилц

Хиймэл оюун дүрмийн өгүүлбэрийн бүтцэд бодсоноос ч илүү анхаардгийг мэдэх үү?
“Нислэг цуцлах 8 цаг” гэх богино өгүүлбэрт “юу?”, “хэн?”, “яагаад?” гэсэн асуултад хариулагдах үгс байж байж ChatGPT таны зорилгыг зөв таамаглах магадлал нэмэгддэг.

Жишээ:
“Нислэг цуцлах 8 цаг” биш “Маргааш 8 цагийн нислэгээ цуцлах хүсэлтэй байна”

2. Тодорхой нэр, цаг, шалтгаан нэм

Түүнчлэн хиймэл оюунд “entity recognition” буюу нэр, газар, цаг хугацаа, шалтгаан чухал. Хэрэв эдгээр мэдээлэл тодорхой байвал нарийвчлал мэдэгдэхүйц нэмэгддэг.

Жишээ:
“Нислэг цуцлах хүсэлт” биш “Токио руу 11-р сарын 10-нд хийх 8 цагийн нислэгээ цаг агаарын улмаас цуцлах хүсэлтэй байна. Буцаан олголт хийж өгнө үү.”

3. Хүсэл зорилгоо тодорхой бич

Хиймэл оюун таны асуултыг “ямар төрлийн даалгавар” болохыг (хураангуйлах, тайлбарлах, орчуулах гэх мэт) ялгаж байж зөв хариулдаг.
Стэнфордын 2024 оны судалгаагаар хиймэл оюуны “даалгаврын чиглэл” (товчлох, жагсаах, тайлбарлах) тодорхой байхад хариултын чанар 15-20%-иар өссөн байна.

Жишээ:
“Энийг ойлгохгүй байна” биш “Энэ догол мөрийг энгийн үгээр тайлбарла.”

Эх сурвалж: The New York Times


4. Хэт ерөнхий бүү бай

Хэт өргөн сэдэвтэй, тодорхой бус асуулт хиймэл оюуныг төөрөгдүүлдэг. Жишээ нь “миний судалгаанд туслаач” гэх асуулт нь тодорхой даалгавартай асуултаас 2.3 дахин илүү алдаатай хариулт өгдөг болохыг тогтоожээ. Тиймээс “би хиймэл оюуны хэрэглээний тухай судалгаа хийж байна. Энэ сэдвийн нийгмийн нөлөөллийг нь товч тайлбарлаад өгөөч” гэж илүү тодорхой болгох хэрэгтэй.

5. Эелдэг бай, гэхдээ үг дэмий бүү үр

Хиймэл оюун эелдэг байдлыг хариулт боловсруулахад ашигладаггүй ч, өөрийгөө илэрхийлсэн тодорхой байдал нь үр дүнг сайжруулах нь бий. Google DeepMind (2023)-ын судалгаагаар “please”, “thank you” гэх энгийн илэрхийлэлтэй өгүүлбэрүүд нь хиймэл оюуны хариултын итгэлцлийн түвшинг 6-8% нэмэгдүүлдэг гэж үзсэн байна. Гэхдээ хэт урт, хэт найрсаг мессежүүд нь сэдвээс гажуулж, хариултын логикийг 3-5% сулруулдаг. Тиймээс зүгээр л тодорхой, ойлгомжтой: “Сайн уу, энэ бичвэрийг англи хэл рүү орчуулж өгөөч” гэх өгүүлбэр хангалттай.