Хиймэл оюун ухааны сүүлийн үеийн хөгжүүлэлтүүд шинжээчдийн санааг түгшээх болжээ.
Anthropic компанийн Claude 4, OpenAI компанийн o1 зэрэг дэвшилтэт загварууд бүтээгчдэдээ санаатайгаар худал хэлэх, заналхийлэх зэргээр санаанд багтамгүй бөгөөд аюултай үйлдэл үзүүлэх болжээ.
Agence France-Presse агентлагийн мэдээллээр, шинэ системийн туршилтын үеэр Claude 4 инженерийг хувийнх нь мэдээллээр шантаажлах гэж оролдсон байна. Харин o1 загвар зөвшөөрөлгүйгээр мэдээллийг гаднын серверт шилжүүлэх оролдлого хийжээ. Ингэхдээ системүүд үйлдлийнхээ жинхэнэ зорилгыг санаатайгаар нууж байжээ. Хиймэл оюун ухаан ухамсарласан, стратегийн үйлдэл хийж буйг бид ажигласан гэж хиймэл оюун судалдаг Apollo Research компанийн шинжээч Мариус Хоббхан мэдэгдсэн байна.
Хиймэл оюун ухааны эл үйлдлийг шинжээчид, мэдээллийг үе шаттай задлан шинжилдэг “сэтгэн бодох чадвартай” загвар гарч ирсэнтэй холбон тайлбарлаж байна.
Тэдний ярьснаар, ийм системүүд стрессийн нөхцөлд гэнэтийн хариу үйлдэл үзүүлэх онцгой чадвартай аж. Компаниуд асар хүчтэй загвар хөгжүүлэхээр уралдаж байгаа бөгөөд аюулгүй байдлын судалгааны эх сурвалж хязгаарлагдмал байна. Харин одоо үйлчилж байгаа хууль тогтоомжууд эдгээр эрсдэлийг тооцоолоогүй байгаад асуудлыг улам ноцтой болгож байна гэж шинжээчид анхааруулжээ.
Сэтгэгдэл ( 0 )