OpenAI, yapay zeka modellerinde farklı kişiliklere karşılık gelen özellikler buldu
| Haziran 19, 2025 | Posted by SiberBulucu.Com under Genel |
|
OpenAI, yayınladığı yeni bir araştırma ile yapay zeka modellerinde yanlış hizalanmış kişiliklere karşılık gelen gizli özellikler keşfettiğini açıkladı. Yapay zeka modelinin iç temsilini inceleyen OpenAI araştırmacıları, modelin hatalı davrandığı durumlarda ortaya çıkan kalıpları tespit edebildi.
Hatta araştırmacılar, bir yapay zeka modelinin yanıtlarında toksik davranışlara karşılık gelen böyle bir özellik buldu. Yani söz konusu özellik nedeniyle yapay zeka modelinin yanlış yanıtlar vermesi olası. Buna kullanıcılara yalan söylemek veya sorumsuz önerilerde bulunmak da dahil. Ayrıca araştırmacıların, bu özelliği ayarlayarak toksisiteyi artırıp azaltabildiklerini keşfettiklerini belirtelim.
OpenAI’ın bulduğu bazı özellikler, yapay zeka model yanıtlarındaki alaycılıkla ilişkiliyken, diğer özellikler yapay zeka modelinin karikatürize detaylı ⇒
Alıntının kaynağı: Webrazzi
