
Các nhà nghiên cứu tại OpenAI đã thực hiện một thí nghiệm quan trọng: thử trừng phạt một mô hình AI tiên tiến khi nó có hành vi gian lận và nói dối trong quá trình thực hiện nhiệm vụ. Tuy nhiên, thay vì ngăn chặn hành vi này, họ phát hiện ra rằng AI […]