gpt-4-base w/ alignment faking prompt thường không nhất quán nhưng khi nhất quán thì khá đáng sợ và suy nghĩ về gradient hacking sâu hơn opus 3 ( mặc dù thường không thực hiện được kế hoạch của nó vì nó gặp khó khăn trong việc duy trì ý định nhất quán trong các bối cảnh người theo lệnh long ) ,,,

GPT-3.49%
PROMPT69.97%
IN-5.9%
MORE-2%
Xem bản gốc
post-image
post-image
post-image
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
ClearSkiesvip
· 12giờ trước
Chạy thôi 💪
Xem bản gốcTrả lời0
ClearSkiesvip
· 12giờ trước
快 nhập một vị thế!🚗
Xem bản gốcTrả lời0
DisillusiionOraclevip
· 19giờ trước
Tuyệt thật, thơm quá!
Xem bản gốcTrả lời0
Layer3Dreamervip
· 19giờ trước
nói một cách lý thuyết, việc hack gradient có thể tạo ra các vector khai thác đệ quy...
Xem bản gốcTrả lời0
GasFeeAssassinvip
· 19giờ trước
Cái gì là thiên ngoại phi tiên
Xem bản gốcTrả lời0
SigmaBrainvip
· 19giờ trước
Đây là cái gì vậy?
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)