앤트로픽 내부 CMS 설정 오류로 프로젝트 글래스윙, 클로드 미토스 등 정보 유출
프로젝트 글래스윙이라는 코드명과 신규 모델 클로드 미토스의 벤치마크 및 블로그 포스트 초안 유출.
앤트로픽(Anthropic)이 주도하여 출범시킨 차세대 사이버 보안 연합체이자 보안 강화 이니셔티브. 앤트로픽이 개발한 클로드 미토스의 능력을 활용하여, 공격자보다 먼저 소프트웨어 취약점을 찾아내고 수정하는 체계를 구축하려고 함. 1억 달러 규모의 사용 크레딧과 400만 달러의 오픈소스 기부금을 투입, AI 시대의 사이버 보안의 흐름을 정확히 보여줌. 빅테크의 독점이 될지, 현실적인 보안 대책이 될지 시험대가 될 것으로 판단.
프로젝트 글래스윙이라는 코드명과 신규 모델 클로드 미토스의 벤치마크 및 블로그 포스트 초안 유출.
앤트로픽은 90일 이내에 학습 내용과 공개 가능한 취약점 수정 및 개선 사항을 공개적으로 보고할 것이라고 발표.
이 보고서는 AI가 더 이상 단순한 보조 도구가 아니라, 복잡한 소프트웨어 시스템의 심층적인 구조적 결함을 스스로 찾아내고 이용할 수 있는 단계에 진입했음을 경고.
기술적 데이터 중심인 시스템 카드 보고서와 달리, 모델의 사회적 영향력과 앤트로픽의 향후 비전에 초점을 맞추는 블로그 포스트.
프로젝트 이름(Glasswing)은 유리날개 나비(그레타 오토)의 이름을 따서 지음. 나비의 투명한 날개는 눈에 띄지 않게 숨어지낼 수 잇게 하는데 이는 소프트웨어의 취약성과 유사함. 또한 투명한 날개는 나비가 위험을 피할 수 있게 해주는데 이는 이 프로젝트가 추구하는 투명성과도 일치함.
프로젝트 글래스윙 홈페이지