AI'당근'이 '폭탄'이 되는 순간: LLM의 내부 표현을 탈취하는 Doublespeak 공격의 실체무해한 단어로 유해한 정보를 이끌어내는 Doublespeak 공격의 원리와 LLM 안전장치의 한계를 분석하고, 엔지니어링 관점의 대응 방향을 제시합니다.