발표 및 스탭 안내
home

2시-2시30분

발표자
박대영
소속
금융보안원 AI/Data researcher
영상 공개 여부
주제
LLM 위협 및 안전 동향: 레드팀, 탈옥 및 가드레일 중심으로

발표자 소개

안녕하세요, 금융보안원에서 금융권 내 AI 및 데이터 활용, 프라이버시, 보안 그리고 안전 분야를 기술적/정책적 관점에서 연구하고 있는 박대영 입니다. 금융산업에서 활용가능한 "실용적" 연구를 하는 researcher의 삶을 추구합니다 :)

발표 제목

LLM 위협 및 안전 동향: 레드팀, 탈옥 및 가드레일 중심으로

발표 내용

최근 LLM의 급격한 발전과 함께, LLM 안전 및 보안 문제는 중요한 연구 분야로 떠오르고 있습니다. LLM은 훌륭한 도구임에 분명하지만, 동시에 악용될 수도 있고 또한, 충분한 검토 및 평가가 선행되지 않으면 자사 서비스에 악영향을 줄 수 있습니다. 이에 따라, LLM의 위협을 분석하고 이를 방어하기 위한 기술적/정책적 대응이 필수적입니다. 관련하여, 최근 주목받은 세부 주제 중 핵심인 LLM 레드팀, 탈옥 및 가드레일을 중심으로 설명드리겠습니다 :)

발표 자료

최종_랭콘 25 발표_박대영.pdf
8410.1KB