ETRI AI 나눔

협약서 필요 (제출전)

Description

한국어 기반 음성감정 데이터셋(Korean Emotional Speech Dataset: KESDy18)은 음성기반 감정 인식(Speech Emotion Recognition: SER) 기술 연구를 위해 헤드셋 마이크(Shure S35) 장치를 통해 수집한 음성데이터에 대한 데이터셋이다(2018.04~2018.09).
데이터셋 이관 안내

총 30명의 한국인 성우(남/여 각 15명)를 대상으로 제자리 서기(정적)/제자리 걷기(동적)의 신체상태에서 특정 문장을 발화하는 과정에서의 성우의 음성데이터를 수집하였다. 성우는 정적/동적 상태에서 4가지 카테고리 감정(중립, 행복, 슬픔, 분노)을 표현하며 각 감정 카테고리당 20문장의 한국어 문장을 발화하였다.
한국어를 모국어로 사용하는 성인 6명의 감정 레이블 평가자가 성우가 발화한 각 문장을 청취 한 후, 각 문장에 대한 자신이 느끼는 7개의 카테고리 감정 레이블 (기쁨, 놀람, 분노, 중립, 혐오, 공포, 슬픔) 중 1개를 선택하고, 5단계(1~5)의 각성도(arousal)와 긍/부정도(valence)를 평가하였다.
데이터 셋에 포함되는 감정 레이블 평가 파일(SER-DB-ETRIv18_emotion_label_annotation.xlsx)은 각 발화 음성(세그먼트)에 대한 평가 통계 정보를 포함한다. 각 발화 세그먼트 별 최종 카테고리 감정레이블에 대한 평가는 평가자의 다수 선택을 받은 카테고리 감정 레이블로 결정(동일 평가 수를 갖는 경우에는 중복 레이블로 설정)되고, 각성도와 긍/부정도는 각 평가자의 평균값으로 계산되었다.

- Arousal : (이완) 1-2-3-4-5 (각성)

- Valence : (부정) 1-2-3-4-5 (긍정)

데이터 파일 (총 1 개)

요약 KESDy18

요약 KESDy18

KESDy18

전화번호	* 데이터 삭제 건에 대해 오프라인으로 협의가 필요 할수 있어, 연락처를 요청드립니다.양해 부탁드립니다 불편하시더라도 연락처 기재부탁드립니다.
사유