한국어 기반 음성감정 데이터셋(Korean Emotional Speech Dataset: KESDy18)은 음성기반 감정 인식(Speech Emotion Recognition: SER) 기술 연구를 위해 헤드셋 마이크(Shure S35) 장치를 통해 수집한 음성데이터에 대한 데이터셋이다(2018.04~2018.09).
If you want to proceed in English, go to the English web page for KESDy18 dataset below :
총30명의
한국인 성우(남/여 각
15명)를 대상으로 제자리 서기(정적)/제자리 걷기(동적)의
신체상태에서 특정 문장을 발화하는 과정에서의 성우의 음성데이터를 수집하였다. 성우는 정적/동적
상태에서 4가지 카테고리 감정(중립, 행복, 슬픔, 분노)을 표현하며 각 감정 카테고리당 20문장의 한국어 문장을 발화하였다.
한국어를 모국어로 사용하는 성인 6명의 감정 레이블
평가자가 성우가 발화한 각 문장을 청취 한 후, 각 문장에 대한 자신이 느끼는 7개의 카테고리 감정 레이블 (기쁨,
놀람, 분노, 중립, 혐오, 공포, 슬픔) 중 1개를 선택하고, 5단계(1~5)의 각성도(arousal)와 긍/부정도(valence)를 평가하였다.
데이터 셋에 포함되는 감정 레이블 평가 파일(SER-DB-ETRIv18_emotion_label_annotation.xlsx)은 각 발화 음성(세그먼트)에 대한 평가 통계 정보를 포함한다. 각 발화 세그먼트 별 최종 카테고리 감정레이블에 대한 평가는 평가자의 다수 선택을 받은 카테고리 감정 레이블로 결정(동일 평가 수를 갖는 경우에는 중복 레이블로 설정)되고, 각성도와 긍/부정도는 각 평가자의 평균값으로 계산되었다.
- Arousal : (이완) 1-2-3-4-5
(각성)
- Valence : (부정) 1-2-3-4-5
(긍정)
데이터 셋 구성
출판
한국어 기반 음성감정 데이터셋의 수집은 한국전자통신연구원 연구운영비지원사업의 일환으로 수행되었다[18ZS1100, 자율성장형 AI 핵심원천기술 연구].
본 데이터셋을 사용한 논문, 연구결과 발표자료에는 아래의 본 데이터과 관련한 연구논문에 대한 사사문구를 포함하여야 한다.
Noh, K.J.; Jeong, C.Y.; Lim, J.; Chung, S.; Kim, G.; Lim, J.M.; Jeong, H. Multi-Path and Group-Loss-Based Network for Speech Emotion Recognition in Multi-Domain Datasets. Sensors 2021, 21, 1579. https://doi.org/10.3390/s21051579
디렉토리 구성
Datasets
File(s)
(Total
1 Unit)
KESDy18
Description
KESDy18
Created 2020-07-22
File
KESDy...
Size 207.7MB
Download153
KESDy18
Description
KESDy18
Provider 노경주
File
KESDy18.zip
Size 207.7MB
Download153
KESDy18
License Agreement
반려사유
Agree to upload
ETRI 인공지능 공유 플랫폼 업로드 동의
제10조 ETRI 인공지능 공유 플랫폼 서비스 제공자의
책임제한
1
ETRI 인공지능 공유 플랫폼 서비스 제공자는 무료로
제공되는 ETRI 인공지능 공유 플랫폼 서비스의 결과의 정확성, 적합성, 신뢰성, 정당성, 적법성, 지속성
등을 보증하지는 않으며, ETRI 인공지능 공유 플랫폼의 사용 및 사용불능으로 인하여 이용자에게 발생한
손해에 대해서도 책임을 지지 않습니다.
2
ETRI 인공지능 공유 플랫폼 서비스 제공자는 이용자 상호
간 및 이용자와 제3자 간에 ETRI 인공지능 공유 플랫폼 서비스를 매개로 발생한 분쟁에 대하여 개입할
의무가 없으며, 해당 분쟁에서의 손해에 대한 배상 책임 또한 지지 않습니다. 만약 이용자와 분쟁중인 제3자가
ETRI 인공지능 공유 플랫폼 서비스 제공자를 상대로 이의를 제기할 경우 이용자는 자신의 비용과 책임으로
문제를 직접 해결하고 ETRI 인공지능 공유 플랫폼 서비스 제공자를 면책시켜야 하며 인공지능 공유 플랫폼
서비스 제공자에 발생한 손해를 배상하여야 합니다.
제11조 개인정보의 보호, 로그정보의 보관 및 활용 등
1
ETRI 인공지능 공유 플랫폼 서비스 제공자인
ETRI(판교센터)는 ETRI 인공지능 공유 플랫폼 서비스를 운영함에 있어 이용자에 대한 각종 고지사항의
전달, 이용실태에 대한 조사 등을 위하여 이용자의 연락처 등 개인정보를 보관합니다.
2
ETRI는 개인정보 수집 및 이용 동의에 따라 이용자로부터
수집한 정보만을 보관하며, ETRI 내부의 개인정보 처리방침에 따라 이를 철저히 관리합니다.
3
ETRI는 인공지능 공유 플랫폼 서비스의 제공을 종국적으로
중단하거나 이용자가 개인정보 수집 및 이용 동의를 철회한 경우에는 지체 없이 이용자의 개인정보를 파기합니다.
4
ETRI는 기타 개인정보보호 법령에서 정한 내용을
준수합니다.
5
ETRI는 인공지능 공유 플랫폼 서비스를 제공함에 따라
발생하는 로그정보를 회원 탈퇴시점까지 보관할 수 있습니다. 또한 ETRI는 그와 같이 보관하고 있는
로그정보를 ETRI 인공지능 공유 플랫폼 서비스의 이용자 만족도 향상을 위해 활용할 수 있습니다.
제12조 게시물의 저작권
1
ETRI 인공지능 공유 플랫폼 서비스 이용자가 게시한
게시물의 내용에 대한 권리는 기본적으로 이용자 본인에게 있습니다.
2
다만, ETRI 인공지능 공유 플랫폼 서비스 제공자인 ETRI는 게시된 내용을 사전 통지 없이 편집, 이동
할 수 있는 권리를 보유하며, 다음의 경우 사전 통지 없이 삭제할 수 도 있습니다.
1.본 서비스 약관에 위배되거나 상용 또는 불법, 음란, 저속하다고
판단되는 게시물을 게시한 경우
2.다른 회원 또는 제 3자를 비방하거나 중상모략으로 명예를
손상시키는 내용인 경우
3.공공질서 및 미풍양속에 위반되는 내용인 경우
4.범죄적 행위에 결부된다고 인정되는 내용일 경우
5.제3자의 저작권 등 기타 권리를 침해하는 내용인 경우
6.기타 관계 법령에 위배되는 경우
3
ETRI 인공지능 공유 플랫폼 서비스 이용자의 게시물이
타인의 저작권을 침해함으로써 발생하는 민, 형사상의 책임은 전적으로 해당 이용자가 부담하여야 합니다.
I agree to the upload terms.
License Agreement
- 한국어 음성 감정 데이터셋 (KESDy18) -
제 1조 . 본 사용 허가 협약에 동의하여 서명한 협약서를 한국전자통신연구원(이하 제공자)에 제출한 사람만이 본 데이터셋을 본 협약의 내용에 따라 보유하고 사용할 자격을 갖는다.
제 2조 . 본 데이터셋은 제공자의 서면 승인 없이 제3자에게 제공, 양도, 사용 허가할 수 없다.
제 3조 . 본 데이터셋은 연구용도로만 사용이 가능하며, 상업용으로 사용은 불허한다.
제 4조 . 본 데이터셋이 협약자로 인해 유출되어 문제가 발생하였을 경우 본 협약자는 민, 형사상의 모든 법정 책임을 부담한다.