한국어 멀티모달 감정데이터셋 2020 (KEMDy20)
  • 등록자 노경주
  • 등록일 (수정일 ) 2021-12-21 09:35 (2023-08-02 09:02)
  • 조회수 11254
  • 다운로드 수 383
  • 추가업로드 불가
  • 휴먼이해
#
좋아요 55
#
협약서 필요 (제출전)
Description

KEMDy20 데이터셋 소개

  • 한국어 기반 멀티모달 감정 데이터셋(KEMDy20; Korean Emotional Multi-modal Dataset in 2020)은 발화 음성, 발화의 문맥적 의미(lexical) 및 생리반응 신호- 피부전도도(EDA-electrodermal activity), 맥박관련 데이터(IBI-Inter-Beat-Interval), 손목 피부온도와 발화자의 감정과의 연관성 분석을 위해 수집한 멀티모달 감정 데이셋이다.

    KEMDy20는 한국 공용기관생명윤리위원회의 IRB 승인 절차에 따라 수집하였다 (승인번호: P01-202009-12-001, ‘자유발화 감정인식을 위한 음성 및 생리반응 신호 수집 연구’).



    • * 데이터셋 변경 내역

      - 2022.04.25 : ./wav/~/.txt, '데이터셋 구성'에 사운드특징 태깅에 대한 정보 업데이트

        • - 2023.01.10 (KEMDy20_v1_1.zip) : Sess12/17 파일/폴더명 수정

          - 2023.06.12 (KEMDy20_v1_2.zip) : annotation/ 'disgust' label typo 수정



          데이터셋 수집 절차

        • -  80명의 한국어 발화가 능숙한 만19~39세 성인 대상으로 참여자 2명이 1조가 되어, 각 조가 하나의 세션에 참여(40개 세션)하여 데이터를 수집하였다. 각 세션에서 두명의 참여자들은 Empatica E4의 장치를 손목에 착용한 상태로 5분 내외의 주제 영상을 시청한 후, 상대 참여자와 5분 내외의 자유대화를 한다. 각 조는 6편의 주제 영상에 대한 시청과 자유발화 과정을 반복한다. 대상자들의 6개의 주제에 대한 자유 발화 과정에서의 두명의 참가자의 발화 음성, 발화 텍스트, 발화자 바이오 신호 데이터를 수집하였다. 대상자의 자유발화 상황은 비디오로 녹화되었다.
        • - 한국어를 모국어로 사용하는 성인 10명의 외부 감정 관찰자는 녹화된 감정상황극 영상을 시청하며, 성우가 발화한 각 발화(세그먼트) 별로 7가지의 카테고리 감정 레이블 (기쁨놀람분노중립혐오공포슬픔 1개를 선택하고, 5단계(1~5)각성도(arousal)와 긍/부정도(valence)를 평가하였다
        • - 감정 레이블 평가 파일(KEMDy20/annotation)은 각 세그먼트의 외부 관찰자의 감정 레이블 평가결과를 포함한다발화 세그먼트 별 최종 카테고리 감정 레이블은 10명의 평가자에서 가장 많이 선택된 레이블로 결정(동일 평가 수를 갖는 경우에는 중복 레이블로 설정)되었고각성도와 긍/부정도는 각 평가자의 평균값으로 계산되었다
               - Arousal : (이완) 1-2-3-4-5 (각성)
        •      - Valence : (부정) 1-2-3-4-5 (긍정)


        KEMDy20 데이터셋 구성

      • o 폴더 구성

      • o. ./wav/~/.txt : 발화세그먼트의 음성 이외 사운드상황에 대한 태킹
      • - c/ : 휴지구간이 확보되지 않은 연속발성(0.3초 미만) 

        - n/ : 발성 이외의 단발적인 소음이 포함된 음성데이터

        - N/ : 음성 구간의 50% 이상 잡음이 포함된 음성데이터

        - u/ : 단어의 내용을 알아 들을 수 없는 음성데이터

        -  l/ : 발성중 '음음 소리가 포함된 상황 (small 'L')

        - b/ : 발성 중 숨소리, 김침 소리가 포함된 음성데이터

        - * : 단어 중 일부만 알아 듣거나, 알아들었으나 정확하지 않은 음성데이터

        - + : 발성 중 말을 반복적으로 더듬는 음성데이터

        - / : 간투사


      • o. KEMDy20/annotation/.csv


      • o. KEMDy20/EDA/session1~40/.csv
      • -  col. A : E4 EDA 누적 값 (*샘플의 EDA 변화량의 누적 값)
      • - col. B : 해당 데이터 측정 시간순서
      • - col. C : 해당 EDA 값이 속하는 세그먼트ID


      • o. KEMDy20/IBI/session1~40/.csv
      • -  col. A : E4 IBI 샘플링 주기 순서
      • -  col. B : E4 IBI
      • -  col. C : 해당 데이터 측정 시간 순서
      • - col. D : 해당 IBI값이 속하는 세그먼트ID



      • o. KEMDy20/TEMP/session1~40/.csv
      • -     col. A : E4 피부온도 값

        -     col. B : 해당 데이터 측정 시간 순서

        -     col. C : 해당 피부온도 값이 속하는 세그먼트ID


      인용

      [1] K. J. Noh and H. Jeong, “KEMDy20,” https://nanum.etri.re.kr/share/kjnoh/KEMDy20?lang=ko_KR 

      [2] NOH, Kyoungju; JEONG, Hyuntae. Emotion-Aware Speaker Identification with Transfer Learning. IEEE Access, 2023.


      데이터 파일 (총 2 개)
      KEMDy20_v1_1.zip

      요약 2023.01.10 : Sess12/...

      • 등록일  2023-01-10
      • 파일명   KEMDy...
      • 크기  1.9GB
      • 다운로드 수  349
      KEMDy20_v1_1.zip

      요약 2023.01.10 : Sess12/...

      • 등록자  노경주
      • 파일명   KEMDy20_v1_1.zi...
      • 크기  1.9GB
      • 다운로드 수  349
      2023.01.10 : Sess12/17 파일/폴더명 수정, *최신버전(KEMDy20_v1_1.zip)
      KEMDy20_v1_2.zip

      요약 KEMDy20_v1_2.zip

      • 등록일  2023-06-12
      • 파일명   KEMDy...
      • 크기  1.9GB
      • 다운로드 수  34
      KEMDy20_v1_2.zip

      요약 KEMDy20_v1_2.zip

      • 등록자  노경주
      • 파일명   KEMDy20_v1_2.zi...
      • 크기  1.9GB
      • 다운로드 수  34

      KEMDy20_v1_2.zip