멀티모달 신원 인식 시험 데이터셋(Multimodal Identity Recognition Test Dataset: MIRT
Dataset)은 다양한 환경 변화에 강인한 얼굴, 화자 및 성별 인식 기술 개발을 목적으로
실환경에서 다양한 노이즈를 고려해 음성과 영상 데이터를 수집한 멀티모달 기반 얼굴/화자/성별 인식용 시험 데이터셋입니다.
본 데이터셋은 한국전자통신연구원
생명윤리위원회(IRB) 승인 절차에 따라 데이터를 수집하였습니다(승인번호: N01-202308-01-012, ‘실 환경 서비스 상황에서
사용자 반응에 지속적으로 지역(Local) 적응하는 로봇 지능 기술 개발’).
+----- Bank_Audio_Data
| +----- User_ID
| | User_ID_Bank_Loc1_Utterance_001.wav
| | User_ID_Bank_Loc1_Utterance_002.wav
| | ...
| ...
+----- Bank_Face_Data
| +----- User_ID
| | User_ID_Bank_Loc1_Env1_001.jpg
| | User_ID_Bank_Loc1_Env1_002.jpg
| | ...
| ...
+-----
Test_Audio_Data
| +----- User_ID
| | User_ID_Test_Loc1.wav
| | User_ID_Test_Loc2.wav
| | User_ID_Test_Loc3.wav
| ...
+-----
Test_Face_Data
| +----- User_ID
| | User_ID_Test_Loc1_Env1.mp4
| | User_ID_Test_Loc1_Env2.mp4
| | ...
| ...
+----- Demo_Data
| +----- User_ID
| | User_ID_Demo_Loc1_Env1.mp4
| | User_ID_Demo_Loc1_Env2.mp4
| | ...
+----- Labels
| +----- Bank_Audio_Data.json
| | ...
데이터 명
|
해상도
|
데이터 형태
|
데이터 크기
|
Bank_Audio_Data
|
|
WAV
|
1.12GB
|
Bank_Face_Data
|
1920x1080
|
JPG
|
1.93GB
|
Test_Audio_Data
|
|
WAV
|
6.26GB
|
Test_Face_Data
|
1920x1080
|
MP4
|
52.1GB
|
DEMO_Data
|
1920x1080
|
MP4
|
51.8GB
|
|
|
Total
|
113.21GB
|
1) 박물관
2) 카페 & 식당
얼굴/화자/성별 테스트 DB 주석(Annotation)
- 주석 정보
Name
|
Description
|
filepath
|
Path
of data file
|
environment
|
Env1:
Normal Face, Env2: Sunglass, Env3: Mask, Env4: Hat,
Env5: Sunglass & Mask, Env6: Sunglass & Hat, Env7: Mask & Hat,
Env8: Sunglass & Mask & Hat
|
location
|
Loc1:
Museum, Loc2: Restaurant, Loc3: Caffe
|
person_id
|
Person
id: P01 ~ P20
|
gender
|
Gender:
Male, Female
|
본 데이터셋은 사용허가협약서에
동의하시고 승인을 받으신 후 다운로드 가능합니다.
- 이름: 박천수 책임연구원
- 이메일: bettle@etri.re.kr
- 전화번호: 042-860-1194
- 소속: 한국전자통신연구원 소셜로보틱스연구실
※ 본 데이터셋은 과학기술정보통신부 산하 정보통신기획평가원의
“실 환경 서비스 상황에서 사용자 반응에 지속적으로 지역(Local)
적응하는 로봇 지능 기술 개발(2020-0-00842)” 과제 수행 결과로 구축되었습니다.