Transcription Data

Trainable Data Pool (TDP)

학습이 가능한 전사 데이터를 관리하는 화면으로 전사세트 구성, LR/HR 평가, 전체 삭제, 데이터 세트 불러오기, 데이터 업로드가 가능합니다.

전사작업자가 가져간(Fetched) 오디오 파일을 수정하여 제출(In Review)한 경우, 관리자는 해당 오디오 파일과 듣고 전사 내역을 확인할 수 있으며, 전사 내역에 대한 평가를 별점으로 진행할 수 있습니다.

  • Decoded : Decoder (음성인식기)를 통해 디코딩을 마친 상태

  • Unconfirmed HR(High Risk) : 아직 전사자가 수정하지 않았고, HR 세그먼트(high risk segment)를 포함하고 있는 오디오 파일(record). High Risk 세그먼트는 같은 모델로 디코딩 된 모든 오디오 파일들 안에 존재하는 세그먼트 중, Risk 값이 상위 30% 안에 들어가는 세그먼트를 의미하며 사용자가 직접 리스크 값을 지정하는 경우, 지정된 리스크 값 보다 높은 세그먼트를 포함하고 있는 오디오 파일을 의미

  • Unconfirmed LR(Low risk) : 전사자 수정 전, Low Risk 세그먼트 만으로 이루어진 파일

  • Fetched : 등록된 전사자(transcriber)의 요청에 의해 해당 전사자에게 지정되어 수정중인 오디오 파일

  • In Review : 전사자의 승인요청이 완료된 상태로 매니저는 해당 내용을 검토 후 승인(Confirmed) 처리

  • Confirmed : 매니저가 검토를 모두 마치고 최종 승인 상태 (Model Training이 가능함)

  • Rejected : 매니저가 전사자의 승인 요청에 대한 내용을 반려하였을 경우

circle-info

선택적으로 음성인식기 학습에 유리한 부분만 전사할 수 있다면, 전사 비용 절감이 가능합니다.

Field Definitions

Field

Description

파일 이름

오디오, 전사 파일에 대한 이름을 표시합니다.

모델 설정

해당 오디오, 전사 파일에 대해 설정된 모델을 나타냅니다.

재생 길이

오디오 파일에 대한 재생 길이를 나타냅니다.

날짜

해당 오디오 파일이 업로드된 날짜를 표시합니다.

상태

해당 파일에 대한 현재 상태값을 표시합니다.

High Risk

High Risk에 포함되는 파일의 개수를 나타냅니다.

Last updated