데이터라벨링 작업 종류 정리

데이터라벨링 작업 종류 정리 그리고 어떻게 해야 하는지에 대한 글을 작성해 보려고 합니다. 데이터라벨링 부업으로도 많이 하고 있고 전업으로 하시는 분들도 많으신데요. AI 시대가 시작된 만큼 파이프라인으로 하나 만들어 두면 좋을 것 같습니다.


이미지 라벨링

이미지 라벨링은 크게 객체 인식, 이미지 분류, 세그맨테이션 이렇게 세 개로 나눈다고 보시면 됩니다. 각각 어떻게 작업을 해야 하는지는 다음을 봐주세요.

  • 객체 인식: 이미지 안에 있는 특정 객체, 사물 등을 식별하여 해당 객체나 사물에 라벨을 추가하는 작업입니다. 예를 들어 설명하자면 자동차, 동물, 사람, 사물 등 객체에 태그를 붙이는 일이라고 생각하시면 됩니다.
  • 이미지 분류: 이미지를 여러 카테고리로 분류하는 작업입니다. 한마디로 이미지가 어떤 카테고리에 속하는지 판별하는 작업인데요. 예를 들어 설명해 보겠습니다. 피자, 햄버거, 치킨의 사진이 있습니다. 사람은 사진을 바로 보면 알 수 있지만 컴퓨터는 모르기 때문에 이게 어떤 이미지인지를 알려줘야 합니다. 그래서 피자 이미지는 피자, 치킨 이미지는 치킨 이런 식으로 카테고리를 나눠주는 작업입니다.
  • 세그멘테이션: 이미지 내에 있는 객체를 픽셀 단위로 구분하는 작업입니다. 한마디로 객체를 누끼 따는 형식으로 작업을 한다고 생각하시면 쉽습니다.


텍스트 라벨링

텍스트 라벨링은 감정 분석, 개체 인식, 요약 생성 이렇게 나눌 수 있고 각 작업별로 어떻게 진행하는지 설명해 드리겠습니다.

  • 감정 분석: 텍스트의 감정을 분석하여 어떤 감정인지 알려준다고 생각하면 됩니다. 긍정적, 부정적, 중립적으로 나눌 수도 있고 슬픔, 기쁨, 분노 이런 식으로 작업하는 일도 있습니다. 예를 들어 “나는 너무 행복해” 이건 긍정적, “오늘 넘어져서 너무 화가났어” 이건 부정적, 이런 식으로 작업을 하면 됩니다.

  • 객체 인식: 텍스트에 있는 특정 정보나 사람, 장소, 날짜 등을 식별하여 라벨을 붙이는 작업입니다. 예를 들어 “영국의 수도는 런던입니다”에서 ‘영국’은 나라, ‘런던’은 장소로 라벨링 해주는 것이죠

  • 요약 생성: 말 그대로 긴 텍스트를 읽어보고 핵심을 짧게 요약해 주는 작업입니다.


음성 라벨링

음성 라벨링은 음성 텍스트 변환, 감정 분석, 음성 명령 인식으로 작업이 나누어져 있습니다.

  • 음석 텍스트 변환: 소리를 듣고 들리는 말을 텍스트로 바꾸는 작업입니다. 우리가 들리는 말을 텍스트 즉 글로 바꾸는 작업을 하고 그걸 음성 인식 소프트웨어나 AI가 배워서 음성을 듣고 텍스트로 변환할 수 있게 만들어주는 작업입니다.

  • 감정 분석: 텍스트 라벨링에서 하는 감정 분석과 비슷하다고 생각하시면 됩니다. 단지 이번에는 음성을 듣고 어떤 감정에 맞게 라벨링 해주면 됩니다.

  • 음성 명령 인식: 특정 음성 명령을 인식하여 이를 라벨링 하는 작업입니다. 예를 들어 “노래 틀어줘”, “노래 꺼 줘” 라는 말을 듣고 해당 명령에 대한 라벨을 붙이는 일입니다.


비디오 라벨링

비디오 라벨링은 객체 추적, 행동 인식, 장면 분할 세 가지의 작업을 할 수 있습니다.

  • 객체 추적: 특정 개체를 시간에 따라 지속적으로 추적하는 작업입니다. 비디오의 첫 프레임에서 추적하려는 객체를 찾아내고 이후에 객체가 어디로 이동하는지 위치를 추적하는 일이라고 생각하시면 됩니다. 이 작업이 나중에 어디에 쓰이는지 알면 이해가 쉬울 것 같아 말씀드리자면 객체 추적을 활용한 일로는 보안 시스템(누가 어디로 이동하는지), 스포츠 분석(게임 플레이 경로나 속도 분석), 자율주행차(보행자, 자전거, 다른 자동차 추적하여 사고예방)가 있습니다.

  • 행동 인식: 비디오 속에서 객체가 하는 특정 행동을 식별해서 라벨을 붙이는 작업입니다. 예를 들어 사람이 걷거나 눕거나 달리면 각 행동에 맞게 “걷기”, “눕기”, “달리기” 등으로 라벨링 하는 일입니다.

  • 장면 분할: 비디오를 장면별로 나눈 다음에 각 장면에서 중요한 객체나 행동을 식별하여 라벨링 하는 작업입니다.

데이터라벨링 자격증

데이터라벨링은 자격증 없이도 할 수 있지만 자격증이 있다면 더 많은 작업을 할 수 있어 좋습니다. 데이터 라벨링은 2급 자격증부터 딸 수 있고 그다음에 1급을 딸 수가 있습니다. 그리고 데이터라벨링 작업을 할 수 있는 사이트가 요즘은 많아진 것 같더라고요. 대표적으로는 크라우드 웍스가 있고 그 외에도 다양한 사이트가 있으니 검색해 보시면 금방 찾을 수 있습니다.

☞ 크라우드웍스 바로가기

☞ 데이터라벨링 자격증에 대해 자세히 알아보기

마무리

데이터라벨링 작업 종류 정리 그리고 작업 방법과 관련 자격증에 대해 정리를 해봤습니다. AI 시대가 온 만큼 사라질 직업과 새로 생길 직업에 대한 관심이 많은데요. 혹시 모를 상황을 대비해 AI 관련 일을 미리 준비해 두시면 좋을 것 같습니다.

☞ AI 시대, 사라질 직업과 새로 생길 직업은?

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다