본문 바로가기
데이터라벨링

데이터 라벨링 작업 선택하기 팁

by Misc. 2021. 7. 12.

저는 2~3월엔 지방 내려가 있느라 10년쯤 된 노트북 하나여서 텍스트 작업 위주로 했고, 남들은 꿀 빨며 했다는 박스 치기는 몇 번 해볼 기회조차 없었습니다.

때와 장소가 잘 맞는 것도 운명이 아닐까 싶습니다.

어쨌든, 몇 안 되지만 라벨링 작업 여기저기 중구난방으로 도전해 봤습니다.
그 과정 중에 겪었고, 터득한 요령 몇 가지만 풀고 가겠습니다.

 

 

초반엔 무조건 여기저기 경험해 보세요.

 

데이터 라벨링을 크라우드 소싱으로 하는 업체들 다 거기서 거기 같으면서 또 다릅니다.
같은 프로젝트여도 지급액, 지급 방식, 작업 할당 방식 조금씩 차이가 있는 경우가 있습니다.

라벨링 툴에서도 차이가 있어요.
작업 툴이 아주 편한 곳이 있는가 하면, 정말 손에 안 익는 곳들도 더러 있습니다.
개인 취향을 탈 수도 있는 부분이라 딱 추천은 못 드립니다.
여기저기 경험해 보면서 내가 익히기 쉽고, 다루기 쉬운 곳을 택하는 것이 현명한 것 같습니다.

얼마전 새로 뚫어본 나초스

 

 

 

 

작업도 여러가지 겪어보세요.

 

해보지 않으면 알 수 없습니다. 내가 어떤 부분에 강점이 있는지를요.
유난히 반려가 높게 나오는 프로젝트, 쉽게 했는데도 쉽게 승인이 나는 프로젝트 다 있습니다.

아직은 작업 물량이 워낙 없어 가이드 보다 보면 할당량 끝나버리는 일이 비일비재하지만, 이제 본격적으로 데이터 쏟아지기 시작하면, 골라가며 해야 할 때가 올 거예요.

그럴 때 선택을 위한 기준과 튜토리얼에 들이는 시간과 공을 생각하면 나의 강점과 단점을 찾는 것이 우선입니다.

라벨링 처음 접한 제 똥손으로 물고기는 어려웠어요...

 

 

충격과 공포의 답변의 의도 분류

 

 

 

 

 

연습으로 좋아지는 분야도 있습니다.

 

대체로 박스치기, 폴리곤 그리기 등이 그런 것 같습니다.

저의 경우도 처음에는 멋모르고 노트북에서 도전했다가 수많은 반려를 마주하게 됐던 물고기 바운딩... 이 프로젝트 레이블러에서는 전설의 프로젝트였다고 합니다. 물량 많고 쉬워서요. ㅠ_ㅠ 그러나 제 똥손으로는 튜토리얼 통과조차 불가능했습니다.

지금은 그래도 그럭저럭 할만한 정도까지는 된 것 같습니다.
그동안 수시로 박스치기, 폴리곤 프로젝트를 다른 곳에서라도 적은 양이나마 꾸준히 해 왔어요.

그 결과 지금은 가이드 오독이나 시야 착오로 실수가 나지 않는 한은 승인률이 꽤 올라간 것 같습니다.
기왕이면 가이드 친절한 곳을 추천드립니다.
그게 실력 향상의 지름길이었어요.

 

난이도가 훅 뛰었다는데, 의외로 할만했던 마이크라우드. 그러나 물량이 없어요...

 

반면, 단시간 연습으로 좋아지기는 힘든 분야도 있습니다.
평소에 글쓰는 연습을 충분히 해보지 않은 분들에게는 문장을 구성해야 하는 레이블러의 대다수 프로젝트가 어렵게 느껴질 수 있습니다.

AI 분류 관련 태깅... 이쪽은 저도 워낙 약해서 뭐가 필요한지 짐작조차 못 하겠습니다.
크라우드웍스와 레이블러에서 삭제와 반려를 겪고 나니 자신감이 뚝...

평소 감정 기복이 극히 적은 분들에게 적합하지 않을까 생각합니다.
저의 반려 내용을 보면 대체로 제 판단력은 감정적이구나 많이 느꼈습니다.
실제로 저는 감정기복이 심한 편입니다.

 

수전증이 심해서 트래킹은 포기했습니다.

 

 

 

본격적인 시즌이 돌아오면 1~3군데에 집중하는 것이 좋습니다.

 

중요합니다.

소싱 시스템이 완전히 자동화된 곳 몇 곳을 제외하고, 프로젝트 단위 업무가 많은 업체들은 시간당 처리 분량, 할당 시간, 작업 품질 등에 따라 차등적으로 보상을 지급하는 경우도 많이 있습니다. 일종의 인센티브죠.

실제로 수익금 많이 가져가시는 분들은 대체로 1~2군데에 올인하십니다.

그래서 지금 이 시기밖에 연습할 기회가 없습니다.
저 역시 지금은 몸풀기로 연습하는 단계라고 생각하고 있습니다.

그럼 라벨러 여러분, 건강 관리 잘 하시고 행운이 가득하시길!

 

 

반응형

댓글