본문 바로가기
반응형

데이터라벨링17

데이터 라벨링 재택 알바 새소식 21. 7월 4주차 KAIST 문화기술대학원 한국형 뉴스 영상 메타데이터 표준 모델 KBS, 메트릭스리서치, 액션파워, 소리자바, 데이터메이커, 미소정보기술, 인터마인즈와 함께 컨소시엄을 구성했다고 합니다. 데이터메이커에서 풀릴 수 있겠네요. 고양시 종합 민원 이미지 인공지능 학습용 데이터 광운대 산학협력단, 맞손스스로마을 관리사회적 협동조합, 인사이터, 아와소프트, 아이웹 컨소시엄입니다. 7월 21일부터 사람인(http://www.saramin.co.kr), 인사이터(http://www.cctvaidata.co.kr)에서 크라우드 소싱 형태로 100여 명을 채용할 예정이라고 합니다. 고양시 거주자 우선권이 있다고는 하지만, 관심 있으신 분은 지원해 보세요. 에프원소프트 보행자 및 퀵보드와 같은 개인형 이동장치의 안전을 위.. 2021. 7. 22.
데이터라벨링 재택 데이터알바 소식 분석 21년 7월 정부 바우처 영역별 선정 내역 - 7월 기사 중심 대전시 유성구 기계 독해 요약 텍스트 부문 라벨온을 운영하는 유클리드 소프트와 컨소시엄을 구성했네요. 다만, 지역 일자리 연계 성격이 강해 보이긴 합니다. 미디어젠 화자인식용 음성 데이터 구축 아동 음성 데이터 구축 다화자 음성 합성 데이터 구축 메트웍스를 운영하는 메트릭스리서치가 참여한다고 합니다. 희소식이네요. 심심이컨소시엄 텍스트 윤리 검증 데이터 컨소시엄 참여기관과의 연관성을 볼 때 얼마 전 미디어코퍼스에서 모집한 "가는 말이 고와야 오는 ai도 곱다" 이벤트가 이 사업의 일환 아닌가 싶기도 합니다. (추측) 워트인텔리전스 특허분류 데이터 이공계 전공한 크라우드 워커를 일정 부분 참여시킨다고 합니다. 인천항만공사 항만 물류 데이터 레이블러를 운영하.. 2021. 7. 20.
3분기 데이터라벨링 크라우드소싱 전망 라벨링 작업 기다리고 계신 분들 정말 많죠? 요즘 조금씩 일감이 풀리고는 있지만, 한창 호황기 시절과 비교하면 미미하기 그지없어 갈증을 느끼고 계시리라 생각합니다. 뉴스 검색, 대표적인 소싱 업체들 현황 등을 보면서 하반기 전략을 어찌 짜야할지 고민해보았습니다. 1. Labelr 레이블러 레이블러에서 대량 일감이 풀리기 시작했습니다. 튜토리얼이라는 점을 감안해도 현재 참여중인 인원 대비 데이터량이 상당히 많아 보입니다. 이미 700만건의 계약을 성사한 상황이기 때문에 작업 물량이 상당할 것으로 예상됩니다. 올해 상반기까지 레이블러에 대한 개인정 감상은, 참 혜자스럽다는 것이었는데요. 그러나 이제는 요즘 대세에 맞춰(?!) 까다로워졌습니다. 기존과 달리 개별 인스턴스당 승인/반려 이력을 반영하기 시작하면서.. 2021. 7. 16.
데이터 라벨링 작업 선택하기 팁 저는 2~3월엔 지방 내려가 있느라 10년쯤 된 노트북 하나여서 텍스트 작업 위주로 했고, 남들은 꿀 빨며 했다는 박스 치기는 몇 번 해볼 기회조차 없었습니다. 때와 장소가 잘 맞는 것도 운명이 아닐까 싶습니다. 어쨌든, 몇 안 되지만 라벨링 작업 여기저기 중구난방으로 도전해 봤습니다. 그 과정 중에 겪었고, 터득한 요령 몇 가지만 풀고 가겠습니다. 초반엔 무조건 여기저기 경험해 보세요. 데이터 라벨링을 크라우드 소싱으로 하는 업체들 다 거기서 거기 같으면서 또 다릅니다. 같은 프로젝트여도 지급액, 지급 방식, 작업 할당 방식 조금씩 차이가 있는 경우가 있습니다. 라벨링 툴에서도 차이가 있어요. 작업 툴이 아주 편한 곳이 있는가 하면, 정말 손에 안 익는 곳들도 더러 있습니다. 개인 취향을 탈 수도 있는.. 2021. 7. 12.
레이블러 추가 대화 생성 통과! 레이블러에 비교적 괜찮아 보이는 프로젝트가 하나 추가됐죠. 7월 7일 수요일에 튜토리얼이 오픈되었는데 정말 순식간에 마감되어버리면서 데이터 라벨링에 얼마나 많은 사람들이 관심을 갖고 지켜보고 있는지 실감했습니다. 저는 다행히 오픈 공지 뜨기 전에 발견해서 5개 모두 수행했고, 3시간 만에 반려 없이 모두 승인이 나서 작업자 선정되겠다 기대하고 있었는데, 금요일에 드디어 알림이 왔습니다. 저는 토, 일요일은 사실 진득하게 앉아서 작업하고 있기는 힘들어요. 아마 월요일부터 급 작업 시작할 것 같습니다. 단가도 2,500원으로 센 편이고 시간도 오래 걸리지 않는 이런 프로젝트는 정말 소중하죠. 최대 80건 한정이라는 것이 아쉬울 따름입니다. 커뮤니티를 보니 튜토리얼 반려도 제법 많았나 봅니다. 저는 이 프로젝.. 2021. 7. 11.
레이블러 본격 시동! 추가 대화 생성 튜토리얼 데이터 라벨링을 다소 뒤늦게 시작한 저에게 그나마 작업 물량이 있었던 곳 중 하나가 레이블러입니다. 제가 하기에 적합한 작업이 많기도 했고, 대체로 단가가 꽤 괜찮았습니다. 바우처 사업 관련 작업들 끝난 후로는 물량이 가뭄에 콩 나듯 한 데다가, 단가도 저렴한 것들이 많았지만, 그래도 다른 곳들에 비해서는 시간 대비 수익이 괜찮게 나왔습니다. 그래서 가장 물량 팍팍 떠주길 기다렸던 곳 중 하나이죠. 그리고 튜토리얼 예정 목록이 떴습니다. 요즘 데이터라벨링 일감이 워낙에 없다 보니 데이터가 순식간에 빠질 것이 뻔해 보였습니다. 단가 단위가 다른, 알짜배기로 보이니까요. 그래서 짬나는대로 새로고침하며 확인하길 몇 차례. 드디어 떴습니다! 의도 분류에서 예상치 않게 반려가 너무 많이 나와서 승인률 관리가 필요.. 2021. 7. 8.
검색 품질 평가하기 어제, 캐시미션에 검색 품질 평가하기 미션이 떴습니다. 벌써 3차네요. 경험이 있는 데이터이기도 하고, 건당 1,200+a라니 부랴부랴 튜토리얼 진행하고 미션에 진입했습니다...만... 최근 캐시미션은 짜도 너무 짭니다. 1, 2차 역시 한두 번 하고 말았었습니다. 단가가 짜도 너무 짰거든요. 아마 다들 비슷하리라 생각합니다. 대다수 몇 건 해보고 이건 아니다 싶어서 손을 놨겠죠. 난이도가 어려운 건 아니지만, 초단위로 할 수 있는 작업은 결코 아닙니다. 검색 결과 읽고 분석하고 타이핑까지 해야 하는데 쉽지 않죠. 제 경우는 읽기나 쓰기가 많이 빠른 편이라 텍스트 위주 작업을 선호해서 레이블러 작업을 가장 선호하는 편인데도 이 작업을 빠르게 쳐내기엔 불가능하다고 느껴집니다. 그런데 캐시미션 측은 작업자들.. 2021. 7. 7.
2021년 2분기 데이터 라벨링 수익 데이터라벨링 2월 말부터 조금씩 시작하여 3월엔 제법 쏠쏠했습니다. 뒤늦게 뛰어든 후발주자고 크라우드소싱 사이트를 통해서 짬이 날 때만 조금씩 하는 정도여서 본격적으로 하시는 분들에 비하면 수입이 아주 미미하지만, 생각보다 할만한 것 같습니다. 하지만 2020년 데이터 바우처 정부 사업이 차례차례 종료되면서 상반기 라벨링 데이터 가뭄기를 겪고 있습니다. 3월까지는 그나마 괜찮았는데 4월부터는 작업 물량이 거의 없었어요. 여기저기 문의해 보니 데이터 바우처 공모도 끝났고, 업체간 협약 체결도 거의 마무리되어서 현재는 직접 고용 형태로 정제 작업이 한창인 것 같습니다. 7월부터는 본격적으로 크라우드소싱으로도 풀릴 것 같습니다. 어마어마한 가뭄기였던 4~6월 작업 내역들입니다. aiworks 가뭄에 단비를 내.. 2021. 7. 5.