Scale AI 해독: 인공 지능 뒤에 숨은 "작업자"의 지혜? 데이터 태그: 유니콘 가치 8년 만에 73억 달러로 오른 비결

규모AI

머리말

OpenAI는 ChatGPT를 통해 생성적 AI 혁명을 일으켰고, Waymo는 자율주행 기술을 사용해 북미 거리로 퍼졌고, NVIDIA는 GPU 이미지 처리 기술로 한때 시가총액 2위 기업이 되었습니다...
이들 기업은 AI를 대량으로 활용하는 것 외에도 한 가지 공통점이 있다. 모두 스타트업인 Scale AI와 협력해 AI 훈련을 하고 있다는 점이다.

실제로 어떤 업계에 있든 모든 성공적인 AI 회사 뒤에는 지루하지만 꼭 필요한 교육 작업인 데이터 라벨링을 완료하는 사람들이 있습니다.

 

미국의 새로운 유니콘인 Scale AI가 그 선두주자 중 하나입니다.

규모AI-4

그는 19세에 Scale AI를 설립하기 위해 학교를 중퇴했습니다. Alexandr는 Scale AI가 생성적 AI 골드러시에서 삽을 파는 것과 같은 데이터 라벨링 서비스를 제공한다고 말했습니다(이 설명이 친숙하게 들리나요😆).

많은 AI 스타트업이 아직 한 푼도 벌지 못한 반면, Scale AI의 지난해 매출은 2억 5천만 달러에 이르렀고, 그 가치는 73억 달러에 달했습니다. 고객은 OpenAI와 Tesla부터 미 공군, 육군, CIA 등에 이르기까지 다양합니다.

그렇다면 데이터 태그란 정확히 무엇입니까? 왜 그렇게 수익성이 좋을 수 있습니까? Scale AI는 어떻게 경쟁이 치열한 AI 분야에서 틈새시장을 찾아 성공적으로 유니콘으로 성장할 수 있었나요?

오늘은 Scale AI에 대한 이야기를 여러분께 전해드리려고 합니다!

1분밖에 시간이 없다면 3가지 테이크아웃

  1. AI 시대, 데이터가 가져온 성장 모멘텀 :

 날로 발전하는 인공지능에는 좋은 모델과 컴퓨팅 능력 외에도 데이터와 데이터 정확성이 요구되는데, 이는 종종 간과되지만 매우 중요합니다. Scale AI는 다른 회사가 대량의 데이터에 라벨을 지정하고 처리하여 AI 모델에 공급되는 데이터의 품질이 향상되도록 돕습니다.

  1. AI 제품 및 시장 확장:

Scale AI의 제품은 다음과 같은 세 가지 수준의 AI에 대한 서비스를 제공합니다.데이터 계층, AI 모델에 필요한 훈련 데이터를 제공합니다.모델 계층 구조, 데이터를 사용하여 AI 모델을 훈련하고 최적화합니다.응용 수준, 훈련된 AI 모델을 특정 비즈니스 시나리오에 적용하여 실질적인 문제를 해결합니다. 동시에 고객은 OpenAI, NVIDIA, Waymo와 같은 거대 기술 기업부터 미국 정부까지 다양합니다.

  1. Scale AI의 과제와 위험:

Scale AI는 데이터 라벨링의 추세를 확고히 파악하고 있지만, 데이터 라벨링을 위한 저임금 노동 의존도가 높아 땀을 흘리는 노동쟁의를 일으키고 있으며 여전히 해결해야 할 문제입니다. 동시에, 더 많은 기술 기업이 자체 데이터 라벨링 환경을 구축하고 인공 지능이 발전함에 따라 향후 수동 라벨링의 필요성이 줄어들 수 있으며, 이는 모두 Scale AI 개발에 위협이 됩니다.

창립 배경

Scale AI의 유래는 '누가 요구르트를 훔쳤나?'라는 이야기에서 알 수 있다.

규모AI-9

요구르트 도둑을 잡아라

2016년 설립자 알렉산드르 왕(Alexander Wang)은 MIT 대학 룸메이트 중 한 명이 자신의 요구르트를 훔쳤다고 의심했지만 무고한 사람을 비난하고 싶지 않았기 때문에 도둑을 잡기 위해 '스마트 냉장고 카메라'를 만들고 싶었습니다.

그는 그러한 카메라를 만드는 방법을 배우기 위해 Google TensorFlow(오픈 소스 기계 학습 플랫폼)의 가르침을 참조했습니다.

처음에는 Google TensorFlow에서 이미지 인식 훈련을 위한 모든 코드를 거의 직접 복사했지만 가장 큰 문제에 직면했습니다.
컴퓨터의 학습 능력이 매우 강한 것은 사실이지만, 컴퓨터가 인식하도록 훈련하려면 라벨이 붙은 음식 사진이 많이 필요합니다.

이 사진이 없으면 컴퓨터가 아무리 똑똑해도 음식이 어떻게 생겼는지 알 수 없으며 알렉산더가 요구르트를 훔친 사람을 잡는 데 도움이 될 수 없습니다.

그 당시 그는 음식이 포함된 수만 장의 사진에만 수동으로 라벨을 지정할 수 있었습니다.
마킹 도구를 사용하여 각 사진의 음식에 프레임을 지정하고 "사과" 및 "요구르트"와 같은 태그를 추가합니다. 모든 사진에 태그가 지정될 때까지 이 과정을 반복합니다.

수만 장의 이미지에 공을 들인 끝에 Alexandr는 마침내 정확한 인식 모델을 훈련시켰습니다.

이러한 힘든 과정에서 Alexandr는 갑자기 AI 모델을 스마트하게 만들려면 좋은 프로그래밍뿐만 아니라 대량의 고품질 라벨링 데이터도 필요하다는 사실을 깨달았습니다.

요구르트 도둑을 잡은 후: 넓은 시장의 냉장고 밖에 표시된 정보

요구르트 도둑 이야기 이후, 실제 경험을 통해 Alexandr Wang과 공동 창립자 Lucy Kuo는 데이터 태깅의 시장 기회를 더욱 확신하게 되었습니다.

창립팀인 Alexandr Wang과 Lucy Kuo는 각각 20세 때 Quora와 Snapchat에서 일을 시작한 컴퓨터 천재입니다. 그들은 이 두 소셜 플랫폼이 매일 수많은 이미지와 게시물을 검토하고 태그를 지정해야 한다는 점을 발견했습니다. 태그 지정 프로세스는 매우 반복적이고 번거로우며, 이후 단계에서는 이를 수동으로 완료하기 위해 아웃소싱 팀에 의존해야 합니다.

그런 다음 그들은 지루하지만 매우 중요한 "데이터 라벨링" 작업이 자동화, 모듈화, 심지어 상품화될 가능성이 있다는 사실을 발견했습니다.

이런 아하 순간에 그들은 2016년에 Scale AI를 설립하게 되었습니다. 이 회사는 다른 회사의 데이터 라벨링을 전문적으로 지원하여 Scale AI 고객이 단 한 줄의 코드로 라벨링 작업을 완료할 수 있도록 해줍니다.



Scale AI는 어떤 문제점을 해결하나요?

Scale AI가 데이터 라벨링을 가속화하는 방법을 공유하기 전에 데이터 라벨링이 무엇인지 간략하게 소개하겠습니다.

파일 태그: AI 여정에서 흥미롭지는 않지만 매우 중요한 작업

데이터 라벨링을 한 문장으로 설명하세요. 기계 학습 모델이 데이터를 쉽게 이해할 수 있도록 데이터에 라벨을 붙입니다.

처음의 비유로 돌아가서:
시험에 응시할 수 있는 학생을 양성하려면 학생의 마음이 충분히 똑똑해야 할 뿐만 아니라 올바른 내용이 담긴 교과서와 문제집이 필요합니다.
올바른 교재와 좋은 두뇌를 통해 학생들은 빠르게 학습하고 시험의 모든 질문에 올바르게 답할 수 있습니다.

AI 훈련에도 마찬가지입니다. 머신러닝 모델 자체의 강력한 코드 외에도 정확하게 레이블이 지정된 데이터를 사용하여 훈련해야 합니다.
좋은 학습 모델과 정확하게 레이블이 지정된 데이터를 통해 AI는 입력된 정보를 올바르게 학습하고 실제 애플리케이션에서 더 나은 성능을 발휘할 수 있습니다.

데이터 태깅이 필요한 회사는 어떤 회사인가요?

프로필 태그는 생소하게 들릴 수도 있지만 실제로는 어디에서나 사용할 수 있으며 생각할 수 있는 모든 회사에서 매일 사용됩니다!

간단히 말해서, 제품이나 서비스를 개선하기 위해 데이터에 의존하는 모든 회사에는 데이터 태깅이 필요할 수 있습니다!
여기서는 3가지 일반적인 데이터 태깅 애플리케이션 시나리오를 간략하게 공유합니다.

  1. Google, Apple, Amazon과 같은 기술 기업:
    프로필 태그를 사용하여 Google 포토의 이미지 인식, Apple Siri의 음성 인식 정확도, Amazon의 맞춤형 제품 추천을 최적화하세요.

  2. Zebra Medical Vision, GE Healthcare와 같은 의료 회사:
    레이블이 지정된 의료 이미지를 사용하여 AI 모델을 훈련하면 의사가 X선 또는 MRI 사진을 더 빠르고 정확하게 진단하고 가능한 질병을 판단할 수 있습니다.

  3. JPMorgan Chase, Lemonade, Stripe와 같은 금융 회사:

데이터 마커를 사용하여 신용 카드 거래에서 발생할 수 있는 범죄 활동을 탐지하고, 보험 신청의 위험을 평가하고, 전자 결제 시스템의 보안을 최적화하는 등의 작업을 수행합니다.

마킹 회사에 아웃소싱하는 이유는 무엇입니까?

 

데이터 태깅의 실제 예를 들어보면 이해할 수 있습니다!
GE헬스케어가 오늘이라면 의료 영상을 인식할 수 있는 모델을 학습하려면 다음 단계가 필요합니다.

  1. 데이터 수집: GE Healthcare는 엑스레이, MRI 등 대량의 의료 영상 데이터를 수집합니다.
  2. 데이터 태그: 전문 의사는 이러한 이미지에 "음성" 또는 "양성"으로 표시하여 어떤 이미지가 질병을 나타내는지 판단합니다.
  3. 훈련 모델: 다량의 라벨링된 데이터를 활용하여 AI 모델을 학습시켜 부정적인 의료 이미지와 긍정적인 의료 이미지를 식별하는 방법을 학습할 수 있도록 합니다.
  4. 애플리케이션 모델: 모델은 의사가 질병을 보다 신속하게 식별할 수 있도록 의료 진단에 사용됩니다.

Scale AI는 주로 '라벨링' 단계에 관여하여 GE 헬스케어가 대량의 데이터에 빠르고 정확하게 라벨을 붙일 수 있도록 도와줍니다.
결국 의사에게 상담 시간을 희생하여 수만 장의 사진에 부정적인지 긍정적인지 라벨을 붙이도록 요청하는 것은 경제적이지 않습니다.

Scale AI의 도움으로 GE Healthcare는 레이블이 지정된 데이터를 사용하여 모델을 훈련하여 향후 새로운 이미지를 올바르게 식별할 수 있습니다.

이 내용을 보면 다음과 같이 질문할 수 있습니다.

Scale AI는 그냥 대규모 인력 아웃소싱 회사인 것처럼 들리는데, 경쟁자가 많을 것입니다. 그렇다면 Scale AI가 승리할 수 있는 곳은 어디일까요? 연매출이 2억 5천만 달러에 달하고 그토록 많은 대기업은 물론 미국 정부와도 협력할 수 있었던 이유는 무엇입니까?

AI의 핵심 역량 확장 

Scale AI는 인력을 아웃소싱해야 하지만, Scale AI는 아프리카, 동남아시아 등 인건비가 낮은 지역에 데이터 라벨링 작업을 아웃소싱한 후 내부에서 개발한 다양한 소프트웨어를 사용하여 인력을 간소화하고 라벨링 프로세스의 수직 통합을 가속화할 예정입니다. Total Solution을 제공하는 산업 체인입니다.

Scale AI 핵심기술

경쟁이 치열한 AI 분야에서 Scale AI가 발판을 마련할 수 있는 능력은 효과적인 인간-기계 협업 모델 덕분이라고 할 수 있습니다.
다음은 4가지 핵심 사항입니다.

  1. 자동화 플랫폼과 수작업의 결합:
    기계 학습 및 인공 지능 기술을 사용하여 데이터 라벨링 프로세스를 지원하고 데이터 라벨링 작업을 효과적으로 할당 및 관리하며 인력에 대한 의존도를 줄입니다.

  2. 자회사 Remotasks는 다양한 인력을 관리합니다.
    크라우드소싱을 통해 전 세계의 태거들이 데이터 태깅 작업에 참여할 수 있어 짧은 시간 내에 수많은 태깅 작업을 완료하는 동시에 다양한 언어와 문화의 태깅 요구에 유연하게 대응할 수 있습니다.

  3. 마크 품질 관리 시스템:
    Scale AI는 휴먼 마킹의 품질과 정확성을 보장하기 위해 엄격한 마킹 품질 관리 시스템을 갖추고 있습니다. 예를 들어 다중 태깅(동일한 데이터에 태깅하는 여러 태거) 및 알고리즘 검사(태깅 결과의 기계 검사)가 포함되어 모든 데이터 조각이 주의 깊게 검증되도록 합니다.

  4. 지속적으로 반복되는 마킹 도구를 통해 인간과 기계의 협업이 더욱 원활해집니다.:
    Scale AI는 기술 혁신과 라벨링 도구의 지속적인 개선을 통해 변화하는 시장 요구 사항을 충족하기 위해 데이터 라벨링 기술 분야에서 선도적인 위치를 유지하고 있습니다.

이러한 방법을 통해 Scale AI는 수많은 데이터 라벨링 요구 사항을 효율적으로 처리하고 OpenAI, NVIDIA, Waymo 및 기타 유명 기업을 포함한 고객에게 고품질 데이터 라벨링 서비스를 제공할 수 있습니다.
이러한 자동화 기술과 글로벌 인적 자원의 결합을 통해 Scale AI는 경쟁이 치열한 AI 분야에서 자신의 틈새 시장을 찾고 빠르게 유니콘 회사로 성장할 수 있었습니다.

하지만 Scale AI의 가치는 여전히 상승하고 있습니다. 데이터 라벨링 서비스 외에도 회사 제품 라인의 반복을 많이 거쳤습니까?
이때 8년이라는 짧은 역사에 불과하더라도 3가지 제품 피벗(Pivot) 이야기를 언급할 필요가 있다.

타임라인 만들기

1단계: 데이터 처리 엔진(2016-2019)

초기에 Scale AI는 간단한 데이터 처리 API 구축에 중점을 두었고 곧 Lyft, Uber, Waymo와 같은 자율주행차 회사가 선호하는 데이터 제공업체가 되었습니다.
예를 들어, 자율주행차 회사는 Scale AI의 API를 통해 도로 이미지 데이터를 쉽게 업로드하고 Scale AI의 도구를 사용하여 데이터에 신속하게 레이블을 지정한 다음 이를 사용하여 자율주행 모델을 교육할 수 있습니다.

스케일AI는 자율주행 분야에서 확고한 입지를 다진 뒤 서비스 범위를 확대하며 자연어 처리, 전자상거래, AR/VR 등 다양한 애플리케이션을 공격하기 시작했다.

규모AI-8

2단계: 인공지능 엔진(2020-2022)

Scale AI는 교육 자료 제공업체로 시장 입지를 확고히 한 후 AI 분야로 관심을 돌리고 고객의 인공 지능 개발의 전체 라이프사이클로 범위를 확장했습니다.

Scale AI는 완전 관리형 모델을 서비스로 출시하기 시작하여 고객과 협력하여 대규모 언어 모델, 자율 구동 모델, 생성적 AI 모델, 추가 인프라 등 고성능 모델을 제공하는 데 필요한 것이 있는지 확인합니다.
이러한 시장 확장을 통해 Scale AI의 개발은 라벨링된 데이터를 제공할 뿐만 아니라 모델을 관리하여 시장 기회를 확대할 수 있습니다.

3단계: 생성적 AI 및 애플리케이션 엔진(2022년~현재)

Scale AI는 Chat GPT 개발 초기 단계부터 OpenAI와 긴밀히 협력하여 개발자 관점에서 생성적 AI 물결의 기회를 포착할 수 있도록 했습니다.
이후 Scale AI는 생성 AI에 맞춰진 신제품을 출시했습니다.
예를 들어 프롬프트 조정 도구인 Spellbook과 국방 및 정보 전문가가 결정을 내리는 데 도움이 되는 Donovan 애플리케이션이 있습니다.

이 글을 읽고 이 글이 좋다고 생각하신다면,
내 뉴스레터 [Roxanne의 Tech Talk] 구독을 환영합니다. 
이에 대한 더 흥미로운 과학기술 이야기를 공유하겠습니다! 🥳
500명과 함께 최신 기술과 지식을 함께 배워보세요 👉 Roxanne의 기술 토크 구독

AI 제품 확장

 

Scale의 제품은 AI 레벨(애플리케이션/모델/데이터)과 유형(서비스/소프트웨어)별로 분류할 수 있습니다.

토착 문학의 소규모 교실:

AI 수준(애플리케이션/모델/데이터)은 무엇을 나타냅니까?

  • 데이터 계층: AI 모델에 필요한 훈련 데이터를 제공합니다.
  • 모델 계층 구조: 데이터를 사용하여 AI 모델을 훈련하고 최적화합니다.
  • 응용 수준: 학습된 AI 모델을 특정 비즈니스 시나리오에 적용하여 실질적인 문제를 해결합니다.

AI 수준

유형

제품명

제품 설명

성공 사례

목표 데이터
(데이터)

제공하다

빠른

사용자가 데이터를 빠르게 업로드하고 표시하는 데 도움이 되는 셀프 서비스 데이터 주석 플랫폼입니다.

오픈AI
학습 데이터에 라벨을 지정하는 데 사용됩니다.

찬성

API를 통해 태그 지정을 활성화하고 전문 관리자와 협력하여 크고 복잡한 데이터 볼륨을 처리합니다.

웨이모
자율주행 데이터 라벨링을 위한

소프트웨어

사진관

내부 라벨링 팀의 효율성을 향상시키고 관리, 모니터링 및 추적 도구를 제공하는 포괄적인 라벨링 플랫폼입니다.

테슬라
내부 데이터 태깅용

기계 학습 데이터 관리 도구는 데이터 시각화, 모델 성능 개선, 활성 학습 및 엣지 케이스 식별을 수행하는 데 도움이 됩니다.

엔비디아
모델 학습 데이터 관리용

모델의 경우
(모델)

제공하다

맞춤형 모델 제품

특정 목적에 맞게 성능을 향상시키기 위해 모델을 미세 조정하는 데 중점을 두고 대규모 언어 모델을 구축, 관리 및 배포하는 데 도움을 줍니다.

Google
언어 모델 미세 조정에 사용됩니다.

소프트웨어

마법서

팀이 대규모 언어 모델 애플리케이션을 신속하게 배포하고, 프롬프트를 생성 및 비교하고, 평가를 수행할 수 있도록 지원합니다.

오픈AI
신속한 생성 및 비교를 위해

생성적 AI 플랫폼

기업이 생성 인공 지능 애플리케이션을 사용자 정의, 구축, 테스트 및 배포할 수 있는 풀엔드 솔루션입니다.

인류학
생성적 AI 애플리케이션 개발을 위한

신청을 위해
(애플리케이션)

소프트웨어

마케팅 담당자와 브랜드가 광고 및 소셜 미디어에 사용할 AI 생성 제품 이미지를 만드는 데 도움이 됩니다.

코카콜라 

광고 이미지 생성에 사용됩니다.

도노반

데이터를 분석하고 추세와 이상 현상을 신속하게 식별하며 요약 및 번역 기능을 제공하여 국방 및 정보 커뮤니티의 의사 결정을 지원합니다.

미국 국방부
지능 분석을 위해



Scale은 데이터 라벨링 전문 회사로 시작하여 현재는 데이터 라벨링 및 관리, 모델 훈련 및 평가, AI 애플리케이션 개발 및 배포에 이르기까지 모든 것을 포괄하는 서비스와 소프트웨어를 제공하고 있습니다.전체 프로세스 솔루션, AI 수직 교육 프로세스에 필요한 더 많은 도구를 계약하여 계속해서 확고하게 자리 잡고 경쟁사와 차별화할 수 있습니다.

그렇다면 이 회사는 이렇게 다양한 제품 라인을 가지고 어떤 시장을 겨냥하고 있을까요?

Scale AI가 직면한 시장

Scale AI의 시장 기회는 두 부분으로 나눌 수 있습니다.
핵심 AIaaS(AI-as-a-Service) 시장,
그리고 신흥 생성 AI 시장.

스케일AI-5

1. 서비스형 AI(AIaaS) 시장

처음에는 Scale AI가 데이터 라벨링에 중점을 두었지만, 제품군이 확장되면서 Scale AI는 점차 기업의 모델 구축을 지원하는 종합 AI IT 서비스 제공업체로 발전했습니다.
(앞서 언급했듯이 데이터에서 모델로 확장한 다음 최종 애플리케이션으로 확장)

연구에 따르면 2023년 AIaaS(AI-as-a-Service)의 시장 가치는 270억 달러, 성장률은 20%를 초과합니다.

투자 리서치 플랫폼에 따르면 테구스, 한 투자자는 이렇게 말했습니다.

"내가 Scale AI를 좋아하는 이유를 아시나요? 15개 회사가 아닌 한 회사와 일할 수 있기 때문입니다. Scale AI는 데이터 라벨링, 데이터 관리, 합성 데이터 등 많은 기능을 통합합니다. 기타 회사는 단일 기능에만 집중하는 반면, Scale AI는 모든 기능을 포괄하므로 협력 아웃소싱을 더욱 편리하고 효율적으로 만들어줍니다.”

 

2. 생성 AI 시장

생성적 AI의 등장으로 Scale AI의 시장 기회도 크게 증가했습니다.
Scale AI는 거대 기술 기업이 자체 AI를 교육할 때 선택한 데이터 라벨링 파트너입니다.
예를 들어 OpenAI가 GPT-4와 DALL-E를 개발하고, Google DeepMind가 Gemini를 개발하고, Amazon Web Services(AWS)가 Claude를 개발했을 때 Scale AI는 이들 기업이 맞춤형 생성 AI 인공지능 모델을 구축하는 데 도움을 주었습니다. 생성 AI 시장은 2027년까지 매년 두 배씩 성장해 2027년까지 성장할 것으로 예상된다. 550억 달러.

Scale AI의 잠재 시장의 성장 가능성을 살펴보면 최근 인상적인 모금 결과를 추측하는 것은 어렵지 않을 것입니다!

스케일 AI 운영 현황

인기 뉴스에 따르면 Alexandr는 5월 21일 Scale AI가 시리즈 F 파이낸싱에서 10억 달러를 조달했다고 발표했으며, 이는 이전 라운드 파이낸싱 가치의 거의 두 배에 달하는 138억 달러의 가치로 평가되었습니다.

이번 자금 조달 라운드는 최고의 VC Accel이 주도했으며, 참여 투자자에는 Cisco Investments, Intel Capital, AMD Ventures, WCM, Amazon 및 Meta와 같은 다양한 기술 거대 기업과 Y Combinator(YC), Index Ventures 및 Nvidia와 같은 기존 투자자.

동시에 Scale AI도 2024년에 선정되었습니다. CNBC 파괴자 50 Scale AI의 설립자이자 CEO인 Alexandr Wang은 세계 50대 혁신 파괴 기업 중 12위를 차지했다고 말했습니다.

“우리의 임무는 인공 지능을 위한 데이터 파운드리를 구축하는 것이며, 이번 자금 지원은 우리가 이 목표를 달성하는 데 속도를 높이고 AGI(인공 일반 지능)로 가는 길을 열어줄 것입니다.”

언론에서 Scale AI의 매력을 본 후, Scale AI 회사의 논란과 잠재적 위험에 대한 보도의 균형을 맞춰 보겠습니다.

AI 논란 및 잠재적 위험 확장

땀 흘리는 노동쟁의

Scale AI의 성공은 주로 케냐, 필리핀, 베네수엘라 및 기타 지역에서 Scale AI의 자회사 Remotasks를 통해 일하지만 시간당 1달러 미만을 받는 240,000명의 근로자에 달려 있습니다.
이들 작업자는 AI 훈련 데이터에 라벨을 붙이지만 법적 계약 보장이 없기 때문에갑작스런 해고, 직장 계좌가 갑자기 동결되었습니다, 심지어 필리핀의 일부 근로자도 지불이 지연되거나 보류되는 것을 경험했다고 보고했습니다.https://www.gvm.com.tw/article/104424

잠재적인 운영 위험

2023년에는 거시경제적 영향으로 Scale AI 20%에서 해고가 발생했고, 데이터 라벨링 경쟁이 점점 치열해졌습니다. Google, Amazon과 같은 기술 기업은 아웃소싱 서비스에 대한 의존도를 줄이기 위해 자체 데이터 라벨링 환경을 구축하기 시작했습니다.

동시에 데이터에 라벨을 지정하기 위해 인공지능을 사용하는 추세도 커지고 있으며 GPT-4와 같은 모델은 이미 많은 작업에서 인간을 능가하고 있습니다.

취리히 대학교(University of Zurich)는 최근 연구를 수행한 결과 제로샷 조건에서 ChatGPT의 라벨링 작업이 훈련된 개인의 작업보다 훨씬 더 우수하다는 사실을 발견했습니다.
인간 라벨링은 여전히 데이터 라벨링의 표준으로 간주되지만 미래의 다중 모드 GPT-5 또는 기타 모델이 인간 라벨링 작업을 대체할 가능성이 높습니다.

결론

뛰어난 자금 조달 성과, 창립자 Alexandr의 천재적인 이미지, AI 물결에서 점점 더 중요해지는 데이터 리소스의 역할은 모두 Scale AI를 모든 사람의 관심의 초점으로 만들었습니다. 데이터가 어떻게 AI에 힘을 실어줄 수 있나요? 어떻게 하면 보다 효율적이고 인도적으로 처리할 수 있습니까? 이러한 질문에 대한 답은 앞으로 Scale AI에서 찾을 수 있다고 믿습니다.

3가지 시사점

 

  1. AI 시대, 데이터가 가져온 성장 모멘텀 :

 날로 발전하는 인공지능에는 좋은 모델과 컴퓨팅 능력 외에도 데이터와 데이터 정확성이 요구되는데, 이는 종종 간과되지만 매우 중요합니다. Scale AI는 다른 회사가 대량의 데이터에 라벨을 지정하고 처리하여 AI 모델에 공급되는 데이터의 품질이 향상되도록 돕습니다.

 

  1. AI 제품 및 시장 확장:

Scale AI의 제품은 다음과 같은 세 가지 수준의 AI에 대한 서비스를 제공합니다.데이터 계층, AI 모델에 필요한 훈련 데이터를 제공합니다.모델 계층 구조, 데이터를 사용하여 AI 모델을 훈련하고 최적화합니다.응용 수준, 훈련된 AI 모델을 특정 비즈니스 시나리오에 적용하여 실질적인 문제를 해결합니다. 동시에 고객은 OpenAI, NVIDIA, Waymo와 같은 거대 기술 기업부터 미국 정부까지 다양합니다.

 

  1. Scale AI의 과제와 위험:

Scale AI는 데이터 라벨링의 추세를 확고히 파악하고 있지만, 데이터 라벨링을 위한 저임금 노동 의존도가 높아 땀을 흘리는 노동쟁의를 일으키고 있으며 여전히 해결해야 할 문제입니다. 동시에, 더 많은 기술 기업이 자체 데이터 라벨링 환경을 구축하고 인공 지능이 발전함에 따라 향후 수동 라벨링의 필요성이 줄어들 수 있으며, 이는 모두 Scale AI 개발에 위협이 됩니다.

이 기사를 읽어주셔서 감사합니다!
아직 배울 내용이 더 많이 남아 있다고 생각하시면 제 뉴스레터 [Roxanne's Tech Talk]를 구독해 주세요. 
이에 대한 더 흥미로운 과학기술 이야기를 공유하겠습니다! 🥳

500명과 함께 최신 기술과 지식을 함께 배워보세요 👉 Roxanne의 기술 토크 구독
Linkedin을 통해 소통하실 수도 있습니다👩🏻‍💻 록산느 첸

ko_KR한국어