banner

소식

May 17, 2023

Reddit은 대규모 AI 시스템을 가르치는 데 도움을 주고 돈을 받고 싶어합니다

광고

지원 대상

인터넷 사이트는 오랫동안 매우 다양한 주제에 대한 토론을 위한 포럼이었으며 Google 및 OpenAI와 같은 회사는 AI 프로젝트에 이를 사용해 왔습니다.

마이크 아이작

샌프란시스코에 거주하는 Mike Isaac은 소셜 미디어와 기술 산업에 관해 글을 쓰고 있습니다.

Reddit은 오랫동안 인터넷 대화의 핫스팟이었습니다. 매일 약 5,700만 명의 사람들이 이 사이트를 방문하여 메이크업, 비디오 게임, 파워워시 진입로에 대한 조언 등 다양한 주제에 대해 이야기를 나눕니다.

최근 몇 년 동안 Reddit의 다양한 채팅은 Google, OpenAI 및 Microsoft와 같은 회사를 위한 무료 교육 도구이기도 합니다. 이들 회사는 실리콘 밸리의 많은 사람들이 기술 산업의 차세대 혁신이 될 것으로 생각하는 거대한 인공 지능 시스템 개발에 Reddit의 대화를 사용하고 있습니다.

이제 Reddit은 이에 대한 대가를 받기를 원합니다. 회사는 화요일에 외부 기관이 소셜 네트워크의 광범위한 개인 대 개인 대화를 다운로드하고 처리할 수 있는 방법인 API에 대한 액세스에 대해 회사에 비용을 청구할 계획이라고 밝혔습니다.

Reddit의 창립자이자 CEO인 Steve Huffman은 인터뷰에서 "Reddit의 데이터 코퍼스는 정말 가치가 있습니다."라고 말했습니다. "그러나 우리는 그 모든 가치를 세계 최대 기업에 무료로 제공할 필요는 없습니다."

이러한 움직임은 OpenAI의 인기 프로그램인 ChatGPT와 같은 AI 시스템을 개발할 목적으로 소셜 네트워크가 호스팅하는 대화에 대한 액세스 비용을 청구하는 최초의 중요한 사례 중 하나입니다. 이러한 새로운 AI 시스템은 언젠가 대기업으로 이어질 수 있지만 Reddit과 같은 회사에는 그다지 도움이 되지 않을 것입니다. 실제로 Reddit의 대화에 자동으로 복제되는 경쟁자를 만드는 데 사용될 수 있습니다.

Reddit은 또한 올해 월스트리트에서 기업공개(IPO)를 준비하고 있습니다. 2005년에 설립된 이 회사는 자사 플랫폼에서 광고와 전자상거래 거래를 통해 대부분의 수익을 창출하고 있습니다. Reddit은 API 액세스 비용에 대한 세부 사항을 아직 조율 중이며 앞으로 몇 주 안에 가격을 발표할 것이라고 밝혔습니다.

Reddit의 대화 포럼은 대규모 언어 모델(LLM)이 새로운 AI 기술을 만드는 데 필수적인 부분이 되면서 귀중한 상품이 되었습니다.

LLM은 본질적으로 Microsoft의 긴밀한 파트너인 Google 및 OpenAI와 같은 회사에서 개발한 정교한 알고리즘입니다. 알고리즘에 있어 Reddit 대화는 데이터이며 이를 개발하기 위해 LLM에 공급되는 방대한 자료 풀 중 하나입니다.

Google의 대화형 AI 서비스인 Bard를 구축하는 데 도움이 된 기본 알고리즘은 부분적으로 Reddit 데이터에서 훈련되었습니다. OpenAI의 Chat GPT는 교육을 받은 정보 소스 중 하나로 Reddit 데이터를 인용합니다.

다른 회사들도 그들이 주최하는 대화와 이미지에서 가치를 깨닫기 시작했습니다. 이미지 호스팅 서비스인 Shutterstock은 또한 이미지 데이터를 OpenAI에 판매하여 텍스트 기반 프롬프트만으로 생생한 그래픽 이미지를 생성하는 AI 프로그램인 DALL-E를 만드는 데 도움을 주었습니다.

지난 달 트위터의 소유주인 엘론 머스크는 수천 개의 회사와 독립 개발자들이 네트워크를 통해 수백만 건의 대화를 추적하는 데 사용하는 트위터의 API 사용을 단속하고 있다고 말했습니다. 그는 LLM을 변경 이유로 언급하지는 않았지만 새로운 수수료는 수만 달러, 심지어 수십만 달러에 이를 수 있습니다.

모델을 지속적으로 개선하기 위해 인공 지능 제작자에게는 엄청난 양의 컴퓨팅 성능과 엄청난 양의 데이터라는 두 가지 중요한 것이 필요합니다. 가장 큰 AI 개발자 중 일부는 컴퓨팅 성능이 뛰어나지만 여전히 알고리즘을 개선하는 데 필요한 데이터를 자체 네트워크 외부에서 찾고 있습니다. 여기에는 Wikipedia, 수백만 권의 디지털 도서, 학술 기사 및 Reddit과 같은 소스가 포함됩니다.

공유하다