TikTok 在生成式 AI 競賽中明顯落後,因此一直秘密使用 OpenAI 的技術來開發自己的競爭性大型語言模型(LLM)。
這種做法在 AI 界通常被視為失禮行為,而且直接違反了 OpenAI 的服務條款,該條款明確禁止使用其模型輸出「用於開發與我們產品和服務競爭的任何人工智能模型」。字節跳動通過微軟購買 OpenAI 的訪問權限,而微軟也有同樣的政策。根據字節跳動內部文件確認,OpenAI API 已被用於開發其基礎 LLM,代號為「種子項目」(Project Seed),在每個開發階段中幾乎都用於模型的訓練和評估。
參與其中的員工對其影響心知肚明;我在字節跳動內部員工溝通平台 Lark 上看到了有關如何通過「數據去識別化」來「美白」證據的討論。濫用情況如此猖獗,以至於「種子項目」的員工經常達到 API 訪問的最大限額。