針對學生通過ChatGPT生成論文,斯坦福大學推出的DetectGPT大語言模型(LLM)的使用風起雲湧,尤其是ChatGPT最近很火,但是因為太強大了,甚至可以給學生生成論文。 因此,需要檢測機器生成文本的系統。
最近,斯坦福大學的一組研究人員提出了一種名為 DetectGPT 的新方法,旨在成為高等教育中對抗機器生成文本的首批工具之一。 該方法基於 LLM 生成的文本通常徘徊在模型對數概率函數的負曲率區域的特定區域的原理。 利用這一發現,該團隊開發了一種新的指標來判斷文本是否是機器生成的,而不需要訓練人工智能或收集大型數據集來比較文本。
這種被稱為“零樣本學習”的方法允許 DetectGPT 在不知道使用甚麼人工智能工具生成文本的情況下檢測機器編寫的文本。 它的操作與其他需要使用真實和生成的段落數據集訓練“分類器”的方法形成鮮明對比。
該團隊在假新聞文章的數據集上測試了 DetectGPT,它在檢測機器生成的文本方面優於其他零樣本學習方法。 該團隊聲稱檢測性能有了實質性的改進,並建議 DetectGPT 可能是一種很有前途的方法來檢查機器生成的文本。
總之,DetectGPT 是一種檢測機器生成文本的新穎方法,它利用了 LLM 生成文本的獨特特徵。 它是一種零樣本學習方法,不需要任何額外的數據或訓練,使其成為識別機器生成文本的高效工具。 隨着 LLM 的使用不斷增長,用於檢測機器生成文本的相應系統的重要性將變得越來越重要。 DetectGPT 是一種很有前途的方法,可以在許多領域產生重大影響,其進一步發展可能對許多領域有益。