我的股票

    名稱 現價 升跌

    資料報價延遲十五分鐘

    【跨市思維】GPT-3.5和GPT-4之間的區別

    【分析】 2023/03/22 10:06

    【now.com財經】由OpenAI最新創建完成的GPT-4(ChatGPT第四代)可以說是深度學習(Deep learning)的一個新里程碑。GPT-4是一個大型多模態模型(能夠接受圖像和文字輸入,然後以文本輸出)。儘管在許多現實世界環境中的能力仍不如人類,但在各種專業和學術基准上卻能表現非常出色(甚至已超越大多數人的水平)。例如,GPT-4參加模擬律師考試,其分數能夠在應試者的前10%左右;相比之下,GPT-3.5(ChatGPT-3.5)的得分只在倒數10%左右。

    在隨意的談話中,GPT-3.5和GPT-4之間的區別可能很微妙。在更複雜和更高的維度上,GPT-4比GPT-3.5更可靠、更有創意,並且能夠處理更細微的指令。此外,GPT-4可以接受文字和圖像的提問,也可以與純文字設置並行;換句話說,GPT-4在文字和圖像(包括圖表或屏幕截圖等)組成的輸入情況下,可生成文本輸出(包括自然語言、代碼等)。

    儘管GPT-4具有強大的功能,但它與早期的GPT模型具有相似的局限性。最重要的是,GPT-4仍然不完全可靠(例如以虛構的事實,作出錯誤的推理)。雖然這個問題仍然存在,但GPT-4相對於以前的模型已經大幅顯著減少了這種錯誤。根據OpenAI內部進行的真實性對照評估中,GPT-4的得分比目前最新的GPT-3.5高40%左右。

    無疑,GPT-4除了與以前模型帶有類似的風險(例如生成有害的建議、錯誤代碼或不准確的信息)以外,新的附加功能也有可能帶來其他新的潛在風險。OpenAI為了了解這些風險的程度,特別聘請了50多位來自不同領域的專家(包括網絡安全、生物科技、國際安全等)來對模型進行對抗性測試。透過這些專家的反饋,OpenAI收集了額外的數據來提高GPT-4拒絕具危害性請求(例如有關如何合成危險化學品)的能力。

    事實上,GPT-4已在RLHF(Reinforcement Learning from Human Feedback)訓練期間加入了額外的安全獎勵訊號,以通過訓練模型拒絕對此類內容的請求來減少有害輸出。與GPT-3.5相比,新的緩解措施顯著改善了GPT-4許多安全特性。新模型在回應不被允許內容的傾向降低了82%,並且能夠依據OpenAI政策對應敏感請求的頻率提高了29%。

    總的來說,對GPT-4的干預雖然增加了引發不良回應的難度,但仍然難以達致完全杜絕。換言之,ChatGPT仍然存在生成違反使用指南的內容(即所謂的Jailbreaks「越獄」)。事實上,隨著人工智能系統的風險性在不繼增加,這些干預措施的可靠性將變得至關重要;從短期來看,利用其他安全技術來填補這些限制漏洞,例如監控濫用可能是其中一個最為有效的臨時解決方案。

    李浩然
    輝立証券研究部高級分析師