Anthropic:GPT-4 最強大對手 Claude 3.5 的背後推手,如何打造更「合規」的 AI 大型語言模型?

0710 Anthropic

前言

2024 年 6月20日,由前 OpenAI 工程團隊組成的 AI 新創公司 Anthropic 發布了Claude 3.5 Sonnet,Anthropic 在 twitter 表示 Sonnet 的運行速度是的前身 Claude 3 Opus 的兩倍,並且在推理、寫程式和視覺化等多項測試超越了 OpenAI 的 GPT-4。

Anthropic3

隨著科技業資金大量流入 AI 領域,透過了解各種 AI 新創公司的募資狀況、背後理念,也能對未來人工智慧趨勢有更明確的認知。

就生成式 AI 與大型語言模型的新創為例,可不只有 OpenAI 一支獨秀,從背後開始有科技巨頭 Amazon, Google 巨額投資撐腰,Anthropic 無疑成為暨 OpenAI 後今年最受矚目的獨角獸。

Anthropic 到底是一間怎樣的公司?為何創辦人要與 OpenAI 分家?兩間公司的戰略地位有什麼不同?

今天就來跟大家分享 Anthropic 的故事!

Anthropic4

如果你只有 1 分鐘,可以帶走的 3 Takeaways

  1. Anthropic 與 OpenAI 的區別
    Anthropic 專注開發安全且透明的 AI 技術,致力於 AI 系統的解釋性和可控性,同時訓練方式更「合憲」,訓練過程會透過人類反饋(RLHF)確定模型考慮非西方、非富裕或工業化文化的價值觀,適合需要高度可信和合倫理的應用。相比之下,OpenAI 則側重於強大的生成能力和自然語言處理的靈活性,適用於娛樂、教育和一般商業應用等多樣化場景。

  2. 商場戰略地位差異
    Anthropic 在金融、醫療、法律等高風險行業中備受青睞,因其產品能夠提供詳細的數據來源和決策過程解釋,與人類互動過程更透明可信。
    而 OpenAI 則在市場上擁有更廣泛的知名度和覆蓋率,特別是在娛樂和教育等行業這種需要靈活且自然的生成能力的領域。

  3. Anthropic 前景
    在拓展業務版圖方面,在 OpenAI 發表 GPT 4o 後不久,Anthropic 也宣布 Claude 已在歐洲上線,開始支援法語、德語、義大利語和西班牙語等多種語言,往更多元化與更高的覆蓋率邁進。
    因為歐洲一直是人工智慧安全和監管問題上呼聲最響亮的地區之一,特別是今年稍早通過的《人工智慧法案》。 共同創辦人 Amodei 表示, Anthropic 一直致力於遵守歐盟 GDPR 等人公智慧法規,且已做好在歐洲框架內運作的準備。

    在使用者體驗層面,Anthropic 也希望使用者能夠以最直觀的方式與 Claude 互動——無論是透過手機、個人電腦還是 API 本身。目前他們也正在積極打造相當流暢的體驗,讓 Claude 用戶可以在不同帳戶、不同裝置間自由切換。

 

創立背景

Anthropic1

Anthropic 成立於2021年,由前 OpenAI 高管 Dario 和 Daniela Amodei 這對兄妹共同創立,其他 5 位成員也都來自 OpenAI。Anthropic 的成立宗旨是源於對 OpenAI 開發過程的疑慮,希望另闢道路,通過更嚴謹的訓練方式,開發人性化且安全的 AI 系統,確保 AI 在應用過程能保持透明和安全。

Anthropic 的核心理念:打造 CAI (合憲人工智慧)

CAI (Constitutional AI)是什麼?

CAI 是「合憲人工智慧」(Constitutional AI)的縮寫。

一句話解釋 CAI :用一套符合現今法規的標準訓練出來的 AI。

大家可以想像一下,在訓練 AI 的過程中有一部「憲法」,這部憲法告訴 AI 在各種情況下應該怎麼做才是正確和安全的,就能讓產出的內容更符合現今道德法律規範,同時也讓訓練過程更透明。
Anthropic 創立的這套 「AI 憲法」,法規源自於《聯合國世界人權宣言》等文件,還有內部團隊與 AI 互動的經驗。

Anthropic7

CAI 背後的 AI 憲法是怎麼被制訂出來?

Anthropic 主要透過公眾意見調查的方式制訂出這套 AI 憲法:

他們在開源投票平台Polis 上邀請了約 1,000 位來自不同的年齡、性別、收入和地區的美國人參與 AI 憲法的制定,讓他們對一些現有的 AI 規則進行投票,同時根據自己的族群與立場提出建議。
蒐集約 1,200 條多元建議和 38,200 張投票後,Anthropic 團隊進一步篩選出大部分人同意的規則。最後將這些規則整理成 AI 憲法,用來作為訓練新 AI 系統的準則。

Anthropic2

AI alignment:讓 AI 與人類的價值觀保持一致?

AI alignment(人工智慧對齊)是指讓 AI 與人類的價值觀「保持一致」,而 Anthropic 的 CAI 方法正是為了達成這個目標。

但是怎麼辦到呢?
Anthropic 透過研究核心技術 Mechanistic interpretability (機械可解釋性/模型解釋能力) ,類似剖開機器人的大腦,讓開發者可以清楚知道 AI 內部系統到底怎麼運作、是怎麼產出每句話、怎麼思考,嚴格監督人工智慧的思考流程,而非只關注結果的品質。

Anthropic5

Anthropic vs. OpenAI 

 

Anthropic 和 OpenAI 兩間公司都致力於打造大型語言模型,但 Anthropic 的 Claude 更著力於開發能夠「清晰解釋思考過程」與更合規可控制的AI系統。

相比之下,OpenAI 的 ChatGPT 就更側重模型的靈活度,開發更多強大的通用 AI 技術,例如更平易近人的語音、圖像辨識、圖像產出等。
因為訓練目的不同,雖然 OpenAI 站穩了使用者覆蓋率的寶座,但對嚴格要求 AI 安全性和可解釋性的企業,Anthropic 會是更合適的選擇。

兩者訓練AI的方法有什麼不同?

Anthropic :強化學習與人類反饋(RLHF)
OpenAI :大規模數據和深度學習

Anthropic 期待能開發更透明的 AI 系統,所以在訓練過程中會更強調 AI 模型的可控性和解釋能力。Anthropic 主要透過強化學習與人類反饋(RLHF),同時團隊會專注於確保 AI 系統在各種情境下的安全性和可靠性。
相比之下,OpenAI 希望產出能又多元又靈活,所以更加側重大規模數據和深度學習,才能最大化 AI 模型的性能和生成能力。例如 GPT-4,就是透過大量文本數據進行預訓練去提高模型的自然語言處理和生成的多樣性。

 

兩個語言模型用起來有什麼不同?

以產出的文字為例,兩個模型最明顯的差異之處:

Anthropic (Claude)

  1. 內容透明度高:
    Claude提供了詳細的解釋過程和數據來源,說明了他使用哪些科學模型來預測和分析。
  2. 合規性:
    Claude的回應通常更合規,適合需要遵循嚴格法律和道德標準的領域。

OpenAI (ChatGPT)

  1. 更靈活自然:
    ChatGPT的回應更側重於生成自然、流暢的文本,提供清晰且簡潔的解釋,適合廣泛的互動和多樣化的應用場景,如娛樂、教育和一般商業應用。
  1. 更有創造力:
    ChatGPT的生成能力強大,能夠處理更廣泛的主題,並提供豐富的互動體驗。

 

來更具體感受一下,同樣的 Prompt,兩個模型會怎麼回應呢?

以 “解釋一下氣候變遷的原因和影響” 為例

Claude的回應:

“氣候變遷是指地球長期氣候模式的變化,主要由人類活動引起的溫室氣體排放增加所導致。燃燒化石燃料(如煤炭、石油和天然氣)以及砍伐森林都是溫室氣體增加的主要原因。
這些氣體(如二氧化碳和甲烷)會在大氣中積累,形成一層‘溫室’,使地球的溫度升高。
這種溫室效應導致了極端天氣事件增多、海平面上升和生態系統改變,進而影響人類健康、農業生產和水資源供應。”

“我們使用了多個科學模型來模擬和預測氣候變遷的影響,這些模型基於歷史數據和當前趨勢進行調整。
我們的分析考慮了不同情境下的溫室氣體排放量,並評估了其對全球氣溫和天氣模式的潛在影響。這些模型和數據均來自權威機構,如IPCC(政府間氣候變化專門委員會)。”

ChatGPT的回應

“氣候變遷是由於人類活動和自然因素共同作用引起的。人類活動中,燃燒化石燃料釋放大量的二氧化碳,這是一種主要的溫室氣體,會使地球變暖。
此外,砍伐森林減少了二氧化碳的吸收,加劇了氣候變暖。自然因素如火山爆發和太陽輻射變化也會影響氣候,但在人類活動的影響下,這些自然因素的作用相對較小。
氣候變遷的影響包括極端天氣事件增多、海平面上升、冰川融化、生態系統破壞和人類健康問題等。這些變化可能會導致農業減產、水資源短缺和更多的氣候難民。

 

可以很明顯感受到 Claude 會用清晰的推理方式解釋過程,並附上參考來源;
ChatGPT 則是以更人性化、用更簡單易懂的語言幫助使用者理解。

用更擬人化的方式比喻兩個模型的話:

可以把 Claude 想像成一位溫和但有點嚴肅的老師,非常注重學生的情感和安全。透過一套嚴格的道德規範 (CAI) 確保自己的言行不會傷害到學生。同時經常與學生和家長進行交流 (定期開源投票),採納學生意見後調整教學方法,更符合大家的期望和需求。

相比之下 GPT 就比較有趣但沒那麼受控了。可以想像 GPT 是一位非常聰明且能因材施教的老師,擁有豐富的知識儲備,能夠回答各種問題並提供詳細的解釋。但有時可能會忽略學生的背景多元性,或沒有考慮到某些敏感話題對某些學生來說可能有害。

Anthropic 和 OpenAI, 在 AI戰場上的戰略地位比較

 

在現今 AI 產業中,Anthropic 和 OpenAI 各自佔據了重要的戰略地位。

因 Anthropic 更專注於 AI 技術的安全性和透明性,讓他在金融、醫療和法律等對風險和合規要求較高的行業中備受企業青睞。強調解釋性的 AI 產品能夠幫助這些行業更好地理解和應用AI技術。

而 OpenAI 面向的使用者就比較廣泛了。 因為 ChatGPT 靈活的內容產出、多樣化的產品組合在目前的市場上佔據了廣泛的份額。尤其在娛樂、教育和一般商業應用中擁有更高的知名度和使用率。

 

Anthropic 投資近況

Anthropic6

 

 Anthropic 迄今已籌集近 80 億美元,投後估值約 184 億美元,其中超過 70 億美元來自Amazon 的 40 億美元投資,合作在 AWS 上打造智慧聊天機器人;與Google 隨後加碼的 20 億美元,期待協同旗下的 DeepMind AI 研究中心打造出更安全的 AI 應用。

雖然這些投資仍不即微軟大手筆對 OpenAI 投資的 100 億美元,但仍然能顯示出未來 AI 戰場上將有更多元的面孔出現。



Anthropic 的未來發展

在拓展業務版圖方面,在 OpenAI 發表 GPT 4o 後不久,Anthropic 也宣布 Claude 已在歐洲上線,開始支援法語、德語、義大利語和西班牙語等多種語言,往更多元化與更高的覆蓋率邁進。
因為歐洲一直是人工智慧安全和監管問題上呼聲最響亮的地區之一,特別是今年稍早通過的《人工智慧法案》。 共同創辦人 Amodei 表示, Anthropic 一直致力於遵守歐盟 GDPR 等人公智慧法規,且已做好在歐洲框架內運作的準備。

在使用者體驗層面,Anthropic 也希望使用者能夠以最直觀的方式與 Claude 互動——無論是透過手機、個人電腦還是 API 本身。目前他們也正在積極打造相當流暢的體驗,讓 Claude 用戶可以在不同帳戶、不同裝置間自由切換。

3 Takeaways

 

  1. Anthropic 與 OpenAI 的區別
    Anthropic 專注開發安全且透明的 AI 技術,致力於 AI 系統的解釋性和可控性,同時訓練方式更「合憲」,訓練過程會透過人類反饋(RLHF)確定模型考慮非西方、非富裕或工業化文化的價值觀,適合需要高度可信和合倫理的應用。相比之下,OpenAI 則側重於強大的生成能力和自然語言處理的靈活性,適用於娛樂、教育和一般商業應用等多樣化場景。

  2. 商場戰略地位差異
    Anthropic 在金融、醫療、法律等高風險行業中備受青睞,因其產品能夠提供詳細的數據來源和決策過程解釋,與人類互動過程更透明可信。
    而 OpenAI 則在市場上擁有更廣泛的知名度和覆蓋率,特別是在娛樂和教育等行業這種需要靈活且自然的生成能力的領域。

  3. Anthropic 前景
    在拓展業務版圖方面,在 OpenAI 發表 GPT 4o 後不久,Anthropic 也宣布 Claude 已在歐洲上線,開始支援法語、德語、義大利語和西班牙語等多種語言,往更多元化與更高的覆蓋率邁進。
    因為歐洲一直是人工智慧安全和監管問題上呼聲最響亮的地區之一,特別是今年稍早通過的《人工智慧法案》。 共同創辦人 Amodei 表示, Anthropic 一直致力於遵守歐盟 GDPR 等人公智慧法規,且已做好在歐洲框架內運作的準備。

    在使用者體驗層面,Anthropic 也希望使用者能夠以最直觀的方式與 Claude 互動——無論是透過手機、個人電腦還是 API 本身。目前他們也正在積極打造相當流暢的體驗,讓 Claude 用戶可以在不同帳戶、不同裝置間自由切換。

 

結語

Anthropic 執行長在上週採訪報導中提到,人工智慧訓練的成本仍然高得可怕,低端且基礎的模型約需要 1 億美元,而手上的 Cluade 要耗費超過 10 億美元來訓練。

由此可知,開發人工智慧的天價成本為那些想要訓練自己的模型來與 OpenAI 或 Anthropic 抗衡的新創公司設定了很高的門檻,而大型語言模型的戰場在短期內仍然會由手握巨額資金的科技巨頭所左右。

Anthropic 的出現讓人們對 AI 大型語言模型的面貌有更多元的想像,也提早為 AI 未來可能會造成的道德問題部署解決方案。

謝謝你看完這篇文章!
如果你覺得意猶未盡,歡迎訂閱我的電子報【Roxanne’s Tech Talk】
我將會在上面分享更多有趣的科技科普故事喔!🥳

加入 500 人行列,一起學習最新科技新知 Subscribe Roxanne’s Tech Talk
也歡迎透過 Linkedin 交流 👩🏻‍💻 Roxanne Chen



發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

zh_TW繁體中文