Anthropic: GPT-4 の最も強力なライバルである Claude 3.5 の原動力、より「準拠した」AI 大規模言語モデルを作成するにはどうすればよいですか?

0710 人類学
Anthropic3

AI分野にはテクノロジー業界の多額の資金が流れ込んでおり、さまざまなAIスタートアップの資金調達状況や背景にあるコンセプトを理解することで、将来の人工知能のトレンドをより明確に理解することもできます。

生成 AI と大規模言語モデルの作成を例に挙げると、OpenAI だけが優れているわけではありません。テクノロジー大手の Amazon と Google からの巨額の投資に支えられており、Anthropic は間違いなく今年最も注目を集めるユニコーンです。 OpenAIの後。

アンスロピックってどんな会社ですか?なぜ創設者たちは OpenAI から離れたのでしょうか?両社の戦略的立場の違いは何ですか?

今日は人類の物語を皆さんと共有したいと思います!

Anthropic4

1 分しかない場合の 3 つのポイント

  1. Anthropic と OpenAI の違い:
    Anthropic は、安全で透明性の高い AI テクノロジーの開発に重点を置き、AI システムの説明可能性と制御可能性にも注力しています。同時に、トレーニング方法はより「憲法に則った」ものであり、トレーニング プロセスでは、考慮すべきヒューマン フィードバック (RLHF) を通じてモデルが決定されます。非西洋、非富裕層、または工業化された文化の価値観は、高度な信頼性と倫理を必要とするアプリケーションに適しています。対照的に、OpenAI は強力な生成機能と自然言語処理の柔軟性に重点を置いており、エンターテイメント、教育、一般的なビジネス アプリケーションなどのさまざまなシナリオに適しています。

  2. ショッピングモールの戦略的位置付けの違い:
    Anthropic は、その製品がデータ ソースと意思決定プロセスの詳細な説明を提供し、人間との対話プロセスの透明性と信頼性を高めることができるため、金融、医療、法律などのリスクの高い業界で人気があります。
    OpenAI は、市場、特に柔軟で自然な生成機能を必要とするエンターテインメントや教育などの業界で、より幅広い認知度と対象範囲を広げています。

  3. 人類の展望:
    ビジネス領域の拡大という点では、OpenAI が GPT 4o をリリースした直後に、Anthropic は Claude がヨーロッパで発売され、フランス語、ドイツ語、イタリア語、スペイン語などの複数言語のサポートを開始し、さらなる多様化に向けて動いていることも発表しました。より高いカバレッジを実現します。
    なぜなら、ヨーロッパは常に人工知能の安全性と規制、特に今年初めに可決された人工知能法の問題について最も声高に主張する地域の一つだからだ。 共同創設者のアモデイ氏は、AnthropicはEUのGDPRなどの公共情報規制の遵守に尽力しており、欧州の枠組み内で運営する用意があると述べた。

    ユーザー エクスペリエンスの観点から、Anthropic はユーザーが携帯電話、パソコン、または API 自体を通じて、最も直感的な方法でクロードと対話できることを望んでいます。現在、Claude ユーザーが異なるアカウントと異なるデバイス間を自由に切り替えられるように、非常にスムーズなエクスペリエンスを積極的に作成しています。

 

創業の背景

人間性1

Anthropic は、元 OpenAI 幹部のダリオ・アモデイ兄妹とダニエラ・アモデイ兄妹によって 2021 年に設立され、他の 5 人のメンバーも OpenAI の出身です。 Anthropic は、AI アプリケーション プロセスの透明性と安全性を確保するために、より厳格なトレーニング方法を通じて人道的で安全な AI システムを開発する別の方法を見つけることを期待して、OpenAI 開発プロセスに対する疑問から設立されました。

Anthropic の核となる哲学: CAI を作成する (憲法上の人工知能)

蔡(憲法AI) とは?

CAIとは「Constitutional AI」の略称です。

CAI を一言で説明すると、現在の規制を満たす一連の標準に従ってトレーニングされた AI です。

AI を訓練する過程には、出力内容が今日の道徳的および法的規範に沿ったものになるように、さまざまな状況で行うべき行動を AI に伝える「憲法」があると想像できます。同時にトレーニングプロセスの透明性も高めます。
Anthropic が作成した「AI 憲法」は、国連世界人権宣言などの文書や、社内チームの AI とのやり取りの経験から規定を引き出しています。

Anthropic7

CAIを支えるAIの仕組みはどのように策定されたのでしょうか?

Anthropic は主に世論調査を通じてこの AI 憲法を開発しました。

彼らは、さまざまな年齢、性別、収入、地域の約 1,000 人のアメリカ人を、オープンソースの投票プラットフォーム Polis での AI 憲法の策定に参加するよう招待し、彼らが自分たちの民族や立場に応じて既存の AI ルールの一部に投票できるようにしました。提案。
約 1,200 件の多様な提案と 38,200 票を集めた後、Anthropic チームは、ほとんどの人が同意したルールをさらに絞り込みました。最終的に、これらのルールは AI 憲法にまとめられ、新しい AI システムをトレーニングするためのガイドラインとして使用されます。

Anthropic2

AI の調整: AI を人間の価値観と調整しますか?

AI の調整とは、AI を人間の価値観と「一致」させることを指し、Anthropic の CAI 手法はこの目標を達成するために設計されています。

しかし、どうやって?
Anthropic は、コア技術である Mechanistic Interpreability (機械的解釈可能性/モデル説明能力) を研究することで、ロボットの脳を切り開くのと同じように、内部 AI システムがどのように動作し、各文がどのように生成され、どのように思考されるかを開発者が明確に理解できるようにします。 . 結果の品質だけに焦点を当てるのではなく、人工知能の思考プロセスを厳密に監視します。

Anthropic5

Anthropic 対 OpenAI 

 

Anthropic と OpenAI はどちらも大規模な言語モデルの構築に取り組んでいますが、Anthropic のクロード氏は、「思考プロセスを明確に説明」でき、準拠性と制御性がより高い AI システムの開発により重点を置いています。

対照的に、OpenAI の ChatGPT はモデルの柔軟性に重点を置き、より親しみやすい音声、画像認識、画像出力など、より強力な汎用 AI テクノロジを開発します。
トレーニングの目的が異なるため、OpenAI はユーザー カバレッジにおいて確固たる地位を確立していますが、AI のセキュリティと説明可能性を厳密に要求する企業には Anthropic の方が適した選択肢となるでしょう。

AI をトレーニングする 2 つの方法の違いは何ですか?

人間性: ヒューマン フィードバックによる強化学習 (RLHF)
OpenAI: 大規模データとディープラーニング

Anthropic は、より透明性の高い AI システムの開発を期待しているため、トレーニング プロセス中の AI モデルの制御性と説明能力をより重視します。 Anthropic は主に強化学習とヒューマン フィードバック (RLHF) を使用しており、チームはさまざまなシナリオにおける AI システムの安全性と信頼性の確保に注力していきます。
対照的に、OpenAI は出力が多様かつ柔軟であることを望んでおり、AI モデルのパフォーマンスと生成機能を最大化するために大規模データとディープラーニングに重点を置いています。たとえば、GPT-4 は、モデルの自然言語処理と生成の多様性を向上させるために、事前トレーニングに大量のテキスト データを使用します。

 

2 つの言語モデルの違いは何ですか?

出力テキストを例にとると、2 つのモデルの最も明らかな違いは次のとおりです。

人間性(クロード)

  1. コンテンツの高い透明性:
    クロードはプロセスとデータ ソースを詳細に説明し、予測と分析にどの科学モデルを使用しているかを説明します。
  2. コンプライアンス:
    クロードの応答は一般に準拠性が高く、厳格な法的および倫理的基準に従う必要がある分野に適しています。

OpenAI (ChatGPT)

  1. より柔軟で自然な:
    ChatGPT の応答は、自然で流暢なテキストを生成することに重点を置き、エンターテイメント、教育、一般的なビジネス アプリケーションなど、幅広い対話や多様なアプリケーション シナリオに適した明確で簡潔な説明を提供します。
  1. もっと創造的になりましょう:
    ChatGPT の生成機能は強力で、より広範囲のトピックを処理でき、豊かなインタラクティブなエクスペリエンスを提供します。

 

2 つのモデルが同じプロンプトに対してどのように応答するかをより具体的に見てみましょう。

「気候変動の原因と影響を説明する」を例に挙げます。

クロードの答えは次のとおりです。

「気候変動とは、主に人間の活動による温室効果ガス排出量の増加によって引き起こされる、地球の長期的な気象パターンの変化を指します。化石燃料(石炭、石油、天然ガスなど)の燃焼と森林破壊は、どちらも温室効果ガス増加の主な原因です。ガス。
これらのガス(二酸化炭素やメタンなど)は大気中に蓄積し、地球の温度を上昇させる「温室」を形成します。
この温室効果は、異常気象の増加、海面上昇、生態系の変化につながり、ひいては人間の健康、農業生産、水供給に影響を与えます。 」

「私たちは、過去のデータと現在の傾向に基づいて調整された、気候変動の影響をシミュレーションおよび予測するために複数の科学モデルを使用しています。
私たちの分析では、さまざまなシナリオの下での温室効果ガス排出を考慮し、地球の気温や気象パターンに対する潜在的な影響を評価しています。これらのモデルとデータは、IPCC (気候変動に関する政府間パネル) などの権威ある組織から提供されています。 」

ChatGPTの応答

「気候変動は人間の活動と自然要因の組み合わせによって引き起こされます。人間の活動中に化石燃料が燃焼すると、地球を温暖化させる主要な温室効果ガスである二酸化炭素が大量に放出されます。
さらに、森林伐採は二酸化炭素の吸収を減少させ、気候温暖化を悪化させます。火山の噴火や日射量の変化などの自然要因も気候に影響を与えますが、人間活動の影響下では、これらの自然要因が果たす役割は比較的小さいです。
気候変動の影響には、異常気象の増加、海面上昇、氷河の融解、生態系へのダメージ、人間の健康問題などが含まれます。これらの変化は、農業生産の減少、水不足、気候難民の増加につながる可能性があります。

 

クロードが明確な推論でプロセスを説明し、参考資料を添付することは明らかです。
ChatGPT はよりユーザーフレンドリーで、ユーザーの理解を助けるために、よりシンプルで理解しやすい言語を使用しています。

2 つのモデルをより擬人化した方法で比較するには:

置くことができます クロードは、生徒の感情と安全に細心の注意を払う、穏やかだがやや真面目な教師を想像しています。厳格な倫理規定 (CAI) に従って、自分の言動が生徒に害を及ぼさないようにしてください。同時に、私たちは生徒や保護者と頻繁にコミュニケーションを取り(定期的なオープンソース投票)、全員の期待とニーズによりよく応えるために生徒の意見を取り入れた後、指導方法を調整します。

比較すると、GPT はより興味深いものですが、制御が不十分です。 GPTは生徒の適性に応じて指導できるとても賢い先生だと想像できます。豊富な知識を持ち、さまざまな質問に答え、丁寧に説明してくれます。しかし、場合によっては、生徒の背景の多様性が無視されたり、一部の生徒にとって有害となる可能性のあるデリケートなトピックが考慮されなかったりすることがあります。

Anthropic と OpenAI、AI 戦場における戦略的立場の比較

 

今日の AI 業界では、Anthropic と OpenAI はそれぞれ重要な戦略的位置を占めています。

Anthropic は AI テクノロジーのセキュリティと透明性により重点を置いているため、金融、医療、法律など、リスクとコンプライアンスの要件が高い業界の企業に好まれています。解釈可能性を重視した AI 製品は、これらの業界が AI テクノロジーをよりよく理解し、適用するのに役立ちます。

OpenAI はより幅広いユーザーを対象としています。 ChatGPT の柔軟なコンテンツ出力と多様な製品ポートフォリオにより、現在の市場で幅広いシェアを占めています。特にエンターテインメント、教育、一般的なビジネス アプリケーションにおいて、認知度が高く、使用されています。

 

人類への投資状況

Anthropic6

 

 Anthropic はこれまでに約 80 億米ドルを調達し、投資後の評価額は約 184 億米ドルとなっています。このうち 70 億米ドル以上は、AWS でのスマート チャットボットの構築に協力するための Amazon の 40 億米ドルとその後の Google の 2 米ドルから得られました。億の増加に伴い、当社は DeepMind AI 研究センターと協力して、より安全な AI アプリケーションを作成することを楽しみにしています。

これらの投資はマイクロソフトが OpenAI に投資した 100 億米ドルにはまだ相当しませんが、それでも将来 AI の戦場にはさらに多様な顔ぶれが存在することを示しています。



人類の未来

ビジネス領域の拡大という点では、OpenAI が GPT 4o をリリースした直後に、Anthropic は Claude がヨーロッパで発売され、フランス語、ドイツ語、イタリア語、スペイン語などの複数言語のサポートを開始し、さらなる多様化に向けて動いていることも発表しました。より高いカバレッジを実現します。
なぜなら、ヨーロッパは常に人工知能の安全性と規制、特に今年初めに可決された人工知能法の問題について最も声高に主張する地域の一つだからだ。 共同創設者のアモデイ氏は、AnthropicはEUのGDPRなどの公共情報規制の遵守に尽力しており、欧州の枠組み内で運営する用意があると述べた。

ユーザー エクスペリエンスの観点から、Anthropic はユーザーが携帯電話、パソコン、または API 自体を通じて、最も直感的な方法でクロードと対話できることを望んでいます。現在、Claude ユーザーが異なるアカウントと異なるデバイス間を自由に切り替えられるように、非常にスムーズなエクスペリエンスを積極的に作成しています。

3 要点

 

  1. Anthropic と OpenAI の違い:
    Anthropic は、安全で透明性の高い AI テクノロジーの開発に重点を置き、AI システムの説明可能性と制御可能性にも注力しています。同時に、トレーニング方法はより「憲法に則った」ものであり、トレーニング プロセスでは、考慮すべきヒューマン フィードバック (RLHF) を通じてモデルが決定されます。非西洋、非富裕層、または工業化された文化の価値観は、高度な信頼性と倫理を必要とするアプリケーションに適しています。対照的に、OpenAI は強力な生成機能と自然言語処理の柔軟性に重点を置いており、エンターテイメント、教育、一般的なビジネス アプリケーションなどのさまざまなシナリオに適しています。

  2. ショッピングモールの戦略的位置付けの違い:
    Anthropic は、その製品がデータ ソースと意思決定プロセスの詳細な説明を提供し、人間との対話プロセスの透明性と信頼性を高めることができるため、金融、医療、法律などのリスクの高い業界で人気があります。
    OpenAI は、市場、特に柔軟で自然な生成機能を必要とするエンターテインメントや教育などの業界で、より幅広い認知度と対象範囲を広げています。

  3. 人類の展望:
    ビジネス領域の拡大という点では、OpenAI が GPT 4o をリリースした直後に、Anthropic は Claude がヨーロッパで発売され、フランス語、ドイツ語、イタリア語、スペイン語などの複数言語のサポートを開始し、さらなる多様化に向けて動いていることも発表しました。より高いカバレッジを実現します。
    なぜなら、ヨーロッパは常に人工知能の安全性と規制、特に今年初めに可決された人工知能法の問題について最も声高に主張する地域の一つだからだ。 共同創設者のアモデイ氏は、AnthropicはEUのGDPRなどの公共情報規制の遵守に尽力しており、欧州の枠組み内で運営する用意があると述べた。

    ユーザー エクスペリエンスの観点から、Anthropic はユーザーが携帯電話、パソコン、または API 自体を通じて、最も直感的な方法でクロードと対話できることを望んでいます。現在、Claude ユーザーが異なるアカウントと異なるデバイス間を自由に切り替えられるように、非常にスムーズなエクスペリエンスを積極的に作成しています。

 

結語

Anthropic CEO先週のインタビュー報告書では、人工知能のトレーニング費用は依然として恐ろしく高く、ローエンドの基本モデルの費用は約1億ドルで、手持ちのCluadeのトレーニング費用は10億ドル以上であると述べている。

つまり、人工知能の開発にかかる莫大なコストが、OpenAI や Anthropic と競合するために独自のモデルをトレーニングしたいスタートアップにとって高いハードルを設定しており、大規模な言語モデルをめぐる戦場は短期的には手中に残ることになるでしょう。巨額の資金を持つハイテク巨人によって。

Anthropicの出現により、人々はAIの大規模言語モデルの出現についてより多様な想像力を持つことができるようになり、将来AIが引き起こす可能性のある倫理問題に対する解決策を事前に展開することができます。

この記事を読んでいただきありがとうございます!
まだまだ学ぶべきことがあると思われる場合は、私のニュースレター [Roxanne's Tech Talk] を購読してください。
もっと面白い科学技術の話を共有します! 🥳

500人が参加して最新の技術と知識を一緒に学びましょう Roxanne の Tech Talk を購読する
Linkedin を通じてコミュニケーションをとることも歓迎です👩🏻‍💻 ロクサーヌ・チェン



ja日本語