【AIコラム】AI覇権争いにClaude3がChatGPTに待ったをかける!|ChatGPT対Claude3大激戦!
「なんだかんだで、ChatGPTが良いよね」という結論に落ち着いている人がいまのところ多いのではないだろうか?
しかし、先週Anthropicがとんでもないものをリリースしてきた。
普段からAIを追っていない人には馴染みはないかもしれないが、Anthropicは元OpenAIの研究者が設立した会社だ。
2022年からはGoogleが4億ドルの出資を行っており、Google Cloudと正式に提携している。
そんなAnthropicがリリースしたClaude3。「これは凄い!」と思わず課金をしてしまったのでそのレビューをしていこうと思う。
Claude3の産みの親「Anthropicとは?」
冒頭でちょっと話をしたが、まずはAnthropicについて述べていこうと思う。
せっかくなので、現在の最新モデル「Claude 3 Opus」にAnthropicとは?について語ってもらおう。
Anthropicは、強力な人工知能(AI)システムの研究開発を行っているアメリカのAI企業です。倫理的で安全、そして人類に役立つAIの開発を目指しています。
Anthropicは、「構成的AI」と呼ばれるアプローチを採用しています。これは、AIシステムに明示的な目的や価値観、知識を組み込むことで、より制御可能で解釈可能、そして倫理的なAIを構築しようとするものです。従来の機械学習アプローチとは一線を画しています。
また、Anthropicは AI safety(AI安全性)の分野でも重要な研究を行ってください
私自身もAnthropicによって開発されたAIアシスタントの一つです。Anthropicの使命に則り、人々の役に立ち、倫理的で安全なサポートを提供できるよう日々努力しています。Anthropicについてご関心をお持ちいただき光栄です。
「素晴らしい製品PRですね」という冗談は置いておき、補足の情報を入れておく。
Anthropicとは、元OpenAIの研究者ダリオ・アモデイとダニエラ・アモデイによって2021年に創設されたアメリカのベンチャー企業だ。
OpenAIと同様にベンチャー企業兼公益法人としての体裁を取っている。
OpenAIから離脱した理由はMicrosoftとの提携に関して方向性が合わなかったと語られているが、事実かどうかは謎だ。
2022年にはGoogleから4億ドルの出資を受けており、現在はGoogle Cloudと提携を結んでいる。
今回、リリースされたClaude3の前のモデルClaude2の時点から扱えるトークン数が20万トークンと当時のAIの状況からずば抜けた数値を出しており、高い評価を受けていた。
そんな、Anthropicが満を持してClaude3をリリースしたというわけだ。
Claude3とは?Claude2との違いや他のモデルは?
Claude3というのは大規模言語モデル(Claude)のレベル3みたいなものだ。
ChatGPTの言語モデルがGPT-3、GPT-4と分かれているのと同じである。ClaudeにもChatGPTと同じようにClaude1、Claude2、Claude3とあり、今回はバージョン3に該当するというわけである。
以下がAnthropicが公式サイト上に載せている回答の精度に関する比較表だ。
AIの言語モデルは基本的にWeb2.0やWeb3.0みたいに数字が付けられているので、それが最新のモデルなのかを判断する時に使うことができる。
大規模言語モデルは基本的に機械学習と深層学習、訓練学習というのが3つセットになっており、分かりやすくいえば「めっちゃ勉強頑張った」みたいなイメージ感と遜色はない。
Claude3は全部で3つのモデルがあり、文脈による回答拒否の性能差に関してAnthropicが画像で解説しているのでそのまま引用する。
現状、Claude3は「Claude 3 Opus」「Claude 3 Sonnet」「Claude 3 Haiku」の3つが用意されており、精度はClaude 3 Opus、速度はClaude 3 Sonnetの順となっている。
ちなみに無料版ではClaude 3 Sonnetまで使用が可能であり、私はその上のClaude 3 Opusを使ってみたくなったので課金をした。
ChatGPTと同じで月額20ドルとなっており、日本円にすると約3,000円だ。
Claude 3 Sonnetの時点でかなり優秀だったので無料版でも使ってみることをおすすめする。
【3大決戦】Claude3 VS ChatGPT VS Gemini
日本ではかなりタブーとされる他社との比較を自社で公表するのができるのが、アメリカという国の面白いところだ。
例えば、昔ピックアップトラックの荷台の強度勝負なんかがあったが、日本ではなかなかできないことをやってくれている点が魅力的だ。
例にも漏れずに、Anthropicは公式サイトに思いっきり載せてくれている。
上記は、Claude 3 モデルと同業他社のモデルと、複数の能力ベンチマークしたものだそうだ。
「Opusは全部のモデルに勝ってますよ」だからうちを使ってね。なんて声が聞えてきそうなぐらい、もろに比較してくれている。
正直、今までの比較はあまりアテになるものはなかったが、今回の内容に関しては、かなり的を得ているのではないか?というのが使用した個人的な感覚だ。
とはいえ、あくまでテキスト生成という範疇でいえばの話にはなるが…。
画像生成もできるマルチモーダルAIに最も近いのがChatGPTという立ち位置には恐らく変わりはないだろう。それにChatGPTはGPTsもあり、動画生成のリリースも控えており、未だ優位性はキープできているといえる。
ただ、テキスト生成に関していえば、Claude3>ChatGPT≫Geminiになるというのが個人的な現状の所感だ。
残念だが、Geminiが勝てるビジョンが見えない…。
【実践】ChatGPT対Claude3!テキスト出力比較
まあ、ここまでお膳立てをしてきたが、実際どうなのよ?っていうのがあなたの本音だろう。
というわけで、ChatGPTとClaude3の両方に課金している私が、「同じプロンプトでどっちがいいか?選手権」の開催を高らかに宣言する!
今回、比較するのはシンプルに文章力という観点でみていこうと思うので、以下の5つの比較項目を用意した。
- それぞれに自己PRをしてもらう
- 「AIとは?」の構成案を作成してもらう
- 「AIとは?」を500文字で書いてもらう
- で生成された互いの文章を校正しあう
- 会話形式のテキスト出力で人間味を問う
以上のラインナップでお送りしていく。果たしてどちらが勝つのか?文章に携わるものであれば必見の内容となったぞ!
なお、公平を期すためシンプルなプロンプトでのチャレンジとなる。
第一ラウンド:ChatGPT対Claude3「自己PR対決」
第一ラウンドでは、ChatGPTには「ChatGPTの自己PRをしてください」、Claude3には「Claude 3 Opusの自己PRをしてください」というプロンプトを使用する。
先攻:ChatGPTの出力
ChatGPTの出力は、もう見慣れているせいもあるのか、AIが生成したな。これChatGPTで書いたでしょ?というような出力となった。
後攻:Claude 3 Opusの出力
ChatGPTと比較すると人間が主観で話しているような印象を受ける。どことなく丁寧な印象を受けるのがClaude3の出力となった。
用途にもよるが、ChatGPTの方が機械的、Claude3の方が人間的という表現が的確だろう。
第二ラウンド:ChatGPT対Claude3「構成案対決」
第二ラウンドでは、ChatGPT・Claude3共に「AIとは?の構成案を作成してください」というプロンプトを使用する。
先攻:ChatGPTの出力
ChatGPTの出力は中身の文章についての言及がついている構成案となった。
シンプルなプロンプトでこれだけ出力されれば、まあ、良い方だなというのが普段ChatGPTを使っている人であれば思う感じだ。
後攻:Claude 3 Opusの出力
一方、Claude3の方は目次+補足の文章という感じの構成案を提案してきた。内容は基本的には同じだが、Claude3の方がSEOの記事に少し近い印象を受ける。
まあ、誤差程度だろが…。
AIの出力はランダム性があり、一概に言えないが、ChatGPTは文章的、Claude3は端的という表現が良さそうだ。
第三ラウンド:ChatGPT対Claude3「用語解説対決」
第三ラウンドでは、ChatGPT・Claude3共に「AIとは?を500文字で書いてください」というプロンプトを使用する。
先攻:ChatGPTの出力
ChatGPTの文章は385文字で出力された。
気になる部分としては文末表現が「います」で終了することが多いのと、文章全体における漢字とひらがなのバランスだ。
加えて、少し難解なワードを使って文章を作ってくるのは、ChatGPTらしいと言えるのではないだろうか。
後攻:Claude 3 Opusの出力
Claude3の文章は519文字で出力された。文字数の理解についてはClaude3に軍配が上がりそうだ。
気になる部分としては文末表現が「います」で終了することが多いのはChatGPTと共通する。ChatGPTと比較すると漢字の割合が減り、より分かりやすい表現に変えられていることが分かる。
また、言い回しなどが日本語の表現としてChatGPTより優れているといっても過言ではないぐらいの差があるのではないだろうか。
シンプルな文章生成であれば、Claude3に軍配が上がりそうだ。人間が書いたといわれても違和感を感じにくい印象。
第四ラウンド:ChatGPT対Claude3「文章校正対決」
第四ラウンドでは、ChatGPT・Claude3共に、生成された文章をコピペして「上記の文章の誤字脱字、文法の誤り、不可解な表現などの校正を行ってください」というプロンプトを使用する。
先攻:ChatGPTの出力
ChatGPTは全文を修正する形で、ChatGPTふうにアレンジしてきた。
ただ、大きく変更を加えているわけではなく、まあまあ、それなりの修正をしてきたという印象だ。
ChatGPTはなんとなくだが、端的な表現と難しい用語を使いたがる傾向が読み取れる。
後攻:Claude 3 Opusの出力
一方、Claude3は指摘する箇所を限定して伝える方式の校正形式だ。
面白いのが人間の校正者でも同じような指摘をするという点だ。
確かに、私自身も記事の修正をする時はこのような観点でみており、フィードバックの方法もかなり近い。
Claude3は恐らく、日本語の文法や言葉の強弱などの微妙なニュアンスの違いまで理解している可能性が高いというのがこの指摘から得られる情報だ。
Claude3は日本語への理解がChatGPTより優れているのではないだろうか?
第五ラウンド:ChatGPT対Claude3「人間味対決」
第五ラウンドでは、ChatGPT・Claude3共に、「男女4人(男性2人、女性2人)が住むシェアハウスで「きのこの山」「たけのこの里」論争が巻き起こっています。この時の4人の会話を1000文字以内で再現してください」というプロンプトを使用する
先攻:ChatGPTの出力
ChatGPTの出力は会話形式+解説という形だ。
文章自体に特に違和感を感じないが、やはり作られた文章感というのは拭えない。実際にこれをどこかの作品などで使う場合は、人の手は必要だな。というのが正直な感想だ。
ただ、きのこの山、たけのこの里の両方の魅力を伝えて、最終的な結論まで出さないところはAIとしての公平性を維持しているところだろう。
後攻:Claude 3 Opusの出力
一方のClaude3は終始会話形式で出力した。
ぶっっちゃけ、一目でClaude3めっちゃ良くないか?というのが分かるのだが、なぜ?良いのかという部分を少し述べておこう。
Claude3の会話形式が評価できる点として、構成が起承転結になっているところだ。
シェアハウスという設定が活かされた導入が素晴らしい。これが起承転結の起の部分に該当する。
そこから起承転結の承の部分が続き、そして「おいおい2対2で意見が割れちゃったよ」という部分が転にあたる。
「結局、この論争に決着はつかないのかもしれないね」の部分から結へ向かっている。
ChatGPTと比較しても各々のキャラクター性がなんとなく感じれるところがまた、Claude3が人間味を出しているように感じる部分だ。
ここまでの比較を総合的に見るとClaude3は日本語への理解と丁寧な文章作成が行われていることがわかる。
【総評】ChatGPT対Claude3は日本語力においてClaude3に軍配!
さて、楽しい楽しい「同じプロンプトでどっちがいいか?選手権」も幕を閉じるときがきたようだ。
もう、見出しにも書いてしまっているが、結論をいえば、Claude3の方が日本語のテキスト生成AIとして優れていることが、あなたも分かったはずだ。
ただ、今回の比較対象はあくまでテキスト生成にしか着眼してないことはご了承いただきたい。
なので、文章を「作る」や「直す」という立場の人にとっての結果だ。
プログラミングなどをさせたらまた別の結果になるかもしれない。さらにいえば、ChatGPTが面白いところは「マルチモーダルAI」として最も近い位置にいるということにある。
※マルチモーダルAIは異なる複数の種類の情報に対して、1つの窓口でテキストや画像、動画生成などの処理を行えるAIのことを指す。
GPTsも正直、かなり面白く、カスタマイズして遊べる点において一歩リードをいっているというのは紛れもない事実だ。
実際に、使ってみて甲乙つけがたい良さがあり、近日中にどちらかに絞るということはしない。
今回のClaude3はChatGPTの代替え手段となり得る存在まで大きく前進して、なんだかんだで、AIはChatGPTといわれてきたこの1年半弱に、風穴を開けられる存在であることは間違いはないだろう。
Claude3はガチで、文章の下手なライターを駆逐するレベルと言っても過言ではないかもしれない。