ファクトチェック保証 (参考文献):[公式文書: 1ソース][査読済みの研究論文: 1ソース][学術ウェブサイト: 1ソース]
| 沿って リチャード・アハーン - 昨年、ChatGPT は現存する最も高度な AI チャットボットの XNUMX つとして世界に火をつけましたが、今、Elon Musk の OpenAI はその基準をさらに引き上げました。
岩の下に住んでいる場合でも、2022 年 XNUMX 月にリリースされた Open AI のチャットボットである ChatGPT に関する興奮を経験したことがあるでしょう。
テクノロジー企業が自社の新製品を「次の大物」と宣伝することが多い中、Open AI の GPT 大規模言語モデルのグループはあらゆる場所で注目を集めました。
表面的には、これはテキストベースのメッセンジャー サービスであり、コンピューターが相手に話しかけていました。 音声で話したり、視覚的なフィードバックを生成したりしませんでした。テキスト行を読み上げて吐き出すだけでした。
では、なぜ人々はそれを好きになったのでしょうか。
生活が楽になったので、仕事をやり遂げ、うまくやった. しかしもちろん、それはあなたが何のために使うかによります。 洗濯や料理はしてくれませんが、きちんとしたレシピのアイデアを教えてくれます。
ただし、ライターやコーダーにとっては、どの言語でもコンピューター プログラムを作成するよう依頼すると、非常に印象的な仕事をしてくれます。
その独自性は、非常に単純化された、または不明確な指示を与えることができる方法にあり、多くの場合、空白を埋めて正しい仮定を立てます.
ライターの場合は、テキストのチャンクをコピーして貼り付け、それを XNUMX つの段落に要約するように依頼することができます — 問題ありません。 基本的なスペル チェックと文法チェックとして使用できますが、それではその才能が無駄になります。 ハイエンドの AI ライティング アシスタントと同じように、間違いを修正して明瞭さを改善するだけでなく、作品全体を書き直したり、最初からすべてを書いたりするように依頼することもできます (怠けている場合)。
忘れることの無いように…
不正行為との戦いで新しいワームの缶が開かれたため、教師と試験官にとって悲惨な悪夢でした. しかし、もちろん、OpenAI が GPT に標準的な学校の試験を実施してテストしたことは役に立ちません。以下に示すように、驚くべき結果が得られています。
その力を本当に理解するには、自分で実験する必要がありますが、全体として、出力品質は印象的です。これは主に、XNUMX、XNUMX 文だけでなく、拡張された詳細なコンテンツを生成できるためです.
しかし、それはただのGPT-3.5でした…
昨日、こんなニュースが流れました GPT-4 の準備ができました、そしてそれはまったく新しいモンスターです。
まず、技術コミュニティが切望していた、テキストだけでなく画像コンテンツも処理できると報告されています。 安全性は GPT-4 の焦点のようであり、「許可されていないコンテンツの要求に応答する可能性は 82% 低くなります」。
一言で言えば、もっと大きい…
GPTは呼ばれます 大規模な言語モデル — 言語に関する膨大なデータセットが与えられ、確率を使用して単語のシーケンスを予測します。 言語の構造に関する数十億のパラメーターを調べることにより、プログラムは単語または単語のセットを調べ、次に続く単語の確率を計算し、最も可能性の高いものを選択します。
たとえば、「私は…を駆け上がった」という文を取り、次に「犬」、「ボール」、「階段」、または「丘」という単語を取ります。
直感的に、「犬」と「ボール」は意味をなさないことはわかっていますが、「階段」と「丘」はどちらも実行可能な選択肢です。 ただし、ディープ ラーニング プログラムには人間の直感はありません。 大量のテキストを調べて、「I ran up the…」という文に続く各単語の確率を計算します。
その文の後に「犬」と「ボール」が出現する回数は 0.001% 未満であり、「階段」はこれらの単語に従う可能性が 20% であるが、「丘」は 21% の可能性があるとします。 そのため、マシンは「丘」を選択し、「私は丘を駆け上がりました」と出力します。
それは間違っているのでしょうか? もちろん、正しい確率は高くなりますし、データが多ければ多いほど正確になります。
それほど単純ではありません。 モデルがデータを取得すると、人間のレビュアーによってテストおよび微調整が行われ、精度が向上し、無意味なゴミを生成する傾向である「幻覚」 (間違った言葉を選ぶ!) が最小限に抑えられます。
パラメータの正確な数は明らかにされていませんが、GPT-4 はこれまでで最大のモデルであり、桁違いに大きくなっています。 以前は、GPT-3 は GPT-100 の 2 倍以上の大きさで、GPT-175 の 2 億に対して 1.5 億のパラメーターがありました。 GPT-4 でも同様の増加が見込めます。 さらに、このプログラムは、 強化学習 人間のフィードバックから。 これには、チャットボットの応答を評価するように人間に依頼することが含まれます。これらのスコアは、より良い出力を生成するために「教える」ためにフィードバックされます。
Open-AI は、「競争環境と安全性への影響の両方」を挙げて、GPT-4 について秘密のままです。 したがって、正確なモデル サイズ、ハードウェア、およびトレーニング方法はすべて不明です。
彼らはこう言いました:
「GPT-4 は、幅広い一般知識と問題解決能力のおかげで、難しい問題をより正確に解決できます。」 GPT-82 よりも、禁止されたコンテンツのリクエストに応答する可能性が 3.5% 低く、でっち上げの可能性が 60% 低くなります。
恐ろしい部分は次のとおりです。
GPT-4 はほとんどの人間の受験者よりもはるかに優れており、GPT-3.5 は学校の試験で優れていました。 たとえば、司法試験(法律)では、GPT-90 が 3.5 パーセンタイルという痛ましい成績だったのに対し、上位 10 パーセントの成績を収めました。 AP 統計、AP 心理学、AP 生物学、AP 美術史 (英国では A レベルに相当) では、GPT-4 は 80 から 100 センタイルの間のスコアを記録しました。
すべてが良いわけではありません:
興味深いことに、英語の文学と作文では最も成績が悪く (8 から 22 センタイル)、微分積分 (43 から 59 センタイル) ではより印象的だった可能性があります。
Twitter では、GPT-4 がナプキンに走り書きされた Web サイトのアウトラインを完全に機能するオンライン アプリケーションに変える方法を示した人もいました。
全体として、OpenAI は、GPT-4 の重要な改善点として、精度と安全性の向上を強調しました。 たとえば、ユーザーが爆弾を作成するための指示を求める場合、応答する可能性ははるかに低くなります。 また、前任者よりもはるかに長いコンテンツを処理することができ、約 25,000 ワードと比較して 1,500 ワードを処理します。
GPT-4 は以前よりも「創造的」であると宣伝されてきました — OpenAI によると、「曲の作成、脚本の作成など、創造的で技術的な執筆タスクを生成、編集、およびユーザーと繰り返すことができます…」
最後に、おそらく最大のものは、画像の内容を分析および分類できる「ビジョン」を備えていることです。
AI が登場しました。その進化がスリリングであるか恐ろしいものであるかにかかわらず、AI が定着していることは否定できません。 置き換えられることを心配する人もいるかもしれませんが、その可能性を受け入れる人は、利用可能な最も強力なツールとしてそれを使用します.
君の力が必要なんだ! の無修正ニュースをお届けします 無料、しかし私たちはこれを行うことができるのは、次のような忠実な読者のサポートのおかげです 君は! あなたが言論の自由を信じて本当のニュースを楽しむなら、私たちの使命を支援することを検討してください 後援者になる またはを作成することによって ここで一回限りの寄付。 の20% 全て 資金はベテランに寄付されます!
この記事は私たちのおかげでのみ可能です スポンサーと常連客!
ディスカッションに参加してください!