近年ではIAの発展は、人間社会に大きな影響を与えていて現在もどんどん進化を続けていて、今まで人間が行っていた作業もIAの知能やロボットに置き換わっている部分がすでに多く見られる。
当初のIA技術は特殊で高価なものだったために一般人には手が届かないものだったが、最近ではパソコンやスマートフォンで使用できるものが多数あり、一般人でもお手軽に使用できる様になった。
その使用用途はさまざまですが、IAに文章を作成させたり、また画像を生成させたりなどが一般的な使い方になるでしょうか。IAへ具体的な内容をテキスト文で指示して目的を達成させるという、対話型のIAが一般的には普及しているといって良いでしょう。
今回紹介する「Grok」も、その対話型IAとのやり取りで文章や画像生成いくものになる。
1. 「Grok」の概要
「Grok」は、X(旧Twitter)で使用することができるIA機能で、イーロン・マスク氏が設立したxIA社によって開発された対話型のIAである。
リアルタイム情報の取得や高度な画像生成で注目を集めており、また「Grok」の考え方としては「すべての質問に対して回答する」ことを目的としており、一般的なIAでは避けられている「道徳や社会に反する内容」に対しても回答するという特徴がある。
あと、人間味のあるユーモアな回答をしてくれるモードも用意されているのも面白い。
2. 個人的な使用してみた感想
今までのどの様なIAを使用してきていて、どの様な事をやってきたかなどのいろいろな要素が絡んでくるので一概には言えませんが、「Grok」を使用してみた感想をお伝えしたいと思います。
まず、一言で評価するとすれば「非常に精度の高いIA」だと思います。
画像生成については、少ないプロンプトでもこちら側の意図を理解して画像を生成してくれているというのが、完成した画像を見れば理解できる。
完成度についてもレベルが高いと思われるのは、人物を生成した際の指を見ればわかりやすい。性能が低いIAで生成すると指の本数が4本だったり6本だったり、指の長さがおかしかったりと変な生成個所が出てくるものなのですが、Grokで生成した画像にはそれを感じさせるものが無い。
生成回数を重ねていくと不自然な部分も出で来るでしょうか、その確率には大きな違いがある事はすくに分かったほどレベルに違いがある。
3. 「Grok」には種類がある
xIA社は、2024年8月13日に「Grok-2」および「Grok-2 mini」のベータ版をリリースし、いずれも以前までの「Grok-1.5」の性能を上回る仕様になっている。
3-1. Grok2(ベータ版)
以前の「Grok-1.5」から進化して、コーディング、推論のフロンティア機能を備えており、推論、読解、数学、科学、コーディングを含む一連の学術ベンチマークでClaude 3.5 SonnetやGPT-4-Turboを上回る性能を記録したそう。
3-2. Grok2ミニ(ベータ版)
Grok2をより高速化し、生成品質と速度のバランスを取ったモデルで、敏速な対応が求められる場合に重宝する事になる。ただ、個人的には通常のGrok2モデルでも十分な生成速度だと思う。
3-3. ユーモアモード
通常のモードでは、入力した事実に基づく直接的な回答を提供し、「ユーモアモード」では軽妙なトーンで会話を楽しませることができます。これらの機能によってユーザーは自分の好みに合わせてAIの応答スタイルを選択することが可能です。
4. 文章作成の能力について検証
文章の作成の能力と理解度について簡単な検証をしてみます。
4-1. 通常の文章作成
富士山についての説明を300文字以内で説明文を作成する様にプロンプトを入力してみました。細かい内容は入力せずに出来るだけ単純な言葉で、文章も最小限に収まる様に心掛けました。
上の画像の様に入力欄へプロンプトを書き込んで▶︎をクリックするだけ。
完成した文章が上の写真のものになります。
この最小限のプロンプトで、これだけ的確な文章を作り出す事が出来るのであれば優秀なAIといって良いでしょう。
4-2. 特殊な文章作成
文章作成というよりか、簡単なプログラミングを指示してみました。
キーボードのスペースキーを押すと、画面に「こんにちは」と表示するだけのプログラムをhtml言語で作成してもらう様にしたものです。
上の画像の様に入力欄へプロンプトを書き込んで▶︎をクリックするだけ。
まずは、正確なプログラミング内容を表示したといって良いでしょう。
この様にIAは、単純に文章の作成能力があるだけではなく、プログラミンについても言語別に作成能力があり、その他にもテキストで表現できる事は工夫次第で多くの事が実現できるでしょう。
5. 画像生成の能力について検証
次は画像生成の能力がどの程度あるのかを検証してみたいと思う。
日本人の和服美女を生成するプロンプトを入力してみる。
高画質で何ら問題のない画像が生成されているので、IAレベルは高い事が分かる。
次は、可愛い柴犬のが像を生成してみる。
プロンプトに「可愛い」が入っているからだと思うが、子供の柴犬が生成されていて、背景をぼかしてポートレート写真風にしてくれている。
この短いプロンプトで正確に解釈して画像を生成していることから、IA能力はレベルが高いと思われます。中でも驚いたのは画像生成にかかる時間が数秒~10秒程度しかかからない事で、この速さで生成してくれるのであれば負担とストレスがかなり軽減される。
6. まとめ
Grokを使ってみた感想としては、個人的なものとなりますが非常に良いレベルで仕上がっていると思います。
文章作成能力、画像生成能力、生成時間など、どれを取っても満足できるレベルでした。
ベータ版でこのレベルですから今後の発展には更なる期待を持ちたいと思います。
現時点でgrokを使用するためには、X(旧Twitter)プレミアムに加入する必要があります。
コメント