電通総研、企業向け生成AIソリューション「Know Narrator(ノウナレーター)」にマルチモーダルRAGを搭載
AIニュースの要約
- 電通総研が企業向け生成AIソリューション「Know Narrator」にマルチモーダルRAGを搭載。
- マルチモーダルRAGにより、テキストに加え、図やグラフ、写真からも情報を取得可能に。
- 従来のRAGの限界を克服し、回答精度が向上。
- ユースケースには、社内申請方法の検索やCAE解析データの解釈、調査レポートの考察が含まれる。
- 2024年にはより高度なAIモデル「o1-preview」を追加予定で、さらなる機能拡充を計画中。
AIニュースの背景(推測)
企業のデジタルトランスフォーメーション(DX)が急速に進む中、AIはその中心的な役割を果たしている。特に生成AIは、情報処理や業務効率を劇的に改善できるツールとして注目されている。しかし、従来のAIモデルは、テキスト情報に限定されるため、視覚的要素(図、グラフ、画像)を活かすことが難しかった。このため、企業では正確な情報の提供に課題を抱えていた。電通総研は、こうしたニーズに応えるため、マルチモーダルRAGを取り入れることで、より幅広い情報を扱う能力を高め、生成AIの活用範囲を拡大したと考えられる。
AIニュースの内容(詳細)
電通総研が発表した「Know Narrator」は、企業向けの生成AIソリューションであり、近年のAI技術の進化に伴い機能が強化された。特に、今回追加されたマルチモーダルRAG(Retrieval-Augmented Generation)技術は、生成AIが社内情報を参照して回答を生成する能力をさらに進化させるものだ。従来のRAG方式では、テキスト情報のみで回答を作成していたが、マルチモーダルRAGは、図やグラフ、写真といった視覚情報をも考慮に入れた回答を生成することが可能となった。
この機能により、具体的なユースケースが提案されている。社内申請方法の検索においては、申請手続きに関するワークフロー図を理解した上で、適切な回答ができる。また、製造現場におけるCAE(Computer Aided Engineering)解析データの解釈においても、グラフや画像から有用な情報を引き出し、質問に対して具体的な回答を提供できる。さらに、調査レポートの内容考察では、結果をグラフィカルに理解し、全体の内容を抽出して考察を行うことが可能となる。
このように、電通総研は、2024年内に「o1-preview」という新たなAIモデルの搭載も計画しており、これによってさらに先進的な思考プロセスを通じた回答を生成できるようになる。未来を見据えた技術的発展の一環として、企業の生産性向上やDX推進を支援する姿勢が強調されている。
ビジネスで活用する方法・可能性
「Know Narrator」に搭載されたマルチモーダルRAGは、企業が生成AIを活用するための新たな可能性を開く。具体的には、様々な業務プロセスにおいて、より精度の高い情報提供を実現できるため、企業全体の効率を向上させる要因となる。以下はいくつかの活用方法や可能性を示す。
まず、社内業務の改善に役立つ。例えば、社内の申請手続きに関する問い合わせに対し、従来のテキストベースでは難しかったワークフロー図の解析を通じて、迅速かつ正確に対応できる。これにより、業務時間の短縮やエラーの削減が期待できる。
次に、製造業界では、CAE解析データを扱う場面での利用が顕著である。製造ラインで発生するデータをリアルタイムで解析し、グラフや図を基にした即時のフィードバックを行うことが可能になる。これにより、製品の品質向上やスリムな生産プロセスが実現できる。
また、マーケティングやリサーチ部門においても、調査結果の視覚的な把握が重要視されている。調査レポートのグラフデータを解析し、競合や市場トレンドを迅速に把握することで、戦略的意思決定をサポートする役割を担うだろう。
さらに、教育にも利用価値がある。社内研修や教育プログラムにおいて、視覚情報を用いたコンテンツを生成し、新しい概念や技術を理解しやすくすることができる。専門的な分野での教育を効率化し、学習の効果を高めることに繋がる。
最後に、マルチモーダルRAGは、従業員の自己学習や情報収集を促進する手段としても機能し、企業全体の知識の共有や活用を推進する可能性がある。AIを用いた情報の集約と分析により、社員が必要な知識を迅速に得られる環境を整えることができるだろう。
このように、「Know Narrator」に搭載された新たな技術は、企業の様々な側面における生産性向上の手段となり、持続的な成長を支える基盤を提供することが期待される。
電通総研、企業向け生成AIソリューション「Know Narrator(ノウナレーター)」にマルチモーダルRAGを搭載- テキストだけでなく、図やグラフ、写真などからも情報を取得し、回答精度を向上 -株式会社電通総研2024年11月8日 11時00分2テクノロジーで企業と社会の進化を実現する株式会社電通総研(本社:東京都港区、代表取締役社長:岩本 浩久、以下「電通総研」)は、企業向け生成AIソリューション「Know Narrator(ノウナレーター)」に、マルチモーダルRAGを搭載し、2024年11月8日(金)より、提供を開始します。
マルチモーダルRAGとは、生成AIから社内情報を参照し、回答文を生成するRAG(Retrieval-Augmented Generation)※1がさらに進化し、テキストだけでなく図やグラフ、写真などからも情報を取得し、回答を生成できる技術です。
「Know Narrator」ロゴ
マルチモーダルRAG搭載による効果とユースケース
効果
従来のRAGでは、ドキュメント中の図やグラフなどの視覚情報が読み取れないため、ドキュメント全体として意図する内容を正確に理解しきれず、回答の精度が上がらないといった課題がありました。今般搭載したマルチモーダルRAGにより、今まで生成AIの回答の基となる情報から外れていた、図やグラフ、写真などの情報も活用することが可能となり、回答精度が向上します。本機能のユースケース
1. 社内申請方法の検索
社内の申請手続きに関する質問に対し、マニュアル内のワークフロー図を理解し、次のアクションや申請者など適切な回答を生成します。
2. CAE等の解析データの解釈
製造現場で使用されるCAE等の解析データを読み込ませることで、グラフや画像を含む解析結果を理解し、質問に対してより適切な回答を提供します。
出典 PR TIMES