執筆者 machiko | 11月 19, 2024 | 未分類
はじめに AI技術の進化は、私たちの生活や産業のあらゆる場面で大きな影響を与えています。その中でも、画像と自然言語を統合的に処理する「マルチモーダルAI」の分野は、特に注目を集めています。2021年にOpenAIが発表した**CLIP(Contrastive Language–Image Pretraining)**は、この分野の代表的な技術の一つとして位置づけられています。...
執筆者 machiko | 11月 18, 2024 | 生成AI
はじめに 近年、人工知能(AI)の進化は目覚ましく、その中でも特に注目を集めているのが大規模言語モデル(LLM)です。中でもOpenAIが開発するGPTシリーズは、その圧倒的な性能と多機能性で多くのユーザーに利用されています。そして2024年5月、最新モデルであるGPT-4oがリリースされました。...
執筆者 machiko | 11月 15, 2024 | VLM
はじめに VLM(Vision Language Model)は、視覚情報とテキスト情報を同時に処理するマルチモーダルなAI技術です。画像認識AIや大規模言語モデル(LLM)の機能を組み合わせたもので、さまざまな分野での活用が期待されています。例えば、自動運転車の物体検出、Eサイトのレコメンドシステムなど、多岐にわたる用途が検討されています。 このVLMは、デジタル広告、医療画像解析、eコマース、自動運転など、多くのビジネス分野で大きな可能性を持つ技術です。 VLMとLLMとの違い...
執筆者 machiko | 11月 13, 2024 | 生成AI
はじめに OpenAIは2024年9月12日、複雑な推論タスクを得意とする新しいAIモデル「OpenAI o1」のプレビュー版を発表しました。近年のAIモデルは、日常的な質問応答やデータ分析、簡単なコーディング支援などに活用されていますが、より深い専門知識や高度な論理的思考が必要とされるタスクにおいては限界があるとされていました。今回発表されたOpenAI o1は、その「推論能力」をさらに強化し、特に科学的分野やコーディングにおける問題解決を目指したモデルです。 OpenAI...
執筆者 machiko | 11月 11, 2024 | 未分類
はじめに...