ブログ記事一覧

最新の記事から順番に表示しています

最新ローカルマルチモーダルモデル Gemma 3・MedGemma・MMaDA・Janus – コア技術と活用術

最新ローカルマルチモーダルモデル Gemma 3・MedGemma・MMaDA・Janus – コア技術と活用術

2025年06月06日

2025年、あなたの開発環境に、ただコードを処理するだけではないAIが常駐する時代が本格的に到来しました。もしAIが、あなたが提示したUIデザイン案を“見て”改善点を提案し、その意図を“汲み取って”新しいコンポーネントを“生成”してくれたら…？これはもう夢物語ではありません。マルチモーダルAIは、テ...

生成AI狂騒曲：2025年6月、開発世界は変わる？ AIエンジニアに贈る最新動向と生存戦略

生成AI狂騒曲：2025年6月、開発世界は変わる？ AIエンジニアに贈る最新動向と生存戦略

2025年06月05日

「また新しいモデルか…」「このツール、本当に使えるの？」 2025年6月、AIの進化はまるで光速。我々AIエンジニアの日々は、新しい技術の波に乗りこなし、時に溺れそうになりながらも、その可能性に胸を躍らせる…そんなエキサイティングな冒険の連続ではないでしょうか。巷では「AIが仕事を奪う」なんて囁かれ...

AIコーディング支援の最前線：2025年6月版

AIコーディング支援の最前線：2025年6月版

2025年06月03日

### 〜新技術やツールはこんなに進化している！そして、もっと深く使いこなすためには？〜こんにちは、AIエンジニアの皆さん。今日は「**もうGitHub CopilotもCursorもエージェントモードもバリバリ使ってるよ**」という上級者の方々をターゲットに、最新のAIコーディング支援ツールのト...

大規模AIモデルの効率的な圧縮、量子化最新動向

大規模AIモデルの効率的な圧縮、量子化最新動向

2025年06月02日

## I. はじめに「最近やたらとAIの話題を耳にしませんか？」**――自然言語処理を得意とする大規模言語モデル (LLMs)、画像生成でインパクトを放つ**拡散モデル (DMs)など、これまで人間しかできないと思われていた創造的タスクをいとも簡単にこなすAIの登場に、世界がざわついています。たと...

Netflixの推薦モデル「FM-Intent」：階層的マルチタスク学習が切り拓く次世代レコメンデーション

Netflixの推薦モデル「FM-Intent」：階層的マルチタスク学習が切り拓く次世代レコメンデーション

2025年05月30日

## ユーザーの「いま欲しいもの」をどう読む？ Netflixといえば、世界中の視聴データを基にハイレベルなパーソナライズを実現してきた映像ストリーミングの巨人です。でも、そんな巨人にも課題はありました。「とりあえずコメディが好きっぽいからコメディを並べとけばいい、ってわけじゃないんだよな…」と悩む...

教育系AIエージェント開発のための音声対話プラットフォーム総まとめ

教育系AIエージェント開発のための音声対話プラットフォーム総まとめ

2025年05月30日

こんにちは、エンジニアの皆さん。**「音声対応AIエージェントを作りたいけど、STT（音声認識）やTTS（音声合成）、LLMとの連携、さらに対話管理まで、どれをどう組み合わせればいいの？」と迷子になったりしていませんか？実は最近、こうした「音声会話のすべて」を統合するSDKやフレームワークが、一気...

マルチエージェントAIが本格化──最新動向を徹底解剖

マルチエージェントAIが本格化──最新動向を徹底解剖

2025年05月28日

「ねえ、そろそろ“単独のAIエージェント”に任せっきりは限界なんじゃないか？」**2025年の今、こうした声が大企業のIT部門やスタートアップの開発現場でささやかれ始めています。なぜなら、ひとつのLLMエージェントですべてをこなそうとすると、どうしても扱えるタスクの幅に制約が出るし、なにより“専門性...

Figma MCP と Cursor を活用したデザイン修正――AIでどこまで作業を効率化できるのか

Figma MCP と Cursor を活用したデザイン修正――AIでどこまで作業を効率化できるのか

2025年05月27日

### はじめに近年、デザインからコーディングまでを一気通貫で支援してくれるAIツールが増えています。FigmaやSketchのプラグインとして動くコード生成ツールや、ソースコードを自動補完するAIエディタなど、選択肢は数多く存在します。**本記事では、筆者が実際の案件で「Figma MCP」と「...

NLWebが開く「会話できるWeb」の未来

NLWebが開く「会話できるWeb」の未来

2025年05月27日

「このWebサイト、もう少し“気が利く”相手にならないかな？」――そんな願いはありませんか？　今、Microsoftが打ち出した**NLWeb (Natural Language Web)**が、私たちの普通のWebサイトをまるでAIアプリのように“話し相手”へ進化させようとしています。しかも、やや...

Vision RAG最新動向と原理・応用分析

Vision RAG最新動向と原理・応用分析

2025年05月26日

「画像をそのまま検索に使う」と聞くと、思わず「本当にそんなこと可能なの？」って思いませんか？それが**Vision RAG**の世界です。今回のレポートでは、Vision RAGがいまどんなことになっているのか、その**基本原理から使い所まで**をざっくり、でもしっかり深く解説していきます。「ち...

企業内特化LLMシステムの最新アプローチ比較（2025年5月）

企業内特化LLMシステムの最新アプローチ比較（2025年5月）

2025年05月22日

## はじめに：最新LLM活用の風が企業に吹いている「最新のChatGPTやLLMがすごいのはわかったけど、実際ウチの会社のデータとつなげるにはどうすればいいの？」そんな声が社内外で渦巻く2025年、ついに**RAG（Retrieval-Augmented Generation）**というアーキ...

Semantic Dependency Injection（Semantic DI）とクラスタ・アーキテクチャ

Semantic Dependency Injection（Semantic DI）とクラスタ・アーキテクチャ

2025年05月22日

「LLMに専門用語をちゃんと教えたのに、どうも意図通りに使ってくれない……」 AIエンジニアなら、一度はこんなフラストレーションを感じたことがあるかもしれません。ここでは、そんな悩みを解消するために注目され始めている **Semantic Dependency Injection（Semantic...

8Bパラメータ小型言語モデルの最適学習・微調整戦略【2025年版】

8Bパラメータ小型言語モデルの最適学習・微調整戦略【2025年版】

2025年05月21日

近年、数十億パラメータ規模の**小型言語モデル (Small Language Model; SLM)** が飛躍的に性能向上し、実用的な水準に達しています。特に2024年には、**7〜8B（約70〜80億）パラメータ**程度のモデルが従来より大規模なモデルに匹敵する成果を上げました（例：Mistr...

AlphaEvolve：Google DeepMindが目指す“進化型”AIコーディングエージェント

AlphaEvolve：Google DeepMindが目指す“進化型”AIコーディングエージェント

2025年05月20日

—2025年5月発表、その実力と“ちょっと地味？”な成果を読み解く— みなさんは「幻覚（hallucination）を起こさないAIがある」と言われたら、「え、本当？」と思いませんか？実は2025年5月、Google DeepMindがそんな“夢のような”AIコーディングエージェント**Alpha...

“DeepResearch”は魔法の杖じゃない！だけど一緒に使うと最強になる理由

“DeepResearch”は魔法の杖じゃない！だけど一緒に使うと最強になる理由

2025年05月16日

こんにちは。突然ですが、みなさんは「リサーチ作業って地味だし時間もかかる……でも、ここをテキパキこなせたら人生変わりそう！」と思ったことはありませんか？　そんな悩める私たちに注目の新機能が登場しました。それが2025年に各社がこぞって実装しはじめた**DeepResearch（ディープリサーチ）**...

キャラクターを動かそう！FramePack×LoRAで「見た目そのまま」の新モーション

キャラクターを動かそう！FramePack×LoRAで「見た目そのまま」の新モーション

2025年05月15日

突然ですが、大好きなキャラクターのイラストがあって、「この子に踊らせたい！でも絵柄や顔つきは変えたくない…」なんて思ったことありませんか？「いや、無茶でしょ？絵を動かしたら崩れるんじゃ…」と思いますよね？でも実は、今のAIツールならそれが意外とできてしまうんです。その名も**FramePack*...

LLMに長期記憶を持たせる最新技術: Mem0/Mem0g と Sleep-Time Compute

LLMに長期記憶を持たせる最新技術: Mem0/Mem0g と Sleep-Time Compute

2025年05月13日

## AIは記憶を得ることができるのか、エンジニア界を熱くしている話どうもこんにちは。突然ですが、皆さんは「AIさん、あなた前の会話すっかり忘れてるじゃん……」ってツッコミたくなる瞬間、ありませんか？せっかく大規模言語モデル（LLM）と仲良くなってきたのに、次のセッションでは「えっ、あなた誰でし...

SLM⇔LLMハイブリッド運用──ローカルAIとクラウドを自動ルーティング

SLM⇔LLMハイブリッド運用──ローカルAIとクラウドを自動ルーティング

2025年05月03日

こんにちは、皆さん。今日はちょっと不思議で面白いテーマを扱います。題して「SLMとLLMのハイブリッド推論」。名前からしてムズかしそうな空気が漂っていますよね？でも大丈夫です。今回は、このハイブリッド推論ってやつを分かりやすく解説しながら、「なるほど、意外と使えるじゃん？」と思っていただけるように...

GLOM理論とアナロジー思考AIの最新動向

GLOM理論とアナロジー思考AIの最新動向

2025年05月02日

こんにちは、皆さん。今日は「GLOM（グロム）理論」っていう、ちょっと名前からして神秘のモンスター感漂うAIトピックについて語りたいと思います。しかも、そこに「アナロジー推論（類推でモノを考えるAI）」が絡んでくると聞いたら、もう目が離せないですよね？いや、私も最初に「GLOM」って単語を目にした...

DPO、PPO、RLAIF…こんがらがった略語の超やさしいまとめ - 強化学習型ファインチューニング基礎

DPO、PPO、RLAIF…こんがらがった略語の超やさしいまとめ - 強化学習型ファインチューニング基礎

2025年05月01日

こんにちは、皆さん。今日のテーマは「強化学習型ファインチューニング（RFT）」です。なんだか小難しい響きですが、要するに「大規模言語モデルを、私たち人間の好みに合わせて従順にしていこう」という技術のお話。最近ではChatGPTをはじめ、スマホやPCから会話できるAIがぐんぐん活躍していますよね？ ...

NVIDIA Dynamoって何？ジェネレーティブAI推論が30倍速くなる！？

NVIDIA Dynamoって何？ジェネレーティブAI推論が30倍速くなる！？

2025年04月29日

皆さん、ChatGPTみたいなAIの返答を待っていて「遅いなぁ…」とヤキモキした経験、ありませんか？実は舞台裏では、GPUが全力を出し切れておらず**利用率が10～15%程度**に留まっていることも多く、計算資源が大幅に余っているのです。そのうえ入力が長くなるとメモリが逼迫し、キャッシュが行ったり来...

プロンプトエンジニアリング超実践：“プロンプト・パイプライン”のベストプラクティス

プロンプトエンジニアリング超実践：“プロンプト・パイプライン”のベストプラクティス

2025年04月26日

### はじめに突然ですが、皆さんは「AIに指示を出してみたら、思ってたのと全然違う答えが返ってきた…」なんて経験、ありませんか？たとえば一行だけバーン！と書いて「めちゃくちゃ賢いAIなんだから分かるでしょ？」と期待したのに、返ってきた内容が微妙すぎてガッカリしたとか。実は私もよくやってしまい...

AIによる自動デバッグ高精度化の最新動向（2025年3月以降）

AIによる自動デバッグ高精度化の最新動向（2025年3月以降）

2025年04月25日

## はじめに：バグ修正、そこまでAIに任せて大丈夫？いやもう、AIエンジニアの皆さんならご存じかもしれませんが、最近のソフトウェア開発現場って「LLMがコード書いてくれる！」「AIがバグ修正してくれる！」という夢のような話があちこちで聞こえてきますよね。わたしも最初は「すごっ、もしかして人間はつ...

RAGの進化とGraph RAG：ドキュメント検索を超えた“知識グラフ”活用

RAGの進化とGraph RAG：ドキュメント検索を超えた“知識グラフ”活用

2025年04月24日

--- ## はじめに：RAGがここまで来ちゃったんだよね、という話みなさん、AIまわりの話題を聞くたびに「なんか毎日どこかが新しいモデルを出してる…ついていくの大変…」と思ったことありませんか？私はあります。むしろそれが当たり前すぎて、“朝起きて歯磨きする”レベルの日常行為と化しています。で...

Prompt Injection最前線 ―「DEF CON 32 Generative Red‑Team Challenge」勝ち残りプロンプト & 防御策まとめ

Prompt Injection最前線 ―「DEF CON 32 Generative Red‑Team Challenge」勝ち残りプロンプト & 防御策まとめ

2025年04月23日

--- こんにちは、今回は**2024年8月に開催された世界最大級のハッキング会議・DEF CON 32**で、AI関係者を熱くさせたイベント、Generative Red-Team Challenge (GRT-2) のお話をしていきます。いやもうこれ、AIエンジニアにはたまらない祭りですよね？ ...

RESTful通信ゲームの不正防止ガイド: サーバーサイド設計のベストプラクティス

RESTful通信ゲームの不正防止ガイド: サーバーサイド設計のベストプラクティス

2025年04月22日

ゲームの開発者のみなさん、こんにちは。今回は**ポイント改ざん**や**アイテム複製**など、プレイヤーによる不正行為を防ぐためのサーバーサイド設計についてお話しします。オンラインゲームでは、通信の仕組みを悪用してズルをしようとする強者(?)が必ず現れます。そこで本記事では、初心者サーバーエンジニア...

「新モデル祭り」の裏側―o3＆o4-miniを試して分かったけど…使えるのは結局“o1-pro”だった件

「新モデル祭り」の裏側―o3＆o4-miniを試して分かったけど…使えるのは結局“o1-pro”だった件

2025年04月18日

**巷では ChatGPT o3 / o4-mini 出たすげえで、驚き屋が仕事に励んでおりますが**、実際のところ、「え、それ使えるの？」「いや、なんか抽象的でビミョーじゃない？」とモヤモヤしている方も多いのではないでしょうか。そりゃあ新しいモデルが出るとワクワクしますよね。私も最初は「お、次世代...

AIエージェント長期記憶最前線

AIエージェント長期記憶最前線

2025年04月17日

--- ## はじめに – 「毎回記憶喪失になるAI」ってどうなの？「AIエージェントに長期記憶が必要だ」って言われると、最初に思いつきませんか？「いや、AIって全部わかってるんじゃないの？」って。私もそう思ってました。でも実際にLLM（大規模言語モデル）のエージェントを使い倒してみると、意...

LLMは騙されやすい？新世代のプロンプト防御、StruQとSecAlignを徹底解説

LLMは騙されやすい？新世代のプロンプト防御、StruQとSecAlignを徹底解説

2025年04月16日

## はじめに皆さん、LLM（大規模言語モデル）の活用がむちゃくちゃ盛り上がっている今、セキュリティ対策は大丈夫ですか？「AIと会話するのにセキュリティも何もないでしょ？」なんて思うかもしれませんが、そこに落とし穴があります。最近問題となっている**プロンプトインジェクション**は、LLMに仕...

この業務、OR-Toolsで解けるじゃん！ – 最適化ツール入門

この業務、OR-Toolsで解けるじゃん！ – 最適化ツール入門

2025年04月14日

## スケジュール調整地獄からの脱出突然ですが、**「明日のシフト、どう埋めよう…」と頭を抱えた夜はありませんか？あるいは納期直前にルート配送計画**をエクセルで組んでは、無情にもトラックの積載オーバーに気づく――なんて経験はあまりないか…。機械学習モデルを回すのとは別次元の“現場のパズル”に直...

「Google ADK」と「Agent2Agent (A2A)」ってなんですか？

「Google ADK」と「Agent2Agent (A2A)」ってなんですか？

2025年04月11日

皆さん、AIエージェント開発って聞いてワクワクしませんか？「いやいや、興味はあるけど、どこから手をつけるんだよ……」と、頭をかかえていませんか？かく言う私も、最近「AIエージェント同士が自律的に連携してゴリゴリ仕事を進めてくれる」なんて話を聞き始めて、「え、ウチの家事とかも勝手にやってくれるの？...

AIコーディング最前線：便利なAIと“上手に付き合う”ためのコツ

AIコーディング最前線：便利なAIと“上手に付き合う”ためのコツ

2025年04月10日

## はじめに：AIエンジニアの夢と現実 2025年のソフトウェア開発現場では、「AIがコードを書いてくれる」のは、もはや誰もが知っている事実です。AIアシスタントに一言頼めば、ボイラープレートやテストコードがするすると生成される。時には未知の言語やフレームワークでも、AIがガイド役を担ってくれる。...

LLM性能評価と信頼性向上の最新トレンド

LLM性能評価と信頼性向上の最新トレンド

2025年04月09日

こんにちは、AIエンジニアの皆さん！今日は**大規模言語モデル（LLM）の性能評価と信頼性向上**に関する2025年4月時点の最新トレンドをまとめてご紹介します。モデルが賢くなればなるほど「本当にちゃんと考えてるの？」「変なこと企んでない？」と心配になりますよね（え、私だけ？）。そこで、本記事ではチ...

Microsoft Playwright MCPをCursorで活用する実用ガイド

Microsoft Playwright MCPをCursorで活用する実用ガイド

2025年04月03日

## Playwright MCPとCursorの概要まずは「Playwright MCPって何なんだ？」という話ですよね。Playwright MCPとは、LLMベースのAIエージェントがブラウザを操作できるようにするための“プロトコルサーバー”です。もうちょっと噛み砕くと、AIが出したコマンド...

AI コーディングを MCP でBoostしてみよう ~Cursorで使える便利なMCPのまとめ~

AI コーディングを MCP でBoostしてみよう ~Cursorで使える便利なMCPのまとめ~

2025年04月03日

--- 皆さんは、普段プログラム開発を行うときにどのようなツールを使っていますでしょうか。最近ではGitHub CopilotをはじめとしたAIコード生成ツールが身近になり、IDEにLLM（大規模言語モデル）を接続してコード補完や自動修正をしているエンジニアの方も多いのではないでしょうか。こうした「...

最近目にする「Vibe Coding」解説~ AIを活用した新しいプログラミング手法 ~

最近目にする「Vibe Coding」解説~ AIを活用した新しいプログラミング手法 ~

2025年04月02日

以下に、先ほどのレポート本文から参考文献の表記を取り除き、文章のつながりを滑らかにしたバージョンを掲載します。構成や内容は変えず、参考文献番号や引用記号を削除したのみです。 --- ## Vibe Codingとは何か：定義・起源・背景 **Vibe Coding（バイブコーディング）**とは、AI...

大規模言語モデルの「思考」を追跡する – Anthropic最新研究ー原文英語だから翻訳と解説

大規模言語モデルの「思考」を追跡する – Anthropic最新研究ー原文英語だから翻訳と解説

2025年04月01日

2025年3月27日、AI企業Anthropic社はブログ記事「[Tracing the thoughts of a large language model](https://www.anthropic.com/news/tracing-thoughts-language-model)」を公開し、...

建築設計業務のAI活用による効率化 (2024-2025年4月)

建築設計業務のAI活用による効率化 (2024-2025年4月)

2025年04月01日

近年、生成AIや大規模言語モデル（LLM）をはじめとするAI技術の進歩が、建築設計のプロセスを大きく変えています。特に2024年以降、多数の設計事務所が試験導入を経て本格的にAIツールを業務フローへ取り込み始めました。**Geo Week News (2024)** のレポートによると、2024年の...

ディープリサーチ検証 Genspark VS ChatGPT VS Perplexity

ディープリサーチ検証 Genspark VS ChatGPT VS Perplexity

2025年03月31日

## はじめに：AI検索ツールで欲しいファイラー探しに挑戦日々の経費管理でたまっていく紙の領収書…。IT系ビジネスマンである私（仮称）は、これら領収書をスマートに整理できる**物理的なファイラー**（紙の領収書を収納・管理する文具）を探すことにしました。ところが、インターネット検索では広告や情報の...

Figma to HTML – Anima Appを使ってHTMLコーディングしてみた

Figma to HTML – Anima Appを使ってHTMLコーディングしてみた

2025年03月24日

## 導入: FigmaからHTMLコーディングへ近年、デザインツールの**Figma**で作成したデザインを自動でHTML/CSSに変換する「Figma to HTML」ツールが注目されています。デザイナーが作成したUIをそのままコード化できれば、開発者が一からHTML/CSSを書く手間を省け、...

FigmaデザインからHTML/CSSを自動生成してみた – Figma-Context-MCP

FigmaデザインからHTML/CSSを自動生成してみた – Figma-Context-MCP

2025年03月24日

前回 Animaを利用した Figma to HTML を試しましたが、今回 Cursor などのAIを利用し Figma のデザインからコードを生成できるという**Figma-Context-MCP**を試してみました。これはオープンソースのツールで、AIコーディングアシスタントの**Curso...

私が実際に使ってみた「Figma to HTML」変換サービス比較レポート（2025年3月時点）

私が実際に使ってみた「Figma to HTML」変換サービス比較レポート（2025年3月時点）

2025年03月20日

以下は、**私が実際にFigmaのデザインデータを使って複数の「Figma to HTML変換サービス」を検証し、その結果をまとめたレポート記事**です。利用者目線、かつ業務での実践を想定しながら調べた内容ですので、「コーディングを効率化したい」「どのサービスが本番運用向きか知りたい」という方の参考...

最近よく目にする MCP（Model Context Protocol）を理解してみる

最近よく目にする MCP（Model Context Protocol）を理解してみる

2025年03月17日

--- ## MCP（Model Context Protocol）とは MCP（Model Context Protocol、モデル・コンテキスト・プロトコル）は、AIモデル（主に大規模言語モデル、LLM）と外部のデータソースやツールを標準化された方法で接続するためのオープンプロトコルです。簡単に...

2025年最新の実用的Figma-to-HTMLツール徹底比較

2025年最新の実用的Figma-to-HTMLツール徹底比較

2025年03月13日

2025年3月時点で、Figmaのデザインを自動的にHTMLコードに変換するツールは多数登場しています。ここでは、最近新しく登場・アップデートされたツールを中心に、デザイン再現性・レスポンシブ対応・コード品質などの観点で比較しながら解説します。結論を先に言うと、**「完全に綺麗なHTMLが一発で出る...

CAMEL と OpenManus の比較: 目的・用途の違いと使い分け

CAMEL と OpenManus の比較: 目的・用途の違いと使い分け

2025年03月11日

--- ## AIエージェントとは何かまず前提として、AIエージェントは「与えられた目標やタスクを自律的に実行するプログラム」です。一般的には、大規模言語モデル（GPTなど）の自然言語処理能力を組み合わせ、指示を理解し、追加の情報収集や思考プロセスを経て最適解を出そうとします。 - **自律的な思...

いま話題の「OpenManus」って何？〜マルチエージェントがもたらす新しいAIの可能性

いま話題の「OpenManus」って何？〜マルチエージェントがもたらす新しいAIの可能性

2025年03月10日

こんにちは、今回はいま開発者界隈で話題のオープンソースAI「OpenManus」についてご紹介します。 [https://github.com/mannaandpoem/OpenManus](https://github.com/mannaandpoem/OpenManus) 「なんかすごそうだけど...

最終更新: 2025年06月09日 05:16:24

記事数: 46件