ブログ記事一覧

最新の記事から順番に表示しています

最新ローカルマルチモーダルモデル Gemma 3・MedGemma・MMaDA・Janus – コア技術と活用術

最新ローカルマルチモーダルモデル Gemma 3・MedGemma・MMaDA・Janus – コア技術と活用術

2025年06月06日
2025年、あなたの開発環境に、ただコードを処理するだけではないAIが常駐する時代が本格的に到来しました。もしAIが、あなたが提示したUIデザイン案を“見て”改善点を提案し、その意図を“汲み取って”新しいコンポーネントを“生成”してくれたら…?これはもう夢物語ではありません。マルチモーダルAIは、テ...
生成AI狂騒曲:2025年6月、開発世界は変わる? AIエンジニアに贈る最新動向と生存戦略

生成AI狂騒曲:2025年6月、開発世界は変わる? AIエンジニアに贈る最新動向と生存戦略

2025年06月05日
「また新しいモデルか…」「このツール、本当に使えるの?」 2025年6月、AIの進化はまるで光速。我々AIエンジニアの日々は、新しい技術の波に乗りこなし、時に溺れそうになりながらも、その可能性に胸を躍らせる…そんなエキサイティングな冒険の連続ではないでしょうか。巷では「AIが仕事を奪う」なんて囁かれ...
Netflixの推薦モデル「FM-Intent」:階層的マルチタスク学習が切り拓く次世代レコメンデーション

Netflixの推薦モデル「FM-Intent」:階層的マルチタスク学習が切り拓く次世代レコメンデーション

2025年05月30日
## ユーザーの「いま欲しいもの」をどう読む? Netflixといえば、世界中の視聴データを基にハイレベルなパーソナライズを実現してきた映像ストリーミングの巨人です。でも、そんな巨人にも課題はありました。「とりあえずコメディが好きっぽいからコメディを並べとけばいい、ってわけじゃないんだよな…」と悩む...
教育系AIエージェント開発のための音声対話プラットフォーム総まとめ

教育系AIエージェント開発のための音声対話プラットフォーム総まとめ

2025年05月30日
こんにちは、エンジニアの皆さん。**「音声対応AIエージェントを作りたいけど、STT(音声認識)やTTS(音声合成)、LLMとの連携、さらに対話管理まで、どれをどう組み合わせればいいの?」と迷子になったりしていませんか? 実は最近、こうした「音声会話のすべて」を統合するSDKやフレームワークが、一気...
マルチエージェントAIが本格化──最新動向を徹底解剖

マルチエージェントAIが本格化──最新動向を徹底解剖

2025年05月28日
「ねえ、そろそろ“単独のAIエージェント”に任せっきりは限界なんじゃないか?」**2025年の今、こうした声が大企業のIT部門やスタートアップの開発現場でささやかれ始めています。なぜなら、ひとつのLLMエージェントですべてをこなそうとすると、どうしても扱えるタスクの幅に制約が出るし、なにより“専門性...
Figma MCP と Cursor を活用したデザイン修正――AIでどこまで作業を効率化できるのか

Figma MCP と Cursor を活用したデザイン修正――AIでどこまで作業を効率化できるのか

2025年05月27日
### はじめに 近年、デザインからコーディングまでを一気通貫で支援してくれるAIツールが増えています。FigmaやSketchのプラグインとして動くコード生成ツールや、ソースコードを自動補完するAIエディタなど、選択肢は数多く存在します。**本記事では、筆者が実際の案件で「Figma MCP」と「...
“DeepResearch”は魔法の杖じゃない! だけど一緒に使うと最強になる理由

“DeepResearch”は魔法の杖じゃない! だけど一緒に使うと最強になる理由

2025年05月16日
こんにちは。突然ですが、みなさんは「リサーチ作業って地味だし時間もかかる……でも、ここをテキパキこなせたら人生変わりそう!」と思ったことはありませんか? そんな悩める私たちに注目の新機能が登場しました。それが2025年に各社がこぞって実装しはじめた**DeepResearch(ディープリサーチ)**...
キャラクターを動かそう!FramePack×LoRAで「見た目そのまま」の新モーション

キャラクターを動かそう!FramePack×LoRAで「見た目そのまま」の新モーション

2025年05月15日
突然ですが、大好きなキャラクターのイラストがあって、「この子に踊らせたい!でも絵柄や顔つきは変えたくない…」なんて思ったことありませんか? 「いや、無茶でしょ?絵を動かしたら崩れるんじゃ…」と思いますよね?でも実は、今のAIツールならそれが意外とできてしまうんです。 その名も**FramePack*...
LLMに長期記憶を持たせる最新技術: Mem0/Mem0g と Sleep-Time Compute

LLMに長期記憶を持たせる最新技術: Mem0/Mem0g と Sleep-Time Compute

2025年05月13日
## AIは記憶を得ることができるのか、エンジニア界を熱くしている話 どうもこんにちは。突然ですが、皆さんは「AIさん、あなた前の会話すっかり忘れてるじゃん……」ってツッコミたくなる瞬間、ありませんか? せっかく大規模言語モデル(LLM)と仲良くなってきたのに、次のセッションでは「えっ、あなた誰でし...
SLM⇔LLMハイブリッド運用──ローカルAIとクラウドを自動ルーティング

SLM⇔LLMハイブリッド運用──ローカルAIとクラウドを自動ルーティング

2025年05月03日
こんにちは、皆さん。今日はちょっと不思議で面白いテーマを扱います。題して「SLMとLLMのハイブリッド推論」。名前からしてムズかしそうな空気が漂っていますよね? でも大丈夫です。今回は、このハイブリッド推論ってやつを分かりやすく解説しながら、「なるほど、意外と使えるじゃん?」と思っていただけるように...
DPO、PPO、RLAIF…こんがらがった略語の超やさしいまとめ - 強化学習型ファインチューニング基礎

DPO、PPO、RLAIF…こんがらがった略語の超やさしいまとめ - 強化学習型ファインチューニング基礎

2025年05月01日
こんにちは、皆さん。今日のテーマは「強化学習型ファインチューニング(RFT)」です。なんだか小難しい響きですが、要するに「大規模言語モデルを、私たち人間の好みに合わせて従順にしていこう」という技術のお話。 最近ではChatGPTをはじめ、スマホやPCから会話できるAIがぐんぐん活躍していますよね? ...
NVIDIA Dynamoって何?ジェネレーティブAI推論が30倍速くなる!?

NVIDIA Dynamoって何?ジェネレーティブAI推論が30倍速くなる!?

2025年04月29日
皆さん、ChatGPTみたいなAIの返答を待っていて「遅いなぁ…」とヤキモキした経験、ありませんか?実は舞台裏では、GPUが全力を出し切れておらず**利用率が10~15%程度**に留まっていることも多く、計算資源が大幅に余っているのです。そのうえ入力が長くなるとメモリが逼迫し、キャッシュが行ったり来...
プロンプトエンジニアリング超実践:“プロンプト・パイプライン”のベストプラクティス

プロンプトエンジニアリング超実践:“プロンプト・パイプライン”のベストプラクティス

2025年04月26日
### はじめに 突然ですが、皆さんは「AIに指示を出してみたら、思ってたのと全然違う答えが返ってきた…」なんて経験、ありませんか? たとえば一行だけバーン! と書いて「めちゃくちゃ賢いAIなんだから分かるでしょ?」と期待したのに、返ってきた内容が微妙すぎてガッカリしたとか。実は私もよくやってしまい...
AIによる自動デバッグ高精度化の最新動向(2025年3月以降)

AIによる自動デバッグ高精度化の最新動向(2025年3月以降)

2025年04月25日
## はじめに:バグ修正、そこまでAIに任せて大丈夫? いやもう、AIエンジニアの皆さんならご存じかもしれませんが、最近のソフトウェア開発現場って「LLMがコード書いてくれる!」「AIがバグ修正してくれる!」という夢のような話があちこちで聞こえてきますよね。わたしも最初は「すごっ、もしかして人間はつ...
RAGの進化とGraph RAG:ドキュメント検索を超えた“知識グラフ”活用

RAGの進化とGraph RAG:ドキュメント検索を超えた“知識グラフ”活用

2025年04月24日
--- ## はじめに:RAGがここまで来ちゃったんだよね、という話 みなさん、AIまわりの話題を聞くたびに「なんか毎日どこかが新しいモデルを出してる…ついていくの大変…」と思ったことありませんか? 私はあります。むしろそれが当たり前すぎて、“朝起きて歯磨きする”レベルの日常行為と化しています。 で...
RESTful通信ゲームの不正防止ガイド: サーバーサイド設計のベストプラクティス

RESTful通信ゲームの不正防止ガイド: サーバーサイド設計のベストプラクティス

2025年04月22日
ゲームの開発者のみなさん、こんにちは。今回は**ポイント改ざん**や**アイテム複製**など、プレイヤーによる不正行為を防ぐためのサーバーサイド設計についてお話しします。オンラインゲームでは、通信の仕組みを悪用してズルをしようとする強者(?)が必ず現れます。そこで本記事では、初心者サーバーエンジニア...
「新モデル祭り」の裏側―o3&o4-miniを試して分かったけど…使えるのは結局“o1-pro”だった件

「新モデル祭り」の裏側―o3&o4-miniを試して分かったけど…使えるのは結局“o1-pro”だった件

2025年04月18日
**巷では ChatGPT o3 / o4-mini 出たすげえで、驚き屋が仕事に励んでおりますが**、実際のところ、「え、それ使えるの?」「いや、なんか抽象的でビミョーじゃない?」とモヤモヤしている方も多いのではないでしょうか。そりゃあ新しいモデルが出るとワクワクしますよね。私も最初は「お、次世代...
LLMは騙されやすい? 新世代のプロンプト防御、StruQとSecAlignを徹底解説

LLMは騙されやすい? 新世代のプロンプト防御、StruQとSecAlignを徹底解説

2025年04月16日
## はじめに 皆さん、LLM(大規模言語モデル)の活用がむちゃくちゃ盛り上がっている今、セキュリティ対策は大丈夫ですか? 「AIと会話するのにセキュリティも何もないでしょ?」なんて思うかもしれませんが、そこに落とし穴があります。 最近問題となっている**プロンプトインジェクション**は、LLMに仕...
この業務、OR-Toolsで解けるじゃん! – 最適化ツール入門

この業務、OR-Toolsで解けるじゃん! – 最適化ツール入門

2025年04月14日
## スケジュール調整地獄からの脱出 突然ですが、**「明日のシフト、どう埋めよう…」と頭を抱えた夜はありませんか? あるいは納期直前にルート配送計画**をエクセルで組んでは、無情にもトラックの積載オーバーに気づく――なんて経験はあまりないか…。機械学習モデルを回すのとは別次元の“現場のパズル”に直...
「Google ADK」と「Agent2Agent (A2A)」ってなんですか?

「Google ADK」と「Agent2Agent (A2A)」ってなんですか?

2025年04月11日
皆さん、AIエージェント開発って聞いてワクワクしませんか? 「いやいや、興味はあるけど、どこから手をつけるんだよ……」と、頭をかかえていませんか? かく言う私も、最近「AIエージェント同士が自律的に連携してゴリゴリ仕事を進めてくれる」なんて話を聞き始めて、「え、ウチの家事とかも勝手にやってくれるの?...
AIコーディング最前線:便利なAIと“上手に付き合う”ためのコツ

AIコーディング最前線:便利なAIと“上手に付き合う”ためのコツ

2025年04月10日
## はじめに:AIエンジニアの夢と現実 2025年のソフトウェア開発現場では、「AIがコードを書いてくれる」のは、もはや誰もが知っている事実です。AIアシスタントに一言頼めば、ボイラープレートやテストコードがするすると生成される。時には未知の言語やフレームワークでも、AIがガイド役を担ってくれる。...
AI コーディングを MCP でBoostしてみよう ~Cursorで使える便利なMCPのまとめ~

AI コーディングを MCP でBoostしてみよう ~Cursorで使える便利なMCPのまとめ~

2025年04月03日
--- 皆さんは、普段プログラム開発を行うときにどのようなツールを使っていますでしょうか。最近ではGitHub CopilotをはじめとしたAIコード生成ツールが身近になり、IDEにLLM(大規模言語モデル)を接続してコード補完や自動修正をしているエンジニアの方も多いのではないでしょうか。こうした「...
ディープリサーチ検証 Genspark VS ChatGPT VS Perplexity

ディープリサーチ検証 Genspark VS ChatGPT VS Perplexity

2025年03月31日
## はじめに:AI検索ツールで欲しいファイラー探しに挑戦 日々の経費管理でたまっていく紙の領収書…。IT系ビジネスマンである私(仮称)は、これら領収書をスマートに整理できる**物理的なファイラー**(紙の領収書を収納・管理する文具)を探すことにしました。ところが、インターネット検索では広告や情報の...
私が実際に使ってみた「Figma to HTML」変換サービス比較レポート(2025年3月時点)

私が実際に使ってみた「Figma to HTML」変換サービス比較レポート(2025年3月時点)

2025年03月20日
以下は、**私が実際にFigmaのデザインデータを使って複数の「Figma to HTML変換サービス」を検証し、その結果をまとめたレポート記事**です。利用者目線、かつ業務での実践を想定しながら調べた内容ですので、「コーディングを効率化したい」「どのサービスが本番運用向きか知りたい」という方の参考...
CAMEL と OpenManus の比較: 目的・用途の違いと使い分け

CAMEL と OpenManus の比較: 目的・用途の違いと使い分け

2025年03月11日
--- ## AIエージェントとは何か まず前提として、AIエージェントは「与えられた目標やタスクを自律的に実行するプログラム」です。一般的には、大規模言語モデル(GPTなど)の自然言語処理能力を組み合わせ、指示を理解し、追加の情報収集や思考プロセスを経て最適解を出そうとします。 - **自律的な思...

最終更新: 2025年06月09日 05:16:24

記事数: 46件