Generative Agents Tech Blog

https://blog.generative-agents.co.jp/

Generative Agents Tech Blog

フィード

記事のアイキャッチ画像
「AIエージェントキャッチアップ #56 - LangWatch」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #56 - LangWatch」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com LangWatch 今回は、プロンプト最適化機能も持つLLM Opsプラットフォーム「LangWatch」をキャッチアップしました。 LangWatchのGitHubリポジトリはこちらです。 github.com 公式ドキュメントはこちらです。 docs.langwatch.ai 今回のポイント LangWatchとは LangWatch…
43分前
記事のアイキャッチ画像
OpenAI DevDayに参加しました
Generative Agents Tech Blog
吉田真吾(@yoshidashingo)です。 今年10月に2年ぶりにOpenAI DevDayが開催されました。わたしはGenerative Agents社の仲間とともにSan Franciscoの現地で参加してきました。 openai.com 新リリースが続々 DevDayの前にリリースされたものも含めて、キーノートでSam Altmanが新リリースを発表しました。概要をざっと以下にまとめます。 www.youtube.com 1. Apps in ChatGPT すでに競争力のあるサービス向けに、そのサービスをChatGPTのチャット内で利用可能にするApps in ChatGPTが発表…
6時間前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #55 - Agent Lightning」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #55 - Agent Lightning」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Agent Lightning 今回は、AIエージェントを育成する「Agent Lightning」をキャッチアップしました。 Agent LightningのGitHubリポジトリはこちらです。 github.com 今回のポイント Agent Lightningとは Agent Lightningは、マイクロソフトが開発し…
6日前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #54 - Agentic Commerce Protocol」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #54 - Agentic Commerce Protocol」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Agentic Commerce Protocol 今回は、ChatGPTの商品購入機能で使われている「Agentic Commerce Protocol」をキャッチアップしました。 Agentic Commerce ProtocolのGitHubリポジトリはこちらです。 github.com 今回のポイン…
11日前
記事のアイキャッチ画像
OpenAIのStructured OutputsをStreamingで実行してJSONをパースし続けたいときの対応方法
Generative Agents Tech Blog
OpenAIのStructured OutputsはStreamingで実行できます。 しかし、Streamingの途中では、LLMの生成したテキストは{"や{"nameなど、JSONとして不正な形式となります。 このような文字列をJSONとして扱えるように修正してパースし続けたい場合の対応方法をまとめます。 ※この記事は、OpenAIのStructured Outputsを使う場合のみが対象です。他のプロバイダのモデルやStructured Outputs以外の構造化出力方法を使う場合は、この記事の内容とは異なる対応が必要な場合があります。 client.chat.completions.s…
18日前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #53 - Claude Agent SDK」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #53 - Claude Agent SDK」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Claude Agent SDK 今回は、Claude Code上で強力なエージェントを構築するためのツールコレクション「Claude Agent SDK」をキャッチアップしました。 Claude Agent SDKのGitHubリポジトリはこちらです。 github.com 今回のポイント Claude Agent SDK…
21日前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #52 - Agent Payments Protocol(AP2)」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #52 - Agent Payments Protocol(AP2)」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Agent Payments Protocol(AP2) 今回は、エージェントエコノミーのためのオープンプロトコル「Agent Payments Protocol(AP2)」をキャッチアップしました。 AP2のGitHubリポジトリはこちらです。 github.com 今回のポイント Agent Pa…
25日前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #51 - opencode」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #51 - opencode」という勉強会を開催しました。 https://generative-agents.connpass.com/event/370374/generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com opencode 今回は、OSSのCLI型コーディングエージェント「opencode」をキャッチアップしました。 opencodeのGitHubリポジトリはこちらです。 github.com 今回のポイント opencodeとは open…
1ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #50 - MCP Registry」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #50 - MCP Registry」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com MCP Registry 今回は、App StoreのようにMCPサーバーを提供する仕組み「MCP Registry」をキャッチアップしました。 MCP RegistryのGitHubリポジトリはこちらです。 github.com 今回のポイント MCP Registryとは MCP RegistryのGitHubリポジトリは、以下…
2ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #49 - Byterover Cipher」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #49 - Byterover Cipher」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Byterover Cipher 今回は、コーディングエージェント向けのメモリーレイヤー「Byterover Cipher」をキャッチアップしました。 CipherのGitHubリポジトリはこちらです。 github.com 公式ドキュメントはこちらです。 docs.byterover.dev 今回のポイント Byterov…
2ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #48 - Vibe Kanban」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #48 - Vibe Kanban」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Vibe Kanban 今回は、コーディングエージェントへの作業依頼を効率化する「Vibe Kanban」をキャッチアップしました。 Vibe KanbanのGitHubリポジトリはこちらです。 github.com 公式ドキュメントはこちらです。 www.vibekanban.com 今回のポイント Vibe Kanbanとは Vi…
2ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #47 - Deep Agents (LangChain)」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #47 - Deep Agents (LangChain)」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Deep Agents 今回は、よく使われているAIエージェントの構成を汎用化した、LangChainの「Deep Agents」をキャッチアップしました。 Deep AgentsのGitHubリポジトリはこちらです。 github.com LangChain公式ブログの記事はこちらです。 blog.langc…
2ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #46 - DSPy v3」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #46 - DSPy v3」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com DSPy v3 今回は、先日v3がリリースされた、プロンプト最適化の「DSPy」をキャッチアップしました。 DSPyのGitHubリポジトリはこちらです。 github.com 公式ドキュメントはこちらです。 dspy.ai 今回のポイント DSPy v3とは DSPyはDeclarative Self-improving Python(宣言…
3ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #45 - Serena」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #45 - Serena」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Serena 今回は、コーディングエージェントツールキットの「Serena」をキャッチアップしました。 SerenaのGitHubリポジトリはこちらです。 github.com 今回のポイント Serenaとは Serenaは、LLMをコーディングエージェントにするためのツールキットです。 Serenaでは、コーディングエージェントに必要なツー…
3ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #44 - Strands Agents」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #44 - Strands Agents」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Strands Agents 今回は、AWS製のフレームワーク「Strands Agents」をキャッチアップしました。 Strands Agentsの公式Webサイトはこちらです。 strandsagents.com GitHubリポジトリはこちらです。 github.com 今回のポイント Strands Agentsとは …
3ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #43 - BrowserGym」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #43 - BrowserGym」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com BrowserGym 今回は、Webエージェント研究のためのフレームワーク「BrowserGym」をキャッチアップしました。 BrowserGymのGitHubリポジトリはこちらです。 github.com 今回のポイント BrowserGymとは BrowserGymは、Webエージェントの研究を加速するための、オープンで使いやすく拡…
3ヶ月前
記事のアイキャッチ画像
Mistral AIのスピーチアンダースタンディングモデル「Voxtral-Mini-3B」の日本語認識能力を検証してみた
Generative Agents Tech Blog
ジェネラティブエージェンツの西見です。 2025年7月にMistral AIからスピーチアンダースタンディングモデル(speech understanding model)「Voxtral-Mini-3B」がリリースされました。「Introducing the world's best (and open) speech recognition models!」ということでしたが、公式ページで日本語の性能に関する言及がなかったので、本記事ではVoxtralとOpenAIのWhisperを比較検証してみたいと思います。また、macOSでVoxtralを実行する手順についても解説します。 Intr…
4ヶ月前
記事のアイキャッチ画像
Amazon Bedrock AgentCoreを一通りさわり倒してみる ~ Code Interpreter 編 ~
Generative Agents Tech Blog
ジェネラティブエージェンツの遠藤です。 先日発表されたAmazon Bedrock AgentCore、まさに「これ欲しかったやつ!!」の塊で、いろいろな機能を試すたびにテンションが爆上がりしています・・・! その勢いで始めた『一通りさわり倒してみる』シリーズ、今回はCode Interpreter編になります。 今までの『一通りさわり倒してみる』シリーズもぜひご覧下さい。 blog.generative-agents.co.jp blog.generative-agents.co.jp Code InterpreterはAgentCore built-in toolsと呼ばれる組み込みツール…
4ヶ月前
記事のアイキャッチ画像
拡散モデルによるコード生成モデル「Dream-Coder 7B」をmacOSで動かして他モデルと比較してみた
Generative Agents Tech Blog
ジェネラティブエージェンツの西見です。 Googleが発表した拡散モデルを利用した言語モデル「Gemini Diffusion」があまりにも爆速で動作していたのは記憶に新しいです。 deepmind.google そんな中、2025年7月15日に拡散モデルベースのオープンウェイトのLLMである「Dream-Coder」が公開されたのを見て、ローカルでどのぐらいの速度が出してくれるのかが気になり、検証してみました。 github.com Dream-Coderとは Dream-Coderは、香港大学NLPグループが開発した拡散モデルベースのコード生成LLMです。従来の自己回帰モデル(左から右への…
4ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #42 - GenAI Processors」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #42 - GenAI Processors」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com GenAI Processors 今回は、Google DeepMindが公開したAIパイプラインのPythonライブラリ「GenAI Processors」をキャッチアップしました。 github.com developers.googleblog.com 今回のポイント GenAI Processorsとは GenAI …
4ヶ月前
記事のアイキャッチ画像
仕様書とコードの「意味的な整合性」を検証するツール『Semcheck』の利用モデル別性能評価
Generative Agents Tech Blog
ジェネラティブエージェンツの西見です。 Claude Codeなどのコーディングエージェントを活用するためには、的確な指示だけでなく、エージェントが生成したコードの誤りを自律的に検知・修正する仕組みが重要となります。誤り検知には自動テストやLinterが有効ですが、本記事では、仕様書とコードの「意味的な整合性」を検証するツール「Semcheck」に着目し、その性能を複数のLLMで比較評価します。 Semcheckとは Semcheckは、LLMを利用して、仕様書(Markdown形式)とソースコード間の意味的な整合性を検証するGo言語製のツールです。構文やスタイルを対象とする従来の静的解析ツー…
4ヶ月前
記事のアイキャッチ画像
Amazon Bedrock AgentCoreを一通りさわり倒してみる ~ Memory編 ~
Generative Agents Tech Blog
ジェネラティブエージェンツの遠藤です。 Amazon Bedrock AgentCoreは、まさに「これ欲しかったやつ!!」の塊で、テンションが爆上がりしています・・・! そんな勢いで始めた『一通りさわり倒してみる』シリーズ、今回はAgentCore Memory編をお届けします。 前回はAgentCoreがいかに熱いかの感想と実際にAgentCore Runtimeを触ってみたまとめになっているので、ぜひそちらもご覧下さい。 blog.generative-agents.co.jp Memoryに関する第一印象としては「よくぞこの仕組みをマネージドにしてくれた!」という感じですね。 エージェ…
4ヶ月前
記事のアイキャッチ画像
Amazon Bedrock AgentCoreを一通りさわり倒してみる ~ 全体の感想とRuntime編 ~
Generative Agents Tech Blog
ジェネラティブエージェンツの遠藤です。 7月にジョインしたばかりなので初めましての方が多いと思いますが、今後ともよろしくお願いします! 発表されたばかりのAmazon Bedrock AgentCore (Preview)のドキュメントを一通り読んだところ、「これ欲しかったやつ!!」ってなってテンションが爆上がりしています。 勢いに任せて全部触ってまとめようと思ったのですが思ったより量が多いので、まずは全体の感想とAgentCore RuntimeでLangChainを動かしてみた所をまとめてみました。 aws.amazon.com ざっくりの感想として「遂にエージェントのためにAWSが本気で…
4ヶ月前
記事のアイキャッチ画像
Kimi K2をLLMエージェントで活用する場合の性能を検証してみた
Generative Agents Tech Blog
ジェネラティブエージェンツの西見です。 最近「Open Agentic Intelligence」としてリリースされたKimi K2が気になったので、LLMエージェントとして利用した場合にどうなるか試してみました。GPT-4.1(Azure OpenAI Service経由)とClaude Sonnet 4と一緒に動かして比較しています。 Kimi K2は、中国のMoonshot AI社が開発したLLMです。 moonshotai.github.io 検証内容 LLMをエージェントとして使うときに必要そうな5つのカテゴリーで25個のタスクを作って試しました。 カテゴリ タスク数 内容 ツール使…
4ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #41 - Awesome Claude Code」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #41 - Awesome Claude Code」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Awesome Claude Code 今回は、Claude Codeに関するOSSなどをキュレーションした「Awesome Claude Code」をキャッチアップしました。 Awesome Claude CodeのGitHubリポジトリはこちらです。 github.com 今回のポイント Awesome Claud…
4ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #40 - Motia」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #40 - Motia」という勉強会を開催しました。 https://generative-agents.connpass.com/event/361504/generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Motia 今回は、API・イベント・エージェント向けの統合的なバックエンドフレームワーク「Motia」をキャッチアップしました。 MotiaのGitHubリポジトリはこちらです。 github.com 今回のポイント Motiaとは Moti…
4ヶ月前
記事のアイキャッチ画像
『AIエージェント時代の標準規格 やさしいMCP入門』レビュー
Generative Agents Tech Blog
吉田真吾(@yoshidashingo)です。 著者のみのるんさんから一足先に書籍をいただきましたので、書籍のレビューをさせていただきます。 本書はAIエージェント時代の標準規格となったMCP(Model Context Protocol)について、できるかぎり平易にわかりやすく、かつ入門に必要な全般的な知識を端的に理解できる書籍になっています。 なぜMCPが必要なのか? [Chapter 1] AIエージェントが人間の業務を代替し自動化されるためには、人間がアクセスしているデータや情報リソースにAIエージェントも同様にアクセスする必要があります。この課題に対して、2024年11月にAnthr…
4ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #39 - OpenHands-Versa」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #39 - OpenHands-Versa」という勉強会を開催しました。 connpass.com アーカイブ動画はこちらです。 www.youtube.com OpenHands-Versa 今回は、マルチモーダルなブラウジング機能を持つコーディングエージェント「OpenHands-Versa」をキャッチアップしました。 OpenHands-VersaのGitHubリポジトリはこちらです。 github.com 今回のポイント OpenHands-Versaとは OpenHands-Versaは、OpenHandsをベ…
4ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #38 - Agentic Radar」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #38 - Agentic Radar」という勉強会を開催しました。 https://generative-agents.connpass.com/event/359939/generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Agentic Radar 今回は、Agentic Workflowのセキュリティスキャナー「Agentic Radar」を扱いました。 Agentic RadarのGitHubリポジトリはこちらです。 github.com 今…
4ヶ月前
記事のアイキャッチ画像
「AIエージェントキャッチアップ #37 - Container Use / Dagger」を開催しました
Generative Agents Tech Blog
ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #37 - Container Use / Dagger」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com Container Use / Dagger 今回は、コーディングエージェントにコンテナ環境を与える「Container Use」と、AIエージェントやCI/CDに活用可能なワークフローランタイム「Dagger」について触ってみました。 Container UseのGitHubリポジトリはこちらです。 githu…
5ヶ月前