Zennの「LLM」のフィード
フィード

フルスタックへの挑戦 - チャットボット開発
Zennの「LLM」のフィード
はじめにAIエンジニアを目指しているME_DE_AEです。元々は機械エンジニアとして、Excelで実験結果を眺める日々でした(設計もやっていました)。そんな私がPythonと出会い、機械学習を用いて「未来を予測する力」に魅了され、データエンジニアに転職。そこから資格取得などを通じて今度はAIと出会いました。そんな私がAIエンジニアとして初めてシステム開発にゼロから挑戦し、LLMを活用したチャットシステムを完成させるまでを共有します。異業種からAIエンジニアを目指す方や、最新技術を活用した開発のリアルを知りたい方の参考になれば嬉しいです。 初めてのITでのモノづくりAIの世界...
5時間前

Codex CLIなどで設計書ベースでAgenticな実装を支援するAGENTS.mdを作成しました
1

Zennの「LLM」のフィード
こんにちは、かがわ(@shinpr_p)です。Codex CLIが盛り上がっていますね。一時期はClaude Codeの一強かのように思われましたが、Codex CLIもものすごい勢いで進化をしています。注)本記事での“Codex CLI”は、旧Codexモデルとは別の、現在進化中の開発支援CLIを指しています私は以前、Codex CLIが出た当初に一度試していたのですが、その時はあまり恩恵を感じられませんでした。最近の盛り上がりを受けて改めて試してみましたが、当時と比べてモデルの性能もそうですがCLI自体の改善も加わり、通常開発利用に耐えうるものに進化しているなと感じました。私...
8時間前

技術記事のキャッチアップをPodcastから行うための技術
1

Zennの「LLM」のフィード
はじめにみなさんはテクノロジーのキャッチアップはどのように行っていますか?このたび、ラジオ形式で聴くことで日々の技術ニュースをキャッチアップできる機能をこのたび公開しました!前日のZennやhackernewsなどの人気ニュースを、「Webフロントエンド」「データベース」のように特定の職種やテーマごとに、Podcast形式で視聴することができます!https://x.com/adsholoko/status/1963377756622000178現時点では下記のテーマごとにPodcastを生成しております。WebフロントエンドWebバックエンドモバイル開発セキュリ...
11時間前

MCPとSnowflakeで始めるIaC ─ Terraform × GitHub Actionsの可能性
Zennの「LLM」のフィード
はじめにSnowflakeを利用する中で、ユーザーやロール、データベース、スキーマといったリソースをどのように管理していますか?コンソールやSQLクライアントから直接コマンドを実行しても、確かに同じことは実現できます。しかし、環境が増え、プロジェクトが横断し、関わるメンバーが多様になるにつれ、次のような課題に直面することは少なくありません。誰が・いつ・どのリソースを変更したのか追いづらい環境ごとの設定差分が増えて管理が煩雑になる再利用できるコード資産として残らず、毎回手作業が発生するこうした課題を解決する有力なアプローチがTerraformを用いた「Infrastru...
13時間前

Vibe codingをワンステップ引き上げる"Dry-run"について
Zennの「LLM」のフィード
!検証して明確なエビデンスは取れてないのですが多少良さそうなので、諦めて一旦記事にします まとめLLMが持つシミュレート能力を活かして「想定実行」するプロジェクト理解に関してのコンテキストが足りているかどうかが人間で判断しやすくなる出力はPlanをシミュレートしたTraceとして出してもらう "Dry-run"はどのようなものか計画を実行する代わりにコードの実際の修正前に以下のPromptで「想定実行」すること。hogehogeをコードを変更せずシミュレートして、出力は日本語でシミュレートのtraceとすることhogehogeには「下記の修正」や「ユーザーフ...
14時間前

DifyをシンプルなLLMラッパーとして使うという選択
Zennの「LLM」のフィード
はじめにこんにちは!メドレーで QA エンジニアをしている@Daishu です。Dify といえば「ノーコード AI 開発プラットフォーム」ですが、シンプルに LLM のラッパーとして使ってみたら便利だったので、その方法を紹介します。 背景: API キー管理とモデル切り替えの悩みE2E テストの失敗を分析する Slack bot「MagicPod Assistant」を実装する中で、いくつかの課題に気づきました。課題感個別に払い出した Claude API キーの管理責任新しい LLM を試すたびに API キーの発行手続きが必要Token 使用量のモニタリン...
14時間前

Snowflakeにおける非構造化データを構造化データに変える選択肢
Zennの「LLM」のフィード
はじめにこんにちは。ナウキャストでデータエンジニア/LLMエンジニアとして頑張っているTakumiです。Snowflakeにて、非構造化データからデータの抽出を行う機能が続けてPublic Preview、GAとなりました。Document AIAI_EXTRACTAI_PARSEDOCUMENT(OCR)AI_PARSEDOCUMENT(LAYOUT)それぞれ、非構造化データ(PDF等)から情報を抽出する関数ですが使い所が違います。この記事ではそれぞれの適したユースケースと、コストはどうなっているかをお伝えします!!類似の関数として、SNOWFLAKE....
1日前

vLLM V1の実装②:EngineCore
Zennの「LLM」のフィード
前回 (だいぶ前😇) は vLLM V1 の概要と EngineCoreClient について見てきましたが、今回は実際の推論処理を担う EngineCore の実装を見ていきたいと思います。vLLM V1 における推論処理の中核を担うのが EngineCore およびその派生クラス群です。前回の EngineCoreClient の解説ではクライアントサイドのアーキテクチャを見てきましたが、今回は実際の推論オーケストレーションを行うサーバーサイドの実装を詳しく追っていきます。(参照したコミットは時期がズレているので、最新と比較すると細部または実装方針が異なるかもしれません。ご了承く...
1日前

[Kotlin] JetBrains公式AIエージェント"Koog"の0.4.0出たから触る
1

Zennの「LLM」のフィード
はじめにスマートラウンドで野生のAIエンジニアをやっている福本です🐈普段はLangChainやMastraを使ったAIワークフロー/エージェントの新規開発や運用をやっています。JetBrainsが公式で提供するAIエージェント開発フレームワークKoogが発表され、それに関する以下の記事を書きました📝https://zenn.dev/smartround_dev/articles/9faa2d870b15b2この記事を書いたときのバージョンは記事に記載の通り0.3.0だったのですが、8/28に0.4.0がリリースされました。 時が経つのがはやい(爺)。https://blo...
1日前

なぜ、AGIの登場は今から30年後くらいになるのか?
Zennの「LLM」のフィード
はじめに近年、生成AI(特に大規模言語モデル:LLM)の進化は目覚ましく、さまざまな分野で実用化が進んでいます。その圧倒的な性能向上を目の当たりにして、「このまま進化を続ければ、人間と同等の汎用人工知能(AGI)が数年以内に誕生するのではないか」と考える人も少なくありません。しかし実際には、現在のLLMは急峻な成長曲線の立ち上がりを終え、すでに飽和領域に差しかかっていると考えられます。本稿では、なぜAGIの登場が今からおよそ30年後になると予想できるのかについて、以下の観点から論じます。LLMの構造的限界強化学習と自己改善の欠如資源制約技術史的なパラダイム転換周期...
2日前

Anthropicに学ぶ:AIエージェント向けツール設計の5原則
5

Zennの「LLM」のフィード
これはなに?Xでも絶賛しましたが、Anthropicが発表した "Writing effective tools for agents — with agents" という記事が素晴らしい内容でした。その中でも特に「Principles for writing effective tools (効果的なツールを作成するための原則)」のセクションが実践的な内容だったので、AIエージェント向けツールを実装するときの社内ガイドラインとしても使えるように抜き出して簡潔にまとめてみました。以下の5つの原則としてまとめてあります。AIの特性に合わせたツール設計をしようツール名を体系的...
2日前

Google CloudのModel ArmorのテンプレートをTerraformで記述してみた
Zennの「LLM」のフィード
今回はGoogle CloudのSecurity Command Centerで提供されているModel Armorについて、Terraformを利用してテンプレートを作成してみました。なお、内容については前回コンソール画面上で作成した設定を再現する形で実装してみます。https://zenn.dev/akasan/articles/7ce40551040ccc 早速実装してみる Model Armorのリソースについて今回は以下のgoogle_model_armor_templateを利用してModel Armorのテンプレートを実装します。https://registr...
2日前

LLMとの協働開発で1日427ファイル爆発!? - AI時代の情報管理術
Zennの「LLM」のフィード
LLMとの協働開発で1日427ファイル爆発!? - AI時代の情報管理術 はじめに - 笑えない現実「今日も順調にAIと開発してるな〜」と思っていたら、気づけば1日で427個のマークダウンファイルが生成されていました。$ find . -name "*.md" | wc -l427AI駆動開発あるあるですね...笑最近いくつかのプロジェクトでエージェント型AI駆動開発を続けてきましたが、毎回この「情報爆発問題」に悩まされてきました。この記事ではその対策メモを残します。この記事も、基本的にClaudeCodeに書いてもらってます🤖(なので、一部ワイのことディスってん...
2日前

【dataiku】ノーコードで販売管理チャットボットを作ってみた②
Zennの「LLM」のフィード
kobayashiです。ブログをお引越ししてZennで初投稿します!結構時間が経ってしまったのですが、dataikuで販売管理チャットボットを作ってみた①の続きです。https://blog.truestar.co.jp/dataiku/20250704/63399/ 振り返り前回はOFFICE de YASAIという社食販売システムのデータをdataikuのWebapp機能を用いて「OFFICE de YASAI チャットボット」を作成しましたが、精度が悪く改良を試みていました。今回はうまく回答できるようになったので、何を修正したのかご紹介します。うまく回答できている例...
2日前

Qwen3-Next:究極のトレーニング・推論効率へ
Zennの「LLM」のフィード
Qwen3-Next:究極のトレーニング・推論効率へ公開日:2025年9月11日著者:Qwenチーム元ブログ:https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list一言で言うと:Qwen3-Nextは、800億パラメータながら推論時にわずか30億パラメータしか使わない超効率モデル。長文処理(最大256Kトークン)で10倍以上の高速化を実現し、Qwen3-235Bクラスの性能を1/10以下のトレーニングコストで達成...
3日前

RAGは数値を正しく認識できるのか?
18

Zennの「LLM」のフィード
導入こんにちは、株式会社ナレッジセンスの須藤英寿です。今回は、RAGで数値情報を正しく認識できるのかを調査した論文を紹介します。https://arxiv.org/pdf/2509.05691 サマリーRAGはユーザーの質問に対して、意味的な類似度から関連性の高い情報を検索して、ユーザーの質問に回答します。この意味的な類似度の検索がRAGの技術を支えていますが、その性能に関しては様々なベンチマークが乱立しており、体系的に把握されていないことも多く存在します。今回は、数値にフォーカスして、RAGが正確に数値を把握できているかの調査結果とその分析をしていきます。課題意識...
3日前

AIエージェント設計の3つのアプローチ:プレイブック・MCP・ハイブリッド型の選択指針
Zennの「LLM」のフィード
新人エンジニアにタスクを任せるとき、詳細な手順書を渡しますか?それとも目標だけ伝えて任せますか?経験豊富な開発者なら、この判断が後のプロジェクト成否を左右することを知っています。AIエージェントでも、まったく同じ判断が求められています。エージェントに厳格な手順を守らせるか、それとも目標達成の方法を自由に考えさせるか——この設計選択が、システムの信頼性、開発効率、そして事業リスクを決定します。現在、この課題に対して3つの主要なアーキテクチャアプローチがあります:プレイブック駆動型:確実な手順を事前定義し、エージェントはその案内役に徹する「制御重視」MCP(Model Cont...
3日前

まだ間に合う!Android端末でオンデバイスLLM入門(MediaPipe + Gemma)
Zennの「LLM」のフィード
9/11,12のDroidKaigi 2025に参加してきました!!https://2025.droidkaigi.jp/今年は特にLLM関連のセッションが印象に残りました。https://2025.droidkaigi.jp/timetable/944464/https://2025.droidkaigi.jp/timetable/945497/全然キャッチアップができておらず初めて学ぶことばかりでしたので、実際に自分でも触ってみようと思います。私と同じように「LLMの情報追えてなかった」「なんか難しそうだな」という方を想定して書いています。カスタマイズや最適化については書...
3日前

なぜ、LLM AIは「システム2」がスカスカな「システム1」のお化けなのか?
Zennの「LLM」のフィード
はじめに近年、生成系AI、特に大規模言語モデル(LLM: Large Language Model)が社会に与える影響は急速に拡大しています。ChatGPTをはじめとするモデルは、日常会話からプログラミング支援、教育、ビジネス分析に至るまで多様な領域で活用され、その知識量や反応速度に驚嘆する人は少なくありません。とりわけ、GPT-5の登場によって日本の芸能やマイナーなアニメ作品に関する知識まで網羅され、まるで「百科事典を超えた即答機械」と化しています。しかし、冷静にその本質を考えると、LLMの仕組みは「人間のシステム1を極限まで肥大化させた存在」であり、システム2にあたる批判的思...
3日前

AgentCLIを作る方法
Zennの「LLM」のフィード
Agent CLI使っていますか?Claude Code Codex Gemini CLIと世界はターミナルの世界に回帰して激戦区になっていますね。Claude Codeエディタ連携や対話主導のコーディング体験で知られる系統です。CLI/IDE拡張の形で、タスク分解・リファクタ・テスト生成などを対話で進めます。Codexかつてのコードモデルを起点にした自動補完/変換の文脈から、ターミナル操作やスクリプト生成を対話で行うCLIの流儀が広がりました。Gemini CLILLMをローカルの作業文脈(ファイル群・ログ)に接続し、質問→アクション→再質問のループを小回りよく回す...
3日前