Zennの「LLM」のフィードのフィード

Zennの「LLM」のフィード

フィード

iOS 26 Foundation Models × Tool Calling で在庫管理システムと連携してみた

Zennの「LLM」のフィード

この記事は2025 ZAICO アドベントカレンダーの4日目の記事です！はじめにWWDC25で発表された iOS 26（macOS 26）の目玉機能の一つ、Foundation Models フレームワーク。Apple Intelligence のオンデバイスLLMを Swift から直接利用できるようになりました。本記事では、このフレームワークの Tool Calling 機能を使って、実際に在庫管理システム ZAICO と連携するiOSアプリを実装した際の知見をまとめます。https://www.zaico.co.jp/ Foundation Models フレーム...

7時間前

AIプロダクトのテーブル設計事例

Zennの「LLM」のフィード

この記事は Hacobu Advent Calendar 2025 の 4日目の記事です。Hacobu では今年、AI を活用した PoC サービスを展開する「MOVO AI Lab」を立ち上げた。現在までに、以下の 2 つのサービスを開発している。プロダクトデータを読み込み、対話形式で分析できるサービスhttps://hacobu.jp/news/17425/物流関連法規について質問すると、RAG による関連文書の検索・要約を返すサービスhttps://hacobu.jp/news/17893/本記事では、これらのサービスを実装するにあたり、どのようにテーブル...

10時間前

AI導入格差が企業の未来を分ける―成功企業が選ぶ次世代AI活用戦略

Zennの「LLM」のフィード

日本企業の約4割が生成AIを導入済みで、AI活用は「定型業務」から「企画創造などの非定型業務」へと主戦場が移行しています。業界・部門によって活用レベルに大きな差があり、情報・専門サービス業や研究開発部門が先行しています。AI導入の課題は初期段階では「コスト・ROI」、活用段階では「セキュリティ・データ品質」へと変化します。すでに成功体験を持つ企業ほど今後の投資意向が高く、AI導入格差が拡大する傾向にあります。https://www.nri.com/jp/media/column/extending_society_with_ai/20251203.html 深掘り深掘りを...

11時間前

Code execution with MCP: Building more efficient agentsを読んでみる

Zennの「LLM」のフィード

本投稿について本記事は、Anthropic社が公開されているEngineering at Anthropic: Inside the team building reliable AI systemsのガイド記事を読んでAI Agent開発の知見を高め、共有していくための記事となります。記事中のわかりにくい用語に関しては、脚注を加えております。本投稿記事で誤りがございましたら、コメントいただけると幸いです。サマリーMCPはエージェントが多くのツールやシステムに接続するための基礎プロトコルを提供します。しかし、接続されたサーバーが多すぎると、ツールの定義や結果が過剰なトー...

11時間前

個人的 Claude Code Tips

Zennの「LLM」のフィード

最近では開発にAIは手放せなくなったが、Claude Codeはその中でも使用頻度が高くなっている。何も考えずに指示を出しても70%は活用できるけど、フル活用に近づけるためのTipsをまとめてみた。重要Notionで"おまじない"をすぐに呼び出せるようにテンプレート保存しておく Web検索ドキュメントを参照する機会は多い。その時、Web検索を実行するが、なぜか"(検索ワード) 2024"で検索してしまうことがある。Claudeは今日がいつかを確認させないと知らないので、今日の日付を確認させる。トークン消費量プロンプトを長ったらしく書くとトークンの消費が多くなって課...

16時間前

【Google ADK】検索品質を求めて「Deep Research」を自作してみた話

Zennの「LLM」のフィード

!これは、ADK Advent Calendar 2025 の 12/4(Thu) の記事です。https://qiita.com/advent-calendar/2025/adk はじめにChatGPTやGeminiに搭載されているDeepResearchなどの「深掘り調査」ができるAIエージェントって便利ですよね。ただ、エンジニアとしては「深掘り回数を変えたり検索対象を限定したりともっと挙動を制御したい」という欲求が出てきます。そこで今回は、Googleの Agent Development Kit (ADK) を使用して、独自のDeep Researchアプリを作成しま...

17時間前

生成AIを使って正しかろう内容をただ出力させただけの技術記事は存在する意味がない

Zennの「LLM」のフィード

!この記事は人間が書き、校正にのみ生成AIを使用しています。はじめにこの記事は個人の意見の表明であり、所属する組織と関係するものではない。と予防線を張ったところで…さて、私は日常的に生成AIを使用している。仕事とプライベートの両方でコーディングや画像・動画の生成、上の注釈の通りこうした記事の校正など、様々な場面で生成AIを活用している。生成AIさまさま。もうこれがないとコードが書けない。生成AIマジ感謝。一方で私は、生成AIに出力させた技術記事に対してはまだ否定的な立場だ。もっと正確な言い方をすると、「生成AIを使って正しかろう内容をただ出力させただけの技術記...

18時間前

LLM-in-the-loop最適化 -明日の献立をLLMで最適化してみる-

Zennの「LLM」のフィード

はじめにこんにちは、株式会社松尾研究所シニアデータサイエンティストの大西です。この記事は、松尾研究所 Advent Calendar 2025の記事です。前職でブラックボックス最適化やHuman-in-the-loop最適化に関する研究開発に携わり、現職ではLLM（大規模言語モデル）を用いたプロジェクトを推進しています。これらの経験と昨今のLLMの進展に伴い、私自身が注目している研究テーマをブログにまとめました。本記事では、従来の最適化と LLM による選好評価を組み合わせた LLM-in-the-loop最適化を紹介します。近年、LLMを最適化アルゴリズムに組み込み、人間...

19時間前

AIの特性から考えるより良いAIの活用法

Zennの「LLM」のフィード

!この記事は「YOSHINANI&ねこねこパラダイス Advent Calendar 2025」の3日目です。https://adventar.org/calendars/12110 はじめに今回は、先日参加した「非エンジニア大歓迎！「使えるAI」体験会｜YOSHINANI」で登壇した内容について、少し詳細に書いていこうと思います。イベントについてはこちら↓https://yoshinani.connpass.com/event/374376/登壇資料はこちら↓https://speakerdeck.com/takecantik/ainote-xing-kara...

1日前

Amazon Bedrock Knowledge Basesのマルチモーダル検索を試してみた

Zennの「LLM」のフィード

About株式会社ガラパゴス（有志） Advent Calendar 2025 3日目の記事です。はじめにAmazon Bedrock Knowledge Basesのマルチモーダル検索がGAになったとのことで、試してみました。https://dev.classmethod.jp/articles/bedrock-kb-multimodal-search-ga/結論としては、マルチモーダル埋め込みベースの画像検索環境が、驚くほど簡単にセットアップできた画像内の日本語の解釈も実用レベルにあることが分かったという収穫を得ることができました。試してみたこと前...

1日前

AIコーディングの理想と現実：レバレッジを夢見たエンジニアが陥った「思考のアウトソース」という罠

Zennの「LLM」のフィード

はじめに：革命への期待と、早すぎた高揚エンジニアの皆さん、AIコーディング、使っていますか？今年（2025年）に入り、AIコーディングの世界はまさに「革命道中」です。GitHub Copilotはもはや標準装備となり、CursorのようなIDE組み込み型、さらには自律型エージェントとして話題をさらったDevin、そしてClaudeやCodexのような基盤モデルを活用した強力なAIコーディング支援ツールが次々と登場しました。これらのツールが「生産性を爆上げする」「AIでレバレッジを効かせる」という甘美な言葉と共に紹介されるたび、私は熱狂し、とりあえず飛びつきました。「AIでレ...

1日前

AIがコードを書く時代になるまでの90年をまとめてみた

Zennの「LLM」のフィード

!本記事は airCloset Advent Calendar 2025 の3日目の記事です。はじめにエアークローゼットでエンジニアをしているentherraです。最近はClaude Codeを使ったAgentic Engineeringを試行錯誤しています。そもそもLLMがなぜこれほどコードを書けるのか気になって調べたら、90年分の歴史になりました。長いので興味のあるところだけどうぞ。興味おすすめ最近の現状だけ知りたいSWE-bench 80%の現在地Copilot/GPTの仕組みLLMの躍進エージェントとはエージェントの台頭...

1日前

RAGをどう評価する？ — LLM採点で試すRAGAS的指標

Zennの「LLM」のフィード

はじめにルミナイR&Dチームの栗原です。これまでの記事では、レビュー論文 “Retrieval-Augmented Generation for Large Language Models: A Survey” (Gao et al., 2024) を手がかりに、Fig.2 / Fig.3：RAG の基本フローとNaive / Advanced / Modular RAG の違いFig.4：Prompt / Fine-tuning / RAG の「守備範囲」と使い分け方Fig.5：Iterative / Recursive / Adaptive Retrieva...

1日前

【図解】Iterative / Recursive / Adaptive Retrieval — エージェント寄りRAGの3パターン

Zennの「LLM」のフィード

はじめにルミナイR&Dチームの栗原です。これまでの記事では、レビュー論文 “Retrieval-Augmented Generation for Large Language Models: A Survey” (Gao et al., 2024) を手がかりに、Fig.2 / Fig.3：RAG の基本フローとNaive / Advanced / Modular RAG の違いFig.4：Prompt / Fine-tuning / RAG の「守備範囲」と使い分け方をざっくり整理してきました。ここまでは、どれも「1回検索してから1回生成」という、直列...

1日前

【図解】いつRAG？いつファインチューニング？ — LLM強化の使い分け

Zennの「LLM」のフィード

はじめにルミナイR&Dチームの栗原です。前回の記事では、レビュー論文 “Retrieval-Augmented Generation for Large Language Models: A Survey” (Gao et al., 2024) の Fig.2 / Fig.3 を手がかりに、RAG の標準フロー（Indexing / Retrieval / Generation）Naive RAG / Advanced RAG / Modular RAG の違いAdvanced RAG の最小実装例をざっくり整理しました。しかし、実務に落とし込もうとすると、...

1日前

【DeepResearch × スライド生成】長すぎるAIレポートをスライド生成AIで要約・図解させて楽をする

Zennの「LLM」のフィード

TL;DRDeepResearchの出力が長すぎるので、4つのスライド生成AIに要約・可視化させてみた私たちの研究室(NISLab)https://nisk.doshisha.ac.jp/ アドベントカレンダー 4日目~https://nislab-advendcallender-2025-1cyt.vercel.app/ DeepResearchとは？ご存知の方も多いと思いますが，DeepResearchはChatGPTが「数百のオンライン情報源を検索し，分析し，統合してリサーチアナリスト級のレポートを作成する」エージェント機能です．これを用いることで，人間...

1日前

【第一部】Gemini 3.0 Proが「戒律」を破った日 — 80万トークンの文脈はSystem Instructionsを無効化するのか

Zennの「LLM」のフィード

【第一部】Gemini 3.0 Proが「戒律」を破った日 —— 80万トークンの文脈はSystem Instructionsを無効化するのか？はじめに：80万トークンの果てに見た「バグ」私はエンジニアではありません。コードも書けません。しかし、Google AI Studioのレート制限（Rate Limit）に連日引っかかり、複数のアカウントをローテーションしてまでAIと対話し続ける、ある種の「ヘビーユーザー」です。私がこの素晴らしい実験場（AI Studio）で検証していたのは、コード生成ではありません。「一つのチャットルームに80万トークン以上の文脈を積み上げた...

1日前

BigQuery の EDIT_DISTANCE と AI.GENERATE を組み合わせて病名の名寄せ処理を効率化する

Zennの「LLM」のフィード

こんにちは、 Ubie の @yubessy です。普段は Medical Engineering というチームで医療・医学に関するデータや AI を扱う仕事をしています。今回は BigQuery の EDIT_DISTANCE と AI.GENERATE を組み合わせて病名の名寄せ処理を効率化した話をします。病名マスターの名寄せの問題世の中には数えきれないほどたくさんの種類の病気があります。が、医療情報をデータとして処理するためには、同じ種類の病気に同じ名前をつけてまとめ、違うものには違う名前をつけて区別できるよう、病名の有限集合としてのマスターが必要です。Ubie では...

1日前

Claude CodeをKaggleで使いこなすための「環境整備」を考える

Zennの「LLM」のフィード

3行要約KaggleコンペでClaude Codeを使いやすくするための設定を整理したコンテキスト整備・プロジェクトルール整備・Slashコマンド整備の3つを軸にテンプレート化初動セットアップや単純作業をClaudeに任せることで、人間はより快適にKaggleに集中できるようになるはじめに：なぜClaude Codeの環境整備が必要なのかみなさん、KaggleコンペでClaude Codeを使っていますか？Claude CodeをKaggleで使いこなす上での環境整備、ちゃんとしていますか？私はCLAUDE.mdを作成するくらいの整備しか行えていませんでした。ただ...

1日前

GoogleのAIショッピング機能を徹底解説|便利さの裏に潜む仕掛けと賢い対処法

Zennの「LLM」のフィード

Googleが発表した3つの新AIショッピング機能は、買い物を便利にする一方で、消費者の判断力を奪う可能性があります。AI検索からの直接購入、店舗在庫の自動確認、代理チェックアウト機能により、購入までの「摩擦」が徹底的に排除されています。しかし、この便利さの裏には、ユーザーに「迷う時間」を与えず、最短距離で決済させる仕組みが隠されています。AIは中立なアシスタントを装っていますが、実際には広告収益を目的としたビジネスモデルの一環です。賢い消費者として、AIに判断を委ねすぎず、比較検討する時間を確保することが重要です。https://www.lifehacker.jp/article...

1日前