Zennの「生成 AI」のフィード

フィード

記事のアイキャッチ画像
Deep research APIを実行してみよう!より深いDeep ReseachのTips
Zennの「生成 AI」のフィード
OpenAIから、待望のDeep Research APIがリリースされました。ChatGPT Plus/Proをお使いの方にはお馴染みの、複雑なトピックを調査・要約してくれる強力な「Deep Research」機能。これまでChatGPT上でしか使えませんでしたが、遂にAPIとして公開され、独自のアプリやワークフローに組み込めるようになりました。この記事では、公式ドキュメントを参考にAPIの基本的な使い方から、より良い結果を得るための実践的なテクニックまで、コードを交えて解説します。https://platform.openai.com/docs/guides/deep-resea...
1時間前
記事のアイキャッチ画像
Gemini CLIをローカルLLM(Ollama)専用クライアントに改造する
Zennの「生成 AI」のフィード
!この記事の90%はAIで執筆しています。 はじめにGoogleのGemini CLIは、コマンドラインからGemini AIモデルと対話できる優れたツールです。今回は、このCLIを改造して、認証不要でローカルLLM(Ollama)専用のクライアントとして動作させる方法を紹介します。gemma3nが公開されてできないかなと思ってやってみたら思った以上に容易にできたので書きました。 開発環境:Claude CodeとDeepWiki MCP今回の改造はClaude Codeを使用して実装しました。Claude Codeは、AIアシスタントがファイルの読み書きやコマンド実...
2時間前
記事のアイキャッチ画像
設計書や仕様書のMarkdownファイルをまとめる方法
Zennの「生成 AI」のフィード
設計書や仕様書のMarkdownファイルをまとめる方法## 導入普段、設計書や仕様書をMarkdownで管理している中で、AIに食わせたり、レビューに使うために単一ファイル化したいことがよくあります。そこで簡単に使えるスクリプトを作りました。 目的仕様書・設計書などで、Makrdownの記載は有効だと考えています。ただし、資料が多くなると、ファイル自体分散したくなる生成AIなど利用しているときには仕様書・設計書などの提示が有効で、そのためには上記ファイル群を単一にまとめた方が使い勝手いいあくまでもGeminiの場合、ChatGPTなどは、Githubのパス指定...
12時間前
記事のアイキャッチ画像
【図解】OllamaとOpen WebUI でローカルLLMのRAG環境を構築する手順|RAGをDockerで動かす
Zennの「生成 AI」のフィード
はじめに生成AIの利活用が進む中で、LLMをローカル環境で動かしたいというニーズが高まっています。本記事では、DockerとOllamaとOpen WebUIを組み合わせて、自分だけのナレッジベースを活用できるRAG環境をローカルに構築する手順を図解を交えて紹介します。構築する環境のイメージ図は以下です。なお、筆者のPCは「ASUS ゲーミングノートPC:FX707VV-I7R4060A5200」(OS:Windows11、CPU:インテル Core i7-13620H プロセッサー、メモリ:16GB、ストレージ:1TB、GPU:NVIDIA GeForce RTX 4060...
19時間前
記事のアイキャッチ画像
住宅ミスマッチ防止bot【AI Agent Hackathon with Google Cloud】
Zennの「生成 AI」のフィード
1. はじめに(導入) 記事の目的本記事はGoogleが主催するAI Agent Hackathon with Google Cloudにエントリーするプロダクトについての紹介記事です。 2. 開発したアプリの概要 アプリ名住宅ミスマッチ防止bot 一言で言うと?住居を選ぶ際に、対象の住居や住環境が自身の価値観にマッチしているかどうかをサポートしてくれるアプリ 解決したい課題住まい選びにおいて、入居後に「想像と違った」と感じるケースが多く見られます。具体的には、内見時には分かりにくい騒音・日当たり・湿気・電波といった生活環境の問題、近隣住民や地域コミュニテ...
1日前
記事のアイキャッチ画像
Neo4J - グラフDB - 導入編 ①
Zennの「生成 AI」のフィード
はじめに本記事では、ナレッジ・グラフ・データベースである Neo4J(ニオ・フォー・ジェイと発音) をご紹介します。長くなるので3回に記事を分けて公開する予定です。Neo4Jはクラウド版を無料(クレカ登録不要)で利用できます。また、ローカルのデスクトップ・アプリ版も提供されています。Python, Java, JavaScriptのSDKも提供されています。また、後編では生成AIを活用したグラフRAGも説明する予定です。 ナレッジ・グラフとは?ナレッジ・グラフとは、その名のとおり、知識をグラフで表現したものです。グラフとは、ツリー構造のように、ノードを線でつなげたものです...
1日前
記事のアイキャッチ画像
UX重視のアジャイル開発で使える生成AIプロンプト集
Zennの「生成 AI」のフィード
アジャイル開発のサイクルを回しながら、一貫したユーザー体験(UX)を提供するためのAIプロンプト集です。開発の準備から各スプリントイベントに沿って、コピー&ペーストしてすぐに使える形で整理しました。 Phase 0: 準備・計画フェーズ(スプリント0)目的: 本格的な開発スプリントを始める前に、プロダクトの基盤とチームの共通認識を固めます。 1. プロダクトの「なぜ」と「誰のため」を定義するプロダクトの羅針盤となる、ユーザー像と提供価値を明確にします。 ペルソナ作成プロンプトあなたはプロのUXリサーチャーです。以下のユーザー調査データから、このサービスの主要なペル...
1日前
記事のアイキャッチ画像
【AI駆動開発】プロジェクトを理解したうえでの要件定義をGithub CopilotとVSCodeで実現する
はてなブックマークアイコン 1
Zennの「生成 AI」のフィード
はじめに要件定義は、ソフトウェア開発における重要な工程です。しかし、そのプロセスは複雑で時間がかかり、多くの開発者が「ドキュメント化するのが大変」「結局要件漏れが発生してしまう」といったように頭を悩ませる課題の一つではないでしょうか。特に、プロジェクトの現状を正確に把握し、それを基に一貫性のあるフォーマットで要件をまとめる作業は、多大な労力を要しますよね。最近は生成AIの登場で、要件定義も一定のフォーマットでそれなりの文章でドキュメント化できるようになっていると感じます。しかし、質の面ではどうでしょうか?プロンプトに背景知識を丁寧に入力しないと良い要件定義書は出力されませんよね。...
1日前
記事のアイキャッチ画像
拡散型LLM(Gemini Diffusion)におけるプロンプトの調査 その2
Zennの「生成 AI」のフィード
はじめに巷では Gemini CLI が騒がれておりますが、それはまた別の機会に。先日は、拡散型モデル(Gemini Diffusion)におけるプロンプトの制御について、二種類の方法で調査した結果をご紹介しました。その中で、ChatGPT や Gemini などで有効的だとされてきたプロンプトを真似した、長文のプロンプトで指示を出すと初期のノイズらしき文字がたくさん発生してしまうことが判明しました。前回の記事がこちらです。そこで今回は、前回の文末でも書きました「画像生成や動画生成で有効的だったプロンプト」を如何に拡散型の文章生成モデルに活かせるかを調査していきます。ま...
1日前
記事のアイキャッチ画像
Mastra + Ollama + MCPでローカルAIエージェントを作る
はてなブックマークアイコン 64
Zennの「生成 AI」のフィード
はじめに どんな人向けの記事?ローカルLLMでAIエージェントを作りたい方 背景2ヶ月ほど前、生成AIなんでも展示会向けにMastra + MCPを組み合わせたローカルのAIエージェントを作成した。当初Mastra + Ollama + MCPの組み合わせは動かなかったが、4月末時点で動くようになった。https://x.com/gosrum/status/1917071781653057846この方法を記事にしていなかったので、今更ながらその方法の備忘録メモを残す。開発環境は以下の通りだが、MacやWindows環境でもほぼ同じコマンドで動作するはず。開発...
2日前
記事のアイキャッチ画像
【図解】OllamaとOpen WebUI でローカルLLMの環境構築する手順|大規模言語モデル・生成AIをDockerで動かす
Zennの「生成 AI」のフィード
はじめにChatGPTなどの生成AIが普及する中、「ローカル環境で大規模言語モデル(LLM)を動かしたい」と考える方も増えてきました。とはいえ、LLMのセットアップには専門知識が必要で、「何から始めればいいのか分からない」「軽量モデルってどこで動かせるの?」と迷う人も多いと思います。本記事では、OllamaとOpen WebUIというツールを使って、ローカルでLLMを動かすための環境構築手順を、図解を交えて解説します。構築する環境のイメージ図は以下です。Dockerコンテナを2つ作ってChatGPTのようにブラウザからプロンプトを打てるようにします。PCにNVIDIA製のGPUと...
2日前
記事のアイキャッチ画像
Gemini CLI 快速キャッチアップ
Zennの「生成 AI」のフィード
▼ このブログ記事を使って解説した動画 ▼https://youtu.be/C-hfqYlhjyU?si=5CT99EwmO1Bpe-fY目次主な特徴セットアップ基本的な挙動基本的なコマンドコンテクストの設定Google検索機能の活用システムの構成まとめGemini CLIは、Googleが2025/6/25に公開したオープンソース(Apache 2.0ライセンス)のコマンドラインAIエージェントです。ターミナル環境で直接Geminiと対話でき、ファイル操作やシェルコマンド実行、Web検索などが行えます。下記はやり取りの例です。指示を踏まえて自律的にフォル...
2日前
記事のアイキャッチ画像
Kotoba.ai:私たちはどのようにして「語気をアップグレードする」敬語変換AIツールを作ったのか
Zennの「生成 AI」のフィード
はじめに日本語における「敬語」は、単なる文法の話ではなく、文化そのものです。Kotoba.ai は、あらゆる日本語使用者が「もっと自然に・もっと適切に」敬語を使えるようにするためのツールです。この記事では、Kotoba.ai の開発背景・技術構成・機能設計を紹介しつつ、敬語を扱う際に私たちが直面した課題と、それに対するAIソリューションを共有します。なぜ敬語なのか?(Why we built this)多くの翻訳ツールやチャットボットは、文法や単語の正確性に注目していますが、「語気」「距離感」「場面による言い換え」には十分対応できていないケースが多いと感じていました。特に日本...
2日前
記事のアイキャッチ画像
【初心者向け】Agentic AI入門:RAGとAPIで自律的に“行動するAI”を作ろう!
Zennの「生成 AI」のフィード
はじめに なぜ今、 Agentic AIが注目されているのか?最近では、ChatGPTやClaudeなどの生成AIが私たちの生活に浸透してきました。質問に答えるだけでなく、実際に“行動するAI”があったら、もっと便利だと思いませんか?そんな夢のような技術が、いま注目されている 「Agentic AI(エージェント型AI)」 です。Agentic AI = LLM(大規模言語モデル)+ RAG(検索拡張生成)+ ツール/APIの連携これにより、AIは次のようなことが可能になります:情報を検索して整理(RAG)外部サービスのAPIを操作(天気、予約、ショッピングなど)...
2日前
記事のアイキャッチ画像
【入門】Gemini CLI を最速で使いこなす
Zennの「生成 AI」のフィード
Gemini CLIとは?Googleから、Gemini CLIという新しいオープンソースのAIエージェントが6月25日に発表されました。これにより、開発者は使い慣れたターミナルから直接、強力なGeminiモデルのパワーを活用できるようになります。https://blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent/ Claude Codeよりいいの?Gemini 2.5 Proは100万トークン(将来的には200万トークン)のコンテキストウィンドウを提供する一方、最新...
2日前
記事のアイキャッチ画像
Gemini CLI キター!ので改めてAIコーディングエージェントの歴史を解説してみる【Gemini CLIのハンズオンあり】
Zennの「生成 AI」のフィード
👉 Gemini CLIの設定や使い方のハンズオン記事はこちら コーディングエージェントの歴史ChatGPTのリリースから、LLMによるコーディングを実践的に使いながら仕事をしているエンジニアの視点から、LLMとコーディングの歴史について語ります。!時系列順に書こうと思ったのですが、1つのツールを取って見ても、リリースごとに機能がどんどん追加されていったり、それに追従して他のツールも進化していっているので、複雑でまとめるのが大変だったので、大枠を捉える形で書いています。 エディタ型エージェントと自律型エージェントの爆誕 Cursor(エディタ)の登場(2023/8月...
3日前
記事のアイキャッチ画像
作りながら学ぶRAG入門
Zennの「生成 AI」のフィード
そもそもRAGとは何か?RAG(Retrieval-Augmented Generation) = 「関連する資料を自動で見つけて、それを参考にしてAIが回答する仕組み」例:「カレーを美味しく作る方法を教えて」という質問の場合従来の方法: 料理本全500ページをLLMに読み込ませて分析 → 時間とコストがかかるRAG: 「カレー 美味しく作る」に関連する3-5箇所だけを自動抽出してLLMに分析させる → 高速・安価・的確 前提知識:コンピューターはどうやって「似ている文章」を見つけるのか? 1. 文章を数字に変換する(ベクトル化)コンピューターは文章をそのま...
3日前
記事のアイキャッチ画像
ChatGPT vs Claude|AIコーディングの実力を比較してみた【2025年4月時点メモ】
Zennの「生成 AI」のフィード
はじめに2025年4月時点で、ChatGPTとClaudeを使ってコーディング作業を試してみました。使用したAIは「ChatGPT(GPT-4o)」と「Claude 3」です。この記事では、それぞれの特徴や使ってみて感じたメリット・デメリットをメモ形式で整理しています。「AIにコードを書かせてみたい」という方の参考になれば幸いです。 AIにコードを書かせるメリットHTMLの枠組みを自動生成してくれるので手間が省けるJavaScriptなども一緒に書いてくれるコーディング作業の時間短縮につながる デメリット・注意点テキスト部分は打ち直しが必要なことが多い...
3日前
記事のアイキャッチ画像
Microsoft Mu :超小型専用AIエージェント用 言語モデル
Zennの「生成 AI」のフィード
Microsoft Mu:330Mパラメータの NPU 小型モデル — Windows 11 Settings 専用 AI エージェント用 Mu 言語モデル。330M パラメータと聞いて、最初は「こんなに小さくて何ができるの?」と思ったが、調べてみるとなかなか面白いことが分かった。アーキテクチャの逆襲:なぜ GPT に追従しないのか?みんな decoder-only アーキテクチャで遊んでいる中、Microsoft は逆張りして encoder-decoder を採用。理由は単純:一度エンコードすれば、あとはデコードするだけで、従来方式と比べて最初のトークン遅延を 47% 削減、デコ...
3日前
記事のアイキャッチ画像
議会の会議録の整形を自動化するツール「minutes-parser」を開発した話
Zennの「生成 AI」のフィード
🎯 この記事の対象読者「議会の答弁案の作成、正直つらい…」 と感じている全国の自治体職員の皆さん!「AIで業務効率化って、具体的にどうやるの?」 と日々模索しているDX推進担当者さん!「Pythonで実用的なツールを開発してみたい!」 と考えている、そこのあなた! 💡 この記事を読むと得られること自治体特有の議会の会議録を効率的に構造化するツールの開発背景と具体的な手法がわかります。PythonとGoogle Colabを活用した、手軽に試せるAIツール開発のヒントが得られます。実際の開発でぶつかった壁と、そのユニークな解決策を知ることができます。...
3日前