Zennの「生成 AI」のフィード
フィード

なぜ既存のAI検出ツールは日本語で「誤検知」を連発するのか?NLPの視点から解説
Zennの「生成 AI」のフィード
最近、X(旧Twitter)を見ていると「自分で書いた記事なのにAI判定された…」という嘆きをよく見かけます。Gemini や GPT-4o などのLLMが普及したことで、メディアや教育現場では「AIチェッカー」の導入が進んでいますよね。でも、正直言って今の海外製ツールを日本語にそのまま使うと、**「誤検知(False Positives)」**が多すぎて使い物にならないケースが結構あります。なぜ、人間が一生懸命書いた文章が「ロボット」扱いされてしまうのか?今回は、自然言語処理(NLP)のちょっとオタクな視点から、その理由を解説してみます。英語中心のトークナイゼーション(Toke...
14時間前

ChatGPTで「講義システム」を作ってみた
Zennの「生成 AI」のフィード
ChatGPTで「講義システム」を作ってみたAIとの長い対話を安定させるためのシンプル講義フレームこの記事では、AIとの対話を使って「講義形式の学習システム」を作ってみた経緯をご説明します。後から振り返ると、AIの挙動との付き合い方長い対話を安定させる方法状態管理の仕組みといった、少し技術的なテーマに繋がっていったようです。(それもChatGPTに整理してもらったのですが) ① なぜ作ったか最近、ニュースを見ていて思うことがあります。まぁまぁいい大人になったのに、わからないことばかりだな、と。例えば、世界情勢をもう少し理解したいと思いました。世界情勢...
15時間前

Mastra v1でエージェントを信頼しない設計:ワークフロー・toolChoice・LLMリスクの使い分け
Zennの「生成 AI」のフィード
日々の調査や問題解決の内容を、自分自身と、同じことに取り組む方のためにもドキュメント化する目的で記事を書いています。長大なコードの掲載は避け、重要なアーキテクチャや設定部分のコードに絞って記載しています。この記事もベースは生成AIに作ってもらったものです。 TL;DRMastra v1でエージェントがツールを呼び出さずにそのまま返答してしまう問題は、ワークフローで呼び出し順を強制することで根本解決できるLLMが絡む部分のリスクは「従わせる・検証する・回復する」の3つのアプローチで対処するtoolChoiceはワークフローを使う場合はほぼ不要で、使うとしても "require...
16時間前

【技術解説】LLMの「筋肉」と「知能」を支える数学:量子化とMoEの深淵
Zennの「生成 AI」のフィード
AIエンジニアとして、ローカルLLM(特に gpt-oss-20b クラス)をいじり倒すと必ずぶつかる壁があります。「なぜ2-bitまで削っても賢いのか?」「なぜ20Bモデルが14GBのVRAMで爆速で動くのか?」今回は、その裏側にある数学的メカニズムを、ヘッセン行列から量子化アルゴリズムまで一気に解説します。 1. 量子化の魔法:なぜ「削ってもバカにならない」のか?通常、モデルの重みは FP16(16ビット浮動小数点数) で保存されています。これを 2-bit や 4-bit に落とす「量子化」は、一見すると情報の 75% 以上を捨てる暴挙に見えます。しかし、そこには数学的な「...
1日前

AI開発のspec管理、2層だと壊れた。3層にしたら解決した
Zennの「生成 AI」のフィード
仕様書(spec)の管理構造を2層から3層に変えた。きっかけは、Claude CodeのAgent Teams(複数のAIエージェントにチーム開発させる実験的機能)で開発を回す中で、「どっちのspecが正しいの?」がわからなくなったこと。2層だとSSOT(Single Source of Truth: 唯一の正しい情報源)が壊れる場面がある。3層にしたら判断に迷わなくなった。!これまでの流れ:1回目: Agent Teamsで5人のAIチームに開発を任せてみた2回目: AIチームにPDCAを回させる仕組みを作った3回目: 共有ファイル(掲示板・議論ボード)で協調を改善し...
1日前

仕様駆動開発 × 生成AI活用で実装品質を高める方法
Zennの「生成 AI」のフィード
はじめにAIによるコード生成が広く使われるようになり、「プログラミングスキル」よりも「何を作るかを明確に言語化する力」が重要になっています。しかし多くのプロジェクトでは、仕様が曖昧実装がチームによってばらばら結果としてバグや認識ズレが発生といった問題が起きています。そこで有効なのが 仕様駆動開発(Specification-Driven Development)× AI活用 です。この記事では、初心者でもわかるように、仕様駆動開発とは何かなぜAIと相性が良いのか実務でどう使うかを整理します。 そもそも、仕様駆動開発とは?仕様駆動開発とは、先...
1日前

OpenAI SDK で Amazon Bedrock を使う — Mantle の実動作モデルを調べた
Zennの「生成 AI」のフィード
調査日: 2026-03-07 はじめに2026年2月26日、AWS は Amazon Bedrock の Mantle 推論エンジン における OpenAI 互換 Projects API の一般提供をアナウンスしました。Mantle は Amazon Bedrock の新しい分散推論ランタイムであり、Bedrock 上でホストされるモデルを OpenAI 互換の Chat Completions API・Responses API として提供するレイヤです。既存の Bedrock ネイティブ API(Converse API など)とは独立した Inference エン...
1日前

ローカルLLMで完全無料AI音声入力!Handyを使ってみた
2
Zennの「生成 AI」のフィード
こんにちは!データエンジニアの @myshmeh です。現在育休中の身で、両手は子供で塞がっていることが多いです。しかし、ちょっとした調べ物や書き物でパソコン操作したい局面は結構あるので、 Claude x 音声入力でソリューションを検討してました。その文脈で見つけた、 Handy という AI 音声入力の OSS プロジェクトがかなり気に入ったので、本記事でその機能を紹介したいと思います。 育休中に AI 課金はきついよ2026 年において、 Claude Max プラン は人権ですから、そもそも$100/月燃やすことは避けられません。これに加えて、 AI 議事録、 AI 音...
1日前

生成AIで働かないSierはどう変わるのか、M365 Copilot導入後に価値の重心はどこへ移動する
Zennの「生成 AI」のフィード
生成AIの登場は、私たちの働き方を根本から変えつつあります。特に大企業でM365 Copilotの導入が進むと、情報検索、議事録作成、資料作成といった日常業務が自動化され、これまで人が時間をかけて行ってきた作業の多くが一瞬に完了する世界が訪れます。Sierにとってこの大変化は脅威であると同時に大きな転換点でもあります、作業を提供するビジネスモデルは確実に縮小しますが、同時に「人にしかできない価値」がより鮮明に浮かび上がってきます。生成AIによって奪われる業務、逆に残る・伸びる価値、そしてCopilot導入後の未来のSier像について、AIが仕事を奪うのではなく、仕事の重心を移動させ...
1日前

生成AIを使用したWebアプリ開発のTips ~機能劣化対策~
Zennの「生成 AI」のフィード
本日は私が生成AIを活用したWebアプリを開始して1,2か月くらいで得たノウハウをお伝えします。※ 現在は生成AIの能力が格段に上がっていて、ここに示すような課題は少なくなっていますが、 それでもある程度は発生しますし、 この考え方はアプリ開発以外にも生成AIとの協業において役に立つと思います。課題と目的課題: 生成AIを使用してWebアプリ開発をする際に機能を追加をしようとすると、 追加機能は実装されるものの、すでに実装されていた機能がなくなることがある。 ⇒つまり機能の劣化が発生する。目的: 生成AIによるWebアプリ開発の改訂における機能劣化を...
1日前

蒸留から醸造へ—次世代LLMに必要な設計思想の転換
Zennの「生成 AI」のフィード
違和感は信じてよい。ただし、丸呑みはしないこと。本稿は、Medium先行公開記事[Beyond Distillation: Brewing the Next Generation of LLMs]https://medium.com/@fdmiruto/beyond-distillation-brewing-the-next-generation-of-llms-71305da76e59の逆輸入日本語版である。 仮説:問いは「生成」するものではない私の作業仮説はこうだ。「問い」とは、ゼロから生み出すものではない。すでに私たちの経験の中の**違和感(ノイズ)**とし...
1日前

ジュニアこそ気を付けたい、AIの「レリック」
Zennの「生成 AI」のフィード
あらすじ 【実録】ジュニアエンジニアのとある一日今回の個人開発のテーマは、Gemini APIを使ったSlack上でのナレッジ検索AIでした。いつものように、Geminiに相談しながら、システムを設計し、コードを書き始めました。適宜解説してもらいながら、コードを書き、実行する。エラーが出て、エラーの内容について相談しながら解決策を探る。しかし、どれだけ対策を講じても、このエラーは解消できませんでした。Message: 404 NOT_FOUND. {'error': {'code': 404, 'message': 'models/text-embedding-00...
1日前

OpenAI / Anthropic / Google / Microsoft の思想の違い
Zennの「生成 AI」のフィード
最近のAIの議論は、ほとんどが次のようなものだ。GPTの魅力が薄まったClaudeが長文やコード生成に強いGeminiの性能が高いつまり モデル性能の比較である。しかし少し視点を引くと、もっと重要なことが見えてくる。AI企業はそれぞれまったく違うものを作ろうとしている。この違いは、ポケモンの進化に似ている。最初は似た能力だった存在が、進化すると全く違う方向の能力を持つ。AIも同じで、LLMという同じ技術から 異なる進化ルートが生まれている。この記事では、その進化を整理してみる。AIの初期形態最初期のLLMはだいたい同じ能力だった。チャット文章生成要約つま...
1日前

事例から学ぶ企業でのコーディングエージェントの内製やハーネスの作り方
1
Zennの「生成 AI」のフィード
世はコーディングエージェント時代。もはや開発者のパートナーとして、個人的には利用制限に到達するとGithub以上に仕事が止まる依存度の高い存在になりました。そんなコーディングエージェントですが、調べてみると内製、もしくはコーディングエージェントの周囲に自社ならではの仕組みを構築してる企業も多いです。例えば、Stripeの「Minions」は週1000件以上のPRをマージしているそうです。Rampの「Inspect」はPRの30%近くを生成しており、Spotifyに至っては、トップエンジニアが2025年12月以降コードを一行も書いていないと決算で話しています。エンジニアとして純粋...
2日前

Grokkingを10分で再現する — モデルが"突然目覚める"瞬間を可視化で追う
Zennの「生成 AI」のフィード
1. はじめに2022年、OpenAIの研究者たちは奇妙な現象に気づきました。小さなTransformerモデルを算術タスクで訓練し、そのまま放置して旅行に出かけた。帰ってきてログを確認すると、とっくに過学習していたはずのモデルが、いつの間にか完璧な汎化性能を獲得していたのです。Train Lossが0になった後も学習を続けると、ある瞬間に突然Test Accuracyが急上昇する。この現象は Grokking(グロッキング) と名付けられました。「過学習したら学習を止めるべき」というEarly Stoppingは深層学習の常識でしたが、Grokkingはこの常識を真っ向から覆...
2日前

10年越しの「塩漬けC言語コード」を、Geminiに「全文コピペで」と頼み続けてFlutterに転生させた話
Zennの「生成 AI」のフィード
はじめにこんにちは。普段は『箱庭小駅伝』シリーズというシミュレーションゲームを作っている個人開発者です。最近、完全オフラインで動くスマホ向け機械学習アプリ『箱庭小AI』をリリースしました。実はこのアプリ、10年前にC言語で書いて挫折し、ずっと「塩漬け」にしていたコードがベースになっています。当時は数学もAIも素人同然。そんな私が、生成AI(Gemini)という最強の通訳を介して、どうやってこの遺産を現代に蘇らせたか。その「生々しい」開発記録を公開します。 1. 10年前の遺産:freeの解放漏れに怯えた「泥臭いC言語」10年前、私はニューラルネットワークを自作しようと格闘...
2日前

AIエージェント時代の開発手法 ── Issue駆動開発で属人化・セッション断絶・品質問題を一挙に解決する
Zennの「生成 AI」のフィード
はじめにAIエージェントを使ったソフトウェア開発が急速に普及しています。Claude Code、Codex、Cursorなど、AIが直接コードを書いてくれる時代になりました。しかし、実際にAI開発を本格運用してみると、こんな壁にぶつかりませんか?セッションが切れるたびにAIが文脈を忘れるAIが何を考えてそのコードを書いたのか分からない自分しか作業を引き継げない(属人化)複数人開発で手戻りが頻発する私はこれらの課題を 「Issue駆動開発」 という手法で解決し、実際のプロジェクトで運用してきました。そして2026年3月、OpenAIが発表した Symphony が、ま...
2日前

GraphRAGを実際に構築して分かった「使うほど賢くなるAI」の仕組み
41
Zennの「生成 AI」のフィード
はじめに ─ 「AIに文書を読ませる」だけでは足りなかった最近、「社内の文書をAIに読ませて質問に答えさせる」という仕組みを耳にする機会が増えました。いわゆる RAG(Retrieval Augmented Generation) です。これ、確かに便利なんです。マニュアルや規則集をAIに渡しておけば、「この手続きどうやるの?」と聞くだけで答えが返ってくる。でも、実際に数千件のドキュメントを扱うシステムを作ってみて気づいたことがあります。「文書を読ませる」だけでは、AIは賢くならない。人間が知識を使うとき、「AならばB、BならばC」と 知識のつながり を辿って考えますよね。...
3日前

【無料】Google LabsのFlowで漫画を作成してみた【Nano Banana 2】
Zennの「生成 AI」のフィード
はじめにマンガでわかるRustの所有権という記事を投稿しました。https://zenn.dev/tkithrta/articles/92393e2c56e80e元々Nano Banana ProやNano Banana 2をGoogle LabsのFlowで使っていたのですが、Nano Banana 2は以前のNano Bananaとは比べ物にならないほど日本語文字の生成がうまく、ひょっとすると漫画を無限に生成できるのでは? と思い今回試してみました。 プロットの作り方まずは漫画のプロットを作成する必要があるので、Google AI Studioにアクセスして、Gemi...
3日前

AIグルーヴシーケンサーを作る:LLM連携編
Zennの「生成 AI」のフィード
「サルサ。クラーベのリズムにコンガとカウベルを乗せて、ラテンっぽく」と打ち込んだら、返ってきたのがこれだった。 |1---2---3---4---|1---2---3---4---|clave |----x-----x-----|x-----x-----x---|cowbell |x---x---x---x---|x---x---x---x---|conga_hi |------o-------o-|------o-------o-|conga_lo |o-------o-------|o-------o-------|timbale |...
3日前