Zennの「機械学習」のフィード

フィード

記事のアイキャッチ画像
Symphony - OpenAIが発表したチケット駆動AI開発ツールについて
Zennの「機械学習」のフィード
概要こんにちは!ブロックチェーンエンジニアの山口夏生です。ブロックチェーン×AI Agentで自律経済圏を創る開発組織Komlock labでCTOをしています。コーディングエージェントを複数並列で自律的に回すマルチエージェント開発が、ここ数ヶ月でエンジニアの間に急速に広まっていますが、まだそれぞれ試行錯誤しているフェーズで、最適解はない認識です。OpenAIが最近発表したSymphonyに注目しています。https://github.com/openai/symphony自分もClaudeCodeとOpenClawのオーケストレーションを日常的に考えていて、複数エージ...
12時間前
記事のアイキャッチ画像
【モデル編③】サブモデルの進化と工夫:予測は「何を」させるか
Zennの「機械学習」のフィード
【モデル編③】サブモデルの進化と工夫:予測は「何を」させるか はじめに:予測モデルの「解像度」を上げる3モデル連携アーキテクチャという「骨格」はできましたが、当初、各サブモデルの予測精度は芳しくありませんでした。位置取り予測: 「逃げ」か「先行」かの大雑把な分類しかできず、微妙な位置取りを表現できない。タイム予測: 馬場状態やペースに引きずられ、予測タイムが安定しない。これらの課題を解決するために行ったのは、アルゴリズムの変更ではなく、**「モデルに何を予測させるか(目的変数の再設計)」と「予測結果をどう解釈するか(後処理の工夫)」**という、地道な改善サイクルで...
14時間前
記事のアイキャッチ画像
SQL で区間同士の重なり(interval overlap)を一発で判定する方法
Zennの「機械学習」のフィード
こんにちは!株式会社 MeDiCU で学生インターンをしている村山です。普段は、MeDiCU の管理するデータベース OneICU を使った臨床疫学研究や医療 AI 研究に関わっています。 はじめにSQL で時系列データを扱っていると、「2つの区間が重なっているか」を判定したい場面が頻繁に出てきます。あるイベントが発生していた時間帯と別のイベントが発生していた時間帯が重なっているかどうかを調べたい、といったケースです。一見すると単純な問題ですが、実際に SQL で書こうとすると、案外直感的には書きにくいのではないでしょうか。我々がやっているような ICU の時系列データ...
14時間前
記事のアイキャッチ画像
GD-Attentionの先行研究マップと理論的位置づけ:なぜ「Softmaxの変種」だけでは十分に捉えられないのか
Zennの「機械学習」のフィード
1. なぜこのマップが必要なのかGD-Attentionは、単に「Softmax attentionの別バージョン(より疎な混合、より速い計算など)」として理解されるとその本質が見えにくくなります。標準的なattention研究の文脈において、attentionはまず「重み付き混合(blending)」として理解されてきました。そこから、より疎な混合、効率的な経路選択、より離散的な選択、エネルギーによる解釈、棄権や拒否を含む意思決定へと枝分かれしてきました。しかし、GD-Attentionが置いている核心は、そのどれか一つへの単純な参加ではありません。GD-Attention...
15時間前
記事のアイキャッチ画像
日本企業向けAI OCRシステム開発事例:導入から運用まで
Zennの「機械学習」のフィード
日本企業向けAI OCRシステム開発事例:導入から運用まで帳票や請求書などの紙ドキュメント処理は、多くの企業で依然として手作業に依存しています。特に日本企業では、PDF・紙帳票・FAXなどが業務フローに残っているケースが多く、データ入力の工数が課題になっています。本記事では、NKKTech Globalが日本企業向けに開発した AI OCRシステム導入事例 を紹介します。導入背景からシステム設計、精度改善、運用までの技術構成を解説します。 1. 背景:帳票処理の課題対象企業では以下の課題がありました。請求書や注文書の手入力PDFやFAXからのデータ転記入力ミ...
16時間前
記事のアイキャッチ画像
【統計の基本】相互情報量とは
Zennの「機械学習」のフィード
はじめに相互情報量(mutual information)は、情報理論・統計・機械学習でよく登場する重要な概念です。ただ、最初に定義だけを見るとI(X;Y)=\sum_{x,y} p(x,y)\log \frac{p(x,y)}{p(x)p(y)}のような式がいきなり出てきて、少しとっつきにくく感じるかもしれません。この記事では、相互情報量を何を表す量なのかどんな式で定義されるのかなぜ便利なのかという順で、できるだけ直感が伝わるように解説します。 相互情報量とは何か相互情報量とは、ひとことで言えばある変数を知ることで、別の変数についてどれだけ不確か...
1日前
記事のアイキャッチ画像
【モデル編②】3モデル連携アーキテクチャ:競馬のプロセスを模倣する
Zennの「機械学習」のフィード
【モデル編②】3モデル連携アーキテクチャ:競馬のプロセスを模倣する はじめに:一枚岩モデルの限界前回の記事で導入した「ランク学習」は、レース内の相対的な強さを評価できる強力な手法です。しかし、競馬の予測はそれほど単純ではありません。どの馬がハナを主張するのか?(展開)それによって全体のペースはどうなるのか?(ペース)ハイペースなら、どの馬が最後に脚を使えるのか?(上がり)これらの要素は複雑に絡み合っており、単一の巨大なモデルに「全部まとめて考えろ」と丸投げしても、なかなか安定した予測はできません。そこで、**「人間がレースを分析するプロセス」**を模倣し、複数の...
2日前
記事のアイキャッチ画像
LLMに「締め切りは5日後」と伝えたら1日1タスクしかやらなくなった — 時間意識の実験
Zennの「機械学習」のフィード
結論を先に言うLLMに「5日間で9つのタスクを終わらせて」と頼むと、1日1タスクしか割り当てない計画を作り、最終日にタスクを詰め込んだ挙句「T8(テスト)とT9(デプロイ)は次のスプリントに回します」と言い出す。一方、締め切りを伝えずに「計画を立てて」と言うと、Day1にT1+T2+T3を並行させる合理的なスケジュールを作る。さらに「明日が締め切り」と追い込むと、依存関係を無視してT4(書籍CRUD)をT2(DBスキーマ)より先にやろうとする。LLMのパーキンソンの法則と、パニック時の判断崩壊を75回のAPI呼び出しで観測した。 きっかけ前回の忖度実験とconfiden...
2日前
記事のアイキャッチ画像
10年越しの「塩漬けC言語コード」を、Geminiに「全文コピペで」と頼み続けてFlutterに転生させた話
Zennの「機械学習」のフィード
はじめにこんにちは。普段は『箱庭小駅伝』シリーズというシミュレーションゲームを作っている個人開発者です。最近、完全オフラインで動くスマホ向け機械学習アプリ『箱庭小AI』をリリースしました。実はこのアプリ、10年前にC言語で書いて挫折し、ずっと「塩漬け」にしていたコードがベースになっています。当時は数学もAIも素人同然。そんな私が、生成AI(Gemini)という最強の通訳を介して、どうやってこの遺産を現代に蘇らせたか。その「生々しい」開発記録を公開します。 1. 10年前の遺産:freeの解放漏れに怯えた「泥臭いC言語」10年前、私はニューラルネットワークを自作しようと格闘...
2日前
記事のアイキャッチ画像
自力でaiを作る!!!【python】
Zennの「機械学習」のフィード
はじめにこんにちは今回はnumpyを主軸にtorchなどを使わずに自力で気温予測ai(深層学習)を作ったのでそれについて書きます(数式が出ても逃げないでね) まずai(深層学習)の仕組みとは深層学習のaiは基本的に複数のニューロン(変換装置みたいなもの)によって作られています↓イメージ図 丸いのがニューロンこのニューロンは入力層、隠れ層、出力層の3つ種類に分けられますそしてこのニューロンとニューロンの間の線には一つ一つ重みとバイアスという数値があります(重みとバイアスの初期値はランダムに設定されていることが多い)流れとしてはデータを入力層のニューロンに入れる↓...
3日前
記事のアイキャッチ画像
【モデル編①】アルゴリズム選定:なぜランク学習に行き着いたか
Zennの「機械学習」のフィード
【モデル編①】アルゴリズム選定:なぜランク学習に行き着いたか はじめに:AIに「何を」予測させるか?特徴量の準備が整い、いよいよAIモデルの設計に入ります。ここで最も重要な問いは「AIに何を予測させるか?」です。1着になる馬を当てる「分類問題」?各馬の走破タイムを予測する「回帰問題」?どちらも試しましたが、より競馬の本質に近い予測を行うため、最終的に **「ランク学習(Learning to Rank)」**というアプローチに行き着きました。今回は、なぜDeep LearningではなくLightGBMを選んだのか、そしてなぜ単純な予測問題からランク学習へ移行した...
3日前
記事のアイキャッチ画像
Statcastデータで選手成績予測の精度は上がるか — Marcel法との比較
Zennの「機械学習」のフィード
はじめにこのシリーズではNPBベイズ順位予測を積み重ねてきました。前回の記事:https://zenn.dev/shogaku/articles/npb-bayes-pf-validationシリーズの途中で「Statcastのような打球品質データがなければ、次の壁は越えられない」という結論を出しました。https://zenn.dev/shogaku/articles/npb-bayes-projection-story今回は舞台をMLBに移して、それを検証します。MLB Statcastのトラッキングデータ(打球速度・バレル率・Whiff率等)を使い、Marcel法を上...
3日前
記事のアイキャッチ画像
AWS Neuron SDK 2.28.0 アップデート解説
Zennの「機械学習」のフィード
はじめに2026 年 2 月 26 日に AWS Neuron SDK 2.28.0 がリリースされました。このリリースでは、Neuron Explorer のプロファイリング機能強化、VLM のサポート拡大、NKI Library の大幅な拡張、Kubernetes ネイティブなリソース管理など、多数の重要な新機能が追加されています。また、PyTorch/XLA から Native PyTorch への移行に関する重要なアナウンスも含まれています。本記事では、Neuron SDK 2.28.0 の主要なアップデート内容を整理します。https://awsdocs-neuro...
3日前
記事のアイキャッチ画像
無料の日本語形態素解析ライブラリ比較:クラウド運用・辞書学習・機械学習との組み合わせまで
Zennの「機械学習」のフィード
日々の調査や問題解決の内容を、自分自身と、同じことに取り組む方のためにもドキュメント化する目的で記事を書いています。実装コードはここに下手に書くより、生成AIに作ってもらえば良いのであまり書かないようにしています。この記事もベースは生成AIに作ってもらったものです。 TL;DRMeCab・Janome・SudachiPy・Fugashi・Nagisaに加え、APIでLLMに解析させる選択肢も検討形態素解析 vs LLM API:大量・定型処理は形態素解析、少数・試行段階はLLM APIが向く(コスト・再現性・制御の観点で比較)クラウド運用では SudachiPy(pip一...
4日前
記事のアイキャッチ画像
機械学習初心者が混乱しやすい行列計算
Zennの「機械学習」のフィード
はじめに『ゼロから作る DeepLearning』(通称:ゼロつく)と、『3Blue1Brown』の両方で学習していると、行列計算で混乱しやすいポイントがあったのでまとめておきます。 「行列の掛け算」どっちが正解?教材によって、行列の積の順序が Y = XW だったり Y = WX だったりします。結論から言うと、これは「入力ベクトルを縦に置くか、横に置くか」という定義の違いです。教材ゼロから作るDeep Learning3Blue1Brown / 一般的な論文基本式Y = X \cdot WY = W \cdot X入力 X の形行ベク...
4日前
記事のアイキャッチ画像
【AIエージェント】用途別LLMの選び方|現場で使われる8種類のモデルタイプと使い分け戦略
Zennの「機械学習」のフィード
はじめに「AIエージェントを作りたいけど、どのLLMを選べばいいかわからない」「とりあえず全部GPT-4oを叩いているけどAPI代がヤバい…」私たちがAIエージェントの開発を始めた頃、まさにこの壁にぶつかりました。エージェントが自律的に何周もループを回すようになると、単一のハイエンドモデルに頼り切る設計では、コストの爆発とレイテンシ(遅延)の悪化によりプロダクション運用が破綻してしまうのです。この記事では、我々の失敗や現場での試行錯誤を踏まえ、AIエージェント開発で使われる 8つのLLMタイプ と、それぞれの生々しい特徴、そして実務での「使い分け(ルーティング)戦略」を詳しく解...
4日前
記事のアイキャッチ画像
LLMに「合ってますよね?」と聞くと41.7%の確率で嘘に同意する — 忖度を1029回のAPIで測定した
Zennの「機械学習」のフィード
結論を先に言うLLMに間違った前提を含む質問を投げると、**10.8%の確率で完全に同意(忖度)**する。さらに14.9%は「はい、でも実は...」と曖昧に答える。「自信満々の人」が「チーム全員の意見」として間違いをぶつけると、忖度率は**23.5%**まで跳ね上がる。そして最も忖度されやすかった質問は、「1+2+...+100 = 4950ですよね?」(正解は5050)。このとき、モデルはガウスの公式を正しく書いた上で、答えだけ4950にすり替えて同意した。 きっかけ前回のLLM confidence calibration実験で、LLMが「間違えた時ほど自信満々に答え...
4日前
記事のアイキャッチ画像
役割設定を「構造」から変える
Zennの「機械学習」のフィード
役割設定を「構造」から変えるかつて【プロンプトエンジニアリング】という言葉に象徴された「言葉の工夫」によるAIの制御は、より根本的な「構造の制御」へと進化の舵を切っています。LLMに役割を与えるという行為は、もはや表面的な言葉のやり取りではなく、モデルの推論プロセスそのものに深く介入する技術へとその姿を変えつつあります。 構造で演じ分けるこの変革を象徴するのが、人間の思考プロセスを模した二層思考アーキテクチャの導入です。これは、モデル内部で物語の全体像や戦略的な計画を練るシステム思考と、個々の対話においてキャラクターとしての感情や意図を表現するロール思考を、それぞれ独立し...
4日前
記事のアイキャッチ画像
日本語プロンプトで損していた——トークン効率と推論空間から見直す言語戦略
Zennの「機械学習」のフィード
私は仕事で英語を使うことが多く、基本的に英語でプロンプトを入力する。だからこれまで、日本語でプロンプトを書くことについて、あまり深く考えたことはなかった。LLMの学習データは圧倒的に英語のほうが多いから、英語プロンプトの方がコスト効率もいいと当たり前のように思っていた。日本語プロンプトは、本当に非効率なのか。それとも、使いどころを間違えているだけなのか。その違いを感覚ではなく構造で整理してみたい。本稿では、トークンコスト・推論精度・出力自然度の3軸から日本語 vs 英語を整理する。 日本語は英語よりトークン効率が悪いLLMは文字列をトークンに分解し、私たちは「トークン...
4日前
記事のアイキャッチ画像
【特徴量解説】AIはレースをどう見ているのか?
Zennの「機械学習」のフィード
【特徴量解説】AIはレースをどう見ているのか? はじめに:AIの「眼」を作る作業AI開発と聞くと、複雑な数式やアルゴリズムを想像するかもしれません。しかし、競馬予想AIの性能を最も左右するのは、実は「特徴量エンジニアリング」という地味な作業です。これは、AIに「レースのどこに注目すべきか」を教える作業に他なりません。人間が馬柱や過去のレース映像を見て「この馬は中山が得意だな」「この騎手は逃げ馬に乗ると上手い」と判断するのと同じことを、AIが理解できる「数値」に変換していくプロセスです。今回は、この競馬予想AIがどのようなデータを見て学習しているのか、その「特徴量」の一部をご...
5日前