Zennの「機械学習」のフィードのフィード

Zennの「機械学習」のフィード

フィード

Zennの「機械学習」のフィード

日本企業の約4割が生成AIを導入済みで、AI活用は「定型業務」から「企画創造などの非定型業務」へと主戦場が移行しています。業界・部門によって活用レベルに大きな差があり、情報・専門サービス業や研究開発部門が先行しています。AI導入の課題は初期段階では「コスト・ROI」、活用段階では「セキュリティ・データ品質」へと変化します。すでに成功体験を持つ企業ほど今後の投資意向が高く、AI導入格差が拡大する傾向にあります。https://www.nri.com/jp/media/column/extending_society_with_ai/20251203.html 深掘り深掘りを...

11時間前

基礎から理解するラプラススムージング

Zennの「機械学習」のフィード

この記事は「UEC Advent Calendar 2025」2日目の記事です(遅刻してすみません)。https://adventar.org/calendars/115711日目の記事はolffさんの「電通大将棋部の1年」でした。将棋部ってどのような活動をしているのかあまり知らなかったのですが、楽しく読ませていただきました。https://note.com/olff/n/n0499b34418a0 はじめにTANという多値分類モデルでは、教師データから事象の起こりうる確率または条件付き確率を計算し、その結果を利用して未知のデータに対して分類の予測を行うといったことをします。...

15時間前

加速度計測を用いずに物理的整合性を保ったラグランジュ制御モデルの学習

Zennの「機械学習」のフィード

この記事では、機械学習分野の最新の arXiv 論文をもとに、大まかな内容を日本語で分かりやすく解説し、その内容を4コマ漫画形式の画像として生成しています。論文情報arXiv ID: 2512.03035v1著者: Ibrahim Laiche, Mokrane Boudaoud, Patrick Gallinari, Pascal MorinarXiv: https://arxiv.org/abs/2512.03035v1PDF: https://arxiv.org/pdf/2512.03035v1.pdf 📘 漫画でざっくり理解！ 🧠 論文の内...

18時間前

声を自由にデザインできる音声合成モデルMaya1を使ってみた

Zennの「機械学習」のフィード

はじめにMaya Researchが開発したMaya1は、テキストで声の特徴を記述するだけで、様々な声質・感情・アクセントを生成できる最先端のオープンソース音声AIモデル(TTS)です。Llamaベースの3B TransformerモデルとSNACニューラルコーデックを組み合わせた、言語モデルによる音声生成という新しいアプローチを採用しています。https://huggingface.co/maya-research/maya1 Maya1の基本アーキテクチャMaya1はBERT-VITS2のような従来のTTSモデルとは異なり、Language Model（LM）ベース...

19時間前

重要なのものを見つけるには？PageRank VS GNN

Zennの「機械学習」のフィード

!この記事は、GMOペパボエンジニア Advent Calendar 2025 の3日目の記事です。私はグラフ理論やグラフ構造、グラフニューラルネットワークといったものに、学生時代から取り憑かれてしまっている。アドベントカレンダーの記事を書くにあたって、得意領域の「検索」周りで何か書こうかと考えていたら、頭の中で「一年の終わりに際してグラフ構造を無視して年を越すつもりか！？」というグラフの囁きが聞こえてきたような気がしたので、「検索」と「グラフ」両者にゆかりのある「PageRankアルゴリズム」とその一般化である「グラフニューラルネットワーク」に関する内容で記事を書くことにした。...

1日前

バイブコーディングで視聴数予測シミュレータ作ってみた

Zennの「機械学習」のフィード

どうも、海外向けアニメ配信サービスを開発しているsazです2025年株式会社WWWaveアドベントカレンダー3日目やっていきましょう今回は、自社のアニメ配信サービスにおけるアニメ作品の視聴数予測シミュレータをバイブコーディングしてみたのでその紹介です視聴数予測シミュレータって何？新たに配信したい候補作品が自社サービスでどれくらい視聴数を取れそうなのか？これを予測するシステムです配信作品を調達する時、予測視聴数を元にしてどれくらいの金額(ロイヤルティ)を支払えるのかを算出する必要がありますその視聴数およびロイヤルティを自動で算出してくれます開発のきっかけ調達スピー...

1日前

行列補完（Matrix Completion）による因果推論

Zennの「機械学習」のフィード

はじめにこの記事は以下の論文に基づき議論を進めます．https://www.tandfonline.com/doi/full/10.1080/01621459.2021.1891924https://arxiv.org/abs/1710.10251施策の効果検証において，「もし施策を行っていなかったらどうなっていたか」という反実仮想を推定することは，データサイエンティスト，データアナリストにおける最も重要な，かつ困難なタスクの一つです．例えば，地域や店舗単位の施策評価において，合成コントロール法（Synthetic Control Method: SCM）は現在，多くの現...

1日前

【Notion】Kaggle/個人開発の効率を最大化する「3層構造ダッシュボード」構築術

Zennの「機械学習」のフィード

はじめに：なぜ「1画面」にこだわるのかこんにちは、TransMedia Tech Labに所属しているB1の秋山知輝です。開発プロジェクトやデータ分析コンペ（Kaggleなど）、大学の課題……。複数のプロジェクトを抱えていると、こんな状況に陥りがちではありませんか？スケジュールはGoogleカレンダー、タスクはToDoアプリ、資料はローカルフォルダ……とツールを行き来するコストが高い。「あのコンペの提出ファイル、最新版はどこだっけ？」と探す時間が発生する。全体像が見えず、目の前のタスクに追われて納期直前に焦る。これらを解決するために、Notionのデータベース機能を活...

1日前

モダンなPython開発環境の技術スタック【uv / Ruff / ty / Taskfile etc.】

Zennの「機械学習」のフィード

はじめにこの記事はサイバーエージェント26卒内定者 Advent Calendar 3日目の記事です。昨今の生成AIブームも相まって、Pythonの需要はますます高まっています[1]。幸いなことに、uv・Ruff・ty といった高速で便利なRust製ツールが充実してきたおかげで、Pythonの開発環境構築は以前よりも格段に容易になりました。ここ数年はツールの進化が激しく、自分自身も試行錯誤を繰り返してきましたが、最近ようやく構成が安定してきました。この記事では、自分が現在使っている Python開発環境の概要や、その他のTipsをご紹介します。詳細な使い方については、各...

2日前

なぜあなたの画像検索は失敗するのか（ColPali + マルチベクトルインデックスで解決する方法）

Zennの「機械学習」のフィード

問題点：従来の画像検索がなぜ失敗するのか画像検索システムを構築しようとしたことがあれば、その苦労を知っているでしょう。従来のアプローチでは、画像全体を1つの密なベクトルに圧縮します。つまり、複雑な視覚シーンを高次元空間の1点に押し込めているのです。何が失われるのでしょうか？空間的なレイアウトと位置情報散らばったシーン内の複数のオブジェクトチャート、図、テキスト領域などの細かいディテール精密なマッチングに重要なローカルセマンティックコンテキスト技術マニュアルで「データベースアーキテクチャを示す図」を検索することを想像してください。グローバルベクトルでは、その図がペー...

3日前

【生成AI】拡散モデルの影の立役者「AdaLN」を語らせてくれ

Zennの「機械学習」のフィード

はじめに「最近の画像生成AI、論文読むのが追いつかないよ」と嘆いているのは私だけではないはずだ。Stable Diffusion 1.5やSDXLが覇権を握っていた頃、私たちはU-Netの構造を数えないくらい見てきた。ResNetブロックがあって、CrossAttentionがあって……というあのお決まりの形だ。しかし、時代は変わった。FluxやQwenImage、そして最近話題のZ-Imageなど、SOTA（State-of-the-Art）を叩き出すモデルたちは、こぞってDiffusion Transformers (DiT) ベースに移行している。U-NetからTrans...

3日前

Snowflake モデルレジストリの運用を真剣に考えてみた

Zennの「機械学習」のフィード

MLOpsではモデルのバージョン管理をして、本番環境のモデルを安全に交換・維持していくということを考えなくてはなりません。この記事ではSnowflakeでMLモデルを管理する上で、モデルのライフサイクルと各環境をどのように使い分けていくかを整理しました。企業やチームの思想によって許容できない部分もあると思いますが、あくまで一例として読んで頂ければ幸いです。実現したいこと大きく分けて以下三点を実現するための手法を考えます。開発環境/検証環境/本番環境を分離したい各環境には後述の役割があります。CI/CDと合わせて良い感じに分離します。検証環境で検証したモデルを本番環境で...

3日前

投資xAIで勉強してきたことまとめ

Zennの「機械学習」のフィード

!この記事は、投資とAI（機械学習）の交差点に興味を持ち、実際に学習を進めてきた記録とリソースのまとめです。はじめに近年、個人のPCスペック向上やPythonライブラリの充実により、個人でも高度な金融データ分析やバックテストが可能になってきました。「投資 x AI」の領域は非常に奥が深く、どこから手をつければ良いか迷うことも多いです。今回は、私がこの領域を学ぶにあたって実際に取り組んだMOOC（オンライン講座）、読み込んだ専門書、そしてインスピレーションを受けた読み物を体系的にまとめます。これからクオンツトレードやファイナンス機械学習を学びたいエンジニアの方々の参考になれば...

4日前

機械学習ワークロードを GKE に移行している話

Zennの「機械学習」のフィード

はじめにこちらはキャディ株式会社のアドベントカレンダーに寄稿しています。こんにちは、キャディの Analysis Platform Group でバックエンドエンジニアをしています、廣岡です。普段は機械学習推論のためのインフラやバックエンド構築・運用を主に担当しています。私たちのチームでは Google Cloud のマネージドサービスを使って機械学習システムを構築してきました。しかしここ最近で、運用の複雑化とワークロードの増加により基盤の見直しを検討しました。ここではキャディ内の機械学習ワークロードを既存のマネージドサービスから Google Kubernetes Engi...

4日前

ファイルフォーマット判別ツールMagikaのONNXモデルを動かしてみる

Zennの「機械学習」のフィード

Google製のファイルフォーマット判別ツールMagikaの1.0が公開されたというニュースが今月ありました。https://www.publickey1.jp/blog/25/googleaimagika_10rust200.htmlMagikaはファイルフォーマットの推測にONNXモデルを使っているので、機械学習もまともにやったことが無い人間だけど、折角だからこれで入門してみようと思います。モデルの入手MagikaのモデルはGitHubで公開されているリポジトリーのassets/modelsディレクトリーにあります。最新のstandard_v3_3ディレクトリーからmo...

4日前

【叫べるAI音声】Style-Bert-VITS2で感情表現AIを育てる奮闘記──コーパス構築・録音編集・独自フローの裏側

Zennの「機械学習」のフィード

はじめに私は AIVtuber「零音ほのか」を運営しており、彼女の音声合成や配信ツール、AIモデル連携まで、すべてをゼロから開発しています。ほのかは、甘くて寄り添う声質自然で感情が乗るAI音声AIでは珍しい“叫び”まで表現できる音声モデルを特徴としたAI Vtuberです。https://www.youtube.com/@reinehonokaこの記事では、“ほのかの叫び声”、そして“感情表現AI”を実現するために、私が個人開発として行ってきた奮闘の裏側をまとめました。技術の網羅解説というよりは、**「こうやって私は感情AIを育てた」**という一つの実...

4日前

Monarch 行列によるNNの効率化

Zennの「機械学習」のフィード

はじめにこの記事は論文 [1] "Monarch: Expressive Structured Matrices for Efficient and Accurate Training" の解説です。要旨を一言で言うと、Monarch 行列という新しい構造化行列を提案し、これをニューラルネットワークの重み行列として用いることで、計算効率（GPU での実行速度）と表現力（FFT や畳み込みなどを表現可能）を両立させ、End-to-End の学習高速化や、事前学習済みモデルの圧縮・ファインチューニングの効率化を実現した、という手法になります。具体的には、行列のパラメータ数\mathc...

4日前

Azure ML パイプラインを公開して、実行してみた

Zennの「機械学習」のフィード

はじめに本記事では、Azure Machine Learning（Azure ML）で作成したパイプラインを公開し、ローカルから実行させてみたので、その手順を紹介します。Azure ML のパイプラインを REST API 経由で実行できるようにすることで、以下のようなメリットがあります。CI/CD パイプラインからの自動実行外部システムとの連携スケジュール実行や条件付き実行の実装チーム間でのパイプライン共有前提条件以下の前提で話を進めます。Azure サブスクリプションを持っていることAzure ML ワークスペース、パイプラインが作成済みであること...

4日前

私が持っている書籍一覧を公開します！！

Zennの「機械学習」のフィード

今回は、私が持っている書籍をブクログに登録して公開しました！!直近かなりKindle上で読んでいるのですがまだインポートできておらず、以下で共有しているのは紙媒体の書籍に限りますKindle上の書籍についても近々アップロードしようと思いますブクログとは？ブクログとは本の感想や評価をチェックしたり、webやアプリで本棚を作成して感想やレビューを書いたりすることができるサービスになります。私自身自分が持っている書籍を電子データとして管理したいと思った時に見つけたサービスですが、他の方と共有できる機能は便利だと思って使いはじめました。https://booklog.jp/...

4日前

【LLM】Long Context + Short Instruction (LCSI) との格闘記：評価・データ・アーキテクチャの急所

Zennの「機械学習」のフィード

!Note regarding Language:I am preparing to move to Japan and learning Japanese.My Japanese level is currently N4 (still learning!), so I used Grok (AI) to help translate and polish this article from my original English draft.If there are any unnatural expressions, please blame the AI! 🤖Engli...

5日前