Zennの「ディープラーニング」のフィード

フィード

記事のアイキャッチ画像
論文紹介"Deep IV", 深層学習×因果推論での反実仮想予測モデル
Zennの「ディープラーニング」のフィード
Deep IV — 操作変数 × 深層学習で反実仮想を推定する“Deep IV: A Flexible Approach for Counterfactual Prediction” (Hartford et al., 2017):contentReference[oaicite:0]{index=0}今回は、"Deep IV: A Flexible Approach for Counterfactual Prediction"という論文を紹介します。深層学習に因果推論を掛け合わせ、反実仮想の精緻な予測を可能にした画期的な手法論文です。紹介論文:Hartford, J., L...
1日前
記事のアイキャッチ画像
Windowsで深層学習環境(Linux + Radeon)を構築する
Zennの「ディープラーニング」のフィード
はじめに皆様〜お久しぶりです。前回からずいぶん時間が経過してしまいました。この間資格取得や転職活動などバタバタしておりました。色々ネタは用意していたんですが、ここ最近のAIの進化スピードが異常なため執筆の機会を失ってしまい…。と、言い訳はこの辺にしておき無事転職と参画案件も決まったためブログの執筆を再開していくことにしました。間違いが出てくると思いますが、そこは優しく指摘してくださると今後の励みになります!さて、ここから本題です。前回はOllamaを使ってdeepseek-r1を実際に使ってみましたが、今回から本格的に学習も含めてローカルLLMで遊んでみることになりました。...
6日前
記事のアイキャッチ画像
【個人開発】AI学習の"次の一冊"が見つかる!教材ライブラリ「SAKAItechLibrary」を公開しました
Zennの「ディープラーニング」のフィード
皆さん、こんにちは!この度、「未来を創るAI技術を、深く・体系的に学ぶ」をコンセプトにした電子書籍・教材のライブラリサイト SAKAItechLibrary を個人開発しました。Webサイトはこちらhttps://sakaitechlibrary.web.app/「AIを学びたいけど、どの本から読めばいいかわからない…」「自分のレベルに合った、実践的な教材が見つからない…」そんな悩みを解決するための一助となればと思い、このサイトを開発しました。 「SAKAItechLibrary」とは?AI・機械学習・深層学習の分野に特化した、書籍や教材を探せるライブラリサイトです。...
11日前
記事のアイキャッチ画像
kaggle suguuuu 金メダルや対外発表メモ
Zennの「ディープラーニング」のフィード
はじめにGMになったよ記事のためにURLを残しておく。金メダルとってるのはAll Team Sonyだぜ!ソニーエンジニア カグル部のAIパワーを魅せるぞい!しかし、あと一枚はソロ金。。。※個人の発言、カグル部は机の下活動です。 1枚目 Hubmap 2023/8: 10thコンペURLhttps://www.kaggle.com/competitions/hubmap-hacking-the-human-vasculature/overview会社記事https://www.linkedin.com/posts/sony_technology_ソ...
15日前
記事のアイキャッチ画像
頑張ってるのに精度が上がらない…そんなAI開発の"最後のひと押し"をデータ拡張で実現しませんか?
Zennの「ディープラーニング」のフィード
もう「データが足りない」とは言わせない。AI精度を劇的に向上させる"データ拡張"実践講座、作りました。こんにちは!AI開発者・講師のSAKAIです。この記事を読んでくださっている皆さんは、きっとAI、特に画像認識モデルの開発に日々奮闘されていることと思います。突然ですが、こんな経験はありませんか?「頑張ってAIモデルを組んでみたけど、なぜか精度が頭打ちになってしまう…」「もっと学習データがあれば精度が上がるはずなのに、収集やアノテーションのコストと時間が…」「"データ拡張"が良いらしい、とは聞くけど、具体的にどう実装すれば効果的なのか分からない…」もし少しでも「ある...
16日前
記事のアイキャッチ画像
手を動かして完全習得!CNN実装入門
Zennの「ディープラーニング」のフィード
AIの「眼」を作るスキル、身につけませんか?本講座は、画像認識AIの核心「CNN」を、初学者でも実装できるようになるための実践コースです。豊富な図解で理論を学び、すぐにGoogle Colabで手を動かす。このサイクルで、環境構築でつまずくことなく、AIを「作る」力が身につきます。実用的な「転移学習」を使いこなし、あなただけのAIを完成させましょう。「作れた!」という達成感が、あなたを"AIを使う側"へと導きます。
17日前
記事のアイキャッチ画像
「AIが自分で学ぶってどういうこと?」その疑問、Pythonで迷路AIを作りながら解決しませんか?
Zennの「ディープラーニング」のフィード
はじめまして!本講座で講師を務めるSAKAIです。普段は開発者として働きながら、UdemyでプログラミングやAIに関する講座を公開しています。突然ですが、皆さんは「強化学習」と聞いて、どのようなイメージをお持ちでしょうか?「なんだかすごく難しそう…」「記事を読んだけど、数式や専門用語ばかりで挫折してしまった…」「AIに興味はあるけれど、何から手をつければいいか分からない…」もし、あなたが少しでもこのように感じたことがあるなら、ぜひこのまま少しだけ読み進めてみてください。きっと、お役に立てるお話ができると思います。 なぜこの講座を作ったのか何を隠そう、私自身も強化学習を...
20日前
記事のアイキャッチ画像
AI画像認識の「なぜ?」がわかる!ゼロからPythonで学ぶCNN講座を作りました
Zennの「ディープラーニング」のフィード
はじめまして!Udemy講師のSAKAIです。この記事を読んでくださっているあなたは、「AIやディープラーニングって、なんだか難しそう…」「CNN(畳み込みニューラルネットワーク)に興味はあるけど、何から手をつけていいか分からない…」「画像認識をやってみたいけど、プログラミング経験がなくて不安…」そんな風に感じて、学習の一歩を踏み出せずにいませんか?もし少しでも心当たりがあれば、ぜひこのまま読み進めていただけると嬉しいです。きっと、あなたのための講座だと感じていただけるはずです。 なぜこの講座を作ったのか(私の開発ストーリー)何を隠そう、私自身もAIの学習で何度も壁...
20日前
記事のアイキャッチ画像
プログラミング未経験者へ。あなたのPCで「りんご」を自動で見分けるAIを作ってみませんか?
Zennの「ディープラーニング」のフィード
はじめまして!本講座で講師を務めます、開発者のSAKAIです。突然ですが、あなたはこのように感じていませんか?「AIや深層学習って面白そうだけど、何だか難しそう…」「プログラミング経験もないし、数学も苦手だから自分には無理かも…」「分厚い専門書を買ってみたけど、数式ばかりで挫折してしまった…」もし一つでも当てはまったなら、ぜひこのまま少しだけ読み進めてみてください。なぜなら、何を隠そう過去の私が全く同じ悩みを抱えていたからです。 なぜこの講座を作ったのか(私の想い)私が初めてAIや深層学習の世界に触れたとき、その可能性に心からワクワクしました。しかし、学習を進めよう...
20日前
記事のアイキャッチ画像
【入門】フローマッチングのエッセンス
Zennの「ディープラーニング」のフィード
はじめに2025年、生成AIの世界は新たな変革期を迎えています。拡散モデルが切り拓いた高品質なデータ生成の地平は、さらに効率的で柔軟な「フローマッチング(Flow Matching, FM)」というパラダイムへと進化を遂げようとしています。Meta AIが発表した「Flow Matching Guide and Code」(arXiv:2412.06264v1) は、このフローマッチングの数学的基盤から最新の拡張、さらにはPyTorchによる実装までを網羅した包括的なガイドであり、本記事はこのガイドを元に、フローマッチングのエッセンスを可能な限りわかりやすく紐解いていくことを目指し...
21日前
記事のアイキャッチ画像
ゼロからつくるDeepLearning 2 格闘日誌5/30 5章
Zennの「ディープラーニング」のフィード
ゼロから作るDeep Learning 2を友達と読んでいます.本記事は本書の内容かつ,留学中の授業内の内容のノートです.読者対象はゼロから作るDeep Learning 実装が終わったくらいの方,Deep Learning 2を読んでいる方です.!以下のコードはゼロから作る Deep Learning 2のコードを複写/一部改変しています.利用の際には十分に注意し,本書の記述に従ってください. 5章 RNN・FFNNの問題点とRNNの登場(FFNNの問題点)時系列データ(Sequence)を扱えない.単純なFFNNは,時系列データを十分に学習できない.(理由)FFN...
25日前
記事のアイキャッチ画像
G検定(JDLA Deep Learning for GENERAL 2025#3)に合格したので振り返り
Zennの「ディープラーニング」のフィード
2025年5月のG検定(JDLA Deep Learning for GENERAL 2025#3)に合格したので振り返りをする モチベーションAI時代のリスキリングとして、AI関連の基礎知識を体系的に学ぶために始めました。 どんな勉強をしたか4/12 「ディープラーニングG検定公式テキスト(第二版)」を読み始める初回の読書メモを次にまとめています。 https://zenn.dev/skakimoto/articles/2025-04-12-books-deeplearning-for-general4/24 「ディープラーニングG検定公式テキスト(第二版)...
1ヶ月前
記事のアイキャッチ画像
ゼロから作る DeepLearning 2 格闘日誌5/24 4章
Zennの「ディープラーニング」のフィード
ゼロから作るDeep Learning 2を友達と読んでいます.自分用のまとめかつ,補充知識として重要なことを書いています.読者対象はゼロから作るDeep Learning 実装が終わったくらいの方,Deep Learning 2を読んでいる方です.!以下に示すコードはゼロから作る Deep Learning 2のコードを複写/一部改変しています.利用の際には十分に注意し,本書の記述に従ってください. 4章 word2vecの高速化CBOWモデルでは,コーパスの増加につれ計算時間コストが増大する→word2vecの高速化に挑むEmbeddingレイヤを導入損失関数...
1ヶ月前
記事のアイキャッチ画像
ゼロから作る DeepLearning 2 格闘日誌5/6 3章
Zennの「ディープラーニング」のフィード
ゼロから作るDeep Learning 2を友達と読んでいます.自分用のまとめかつ,補充知識として重要なことを書いています.読者対象はゼロから作るDeep Learning 実装が終わったくらいの方,Deep Learning 2を読んでいる方です.!以下に示すコードはゼロから作る Deep Learning 2のコードを複写/一部改変しています.利用の際には十分に注意し,本書の記述に従ってください. 3章2章に引き続き単語の分散表現を得る方法を見ていく.推論ベースの方法:ニューラルネットワーク,word2vecシンプルで分かりやすい/処理効率は犠牲 3.1 推論...
1ヶ月前
記事のアイキャッチ画像
【入門】拡散モデルのエッセンス
Zennの「ディープラーニング」のフィード
はじめに2025 年のいま、拡散モデルは静止画だけでなく 動画・テキスト へと射程を拡げています。たとえば OpenAI の Sora は最長 1 分の映像を一括生成し、拡散的アプローチが時空間モデリングでも威力を示すことを証明しました。さらに Google DeepMind が Google I/O 2025 で発表した Gemini Diffusion は “テキストを拡散で生成する” という大胆な試みで、従来の自己回帰型 LLM を遥かに凌ぐ低レイテンシを目指しています。こうした急激な進歩が示すのは、「拡散」という魔法のようなアイデアが依然として生成 AI の中心にあり続け...
1ヶ月前
記事のアイキャッチ画像
🐄 音と動きのマルチモーダルで牛の摂食行動を高精度に検出
Zennの「ディープラーニング」のフィード
こんにちは!やきとりです。今回は、牛の摂食行動を音と動きの信号で高精度に検出するためのマルチヘッド深層融合モデルに関する論文を紹介します。 元論文情報タイトル:A multi-head deep fusion model for recognition of cattle foraging events using sound and movement signals著者 :Mariano Ferrero, José Omar Chelotti, Luciano Sebastián Martinez-Rau, Leandro Vignolo, Martín Pires, J...
1ヶ月前
記事のアイキャッチ画像
🧱 MoMa:材料特性予測のためのモジュラー型深層学習フレームワーク
Zennの「ディープラーニング」のフィード
こんにちは!やきとりです。今回は、材料特性予測における多様性と不均一性の課題に対応するための新しいアプローチ 「MoMa」 について紹介します。 元論文情報タイトル:MoMa: A Modular Deep Learning Framework for Material Property Prediction著者 :Botian Wang, Yawen Ouyang, Yaohui Li, Yiqun Wang, Haorui Cui, Jianbing Zhang, Xiaonan Wang, Wei-Ying Ma, Hao Zhou掲載 :arXiv(2025年2...
1ヶ月前
記事のアイキャッチ画像
Pytorch lightning のフックとコールバックについて簡単まとめ
Zennの「ディープラーニング」のフィード
はじめに:Pytorch lightningについてPyTorch Lightning は、PyTorch の柔軟性をそのままに、学習ループや分散処理、ロギング、チェックポイント保存といった煩雑な実装を自動化してくれるラッパーフレームワークです。「モデル定義」と「訓練の仕組み(Trainer)」を明確に分離することで、可読性と再利用性の高いコードを書くことができ、研究・開発の両面で多くの場面で活用されています。つまり、「研究のロジックに集中し、繰り返し書く訓練コードから解放される」のが PyTorch Lightning の最大のメリットです。 訓練のカスタマイズ:フックと...
2ヶ月前
記事のアイキャッチ画像
ニューラルネットワークのPruningについてまとめてみた
Zennの「ディープラーニング」のフィード
PruningとはPruning(枝刈り)は、ニューラルネットワークにおいて重要度の低いパラメータ(重みやノード)を削除することで、モデルをスリム化する手法です。削除されるのは、学習済みのネットワークにおいて出力への影響が小さいと判断された構成要素であり、その判断には様々な基準や手法が存在します。本記事では、Pruningの種類や設計の要素について、MIT 6.5940の内容を基に整理します。Learning both Weights and Connections for Efficient Neural Networks [Han et al., 2015]なお、正確性...
2ヶ月前
記事のアイキャッチ画像
セグメンテーションにおけるデータ拡張と Albumentations の活用
Zennの「ディープラーニング」のフィード
セグメンテーション特有のデータ拡張セグメンテーションタスクでは、画像と対応するマスク(GTマスク)の両方に対して、同じ幾何的変換を適用する必要があります。例えば画像を回転した場合、対応するマスクもまったく同じように回転しないといけないですよね。一方で、画像にはコントラスト調整や色味の補正といった数値的な変換を施したいけど、マスクには何もしたくないという需要もあります。こうした変換処理を毎回手作業で実装するのはかなり手間がかかりますが、Albumentations を使えば、一つの Compose に画像とマスクを同時に渡すだけで、必要な変換を自動的に適用してくれます。 幾...
2ヶ月前