Zennの「機械学習」のフィード

フィード

記事のアイキャッチ画像
時間差分学習
Zennの「機械学習」のフィード
前回の記事では、モンテカルロ法によるモデルフリー学習を学びました。モンテカルロ法は実際の経験から学習できる優れた手法ですが、エピソードが終了するまで学習できないという大きな制約がありました。今回は、この制約を克服する時間差分学習(Temporal-Difference Learning;TD学習) について学びます。TD学習の中核となる概念がTD誤差です。この記事では、TD誤差が何を表し、どのように学習を可能にするのかを深く理解していきましょう。 なぜTD学習が必要なのか モンテカルロ法の限界を振り返るモンテカルロ法では、状態sの価値を推定するために、その状態から始まるエピソ...
19時間前
記事のアイキャッチ画像
「AI、完全に理解した」と1時間後に言いたくなる本、作っちゃいました。
Zennの「機械学習」のフィード
「AI、完全に理解した」と1時間後に言いたくなる本、作っちゃいました。「AIってよく聞くけど、何だか難しそう…」「プログラマーじゃないし、自分には関係ないかな…」「環境構築とか黒い画面とか、見るだけでちょっと…」そんな風に思っているあなたへ。めちゃくちゃ分かります。かつての僕も、AIの可能性にワクワクしながらも、専門用語の壁や複雑な準備に何度も挫けそうになりました。こんにちは!SAKAItechです。この度、そんな「AIへの“はじめの一歩”が踏み出せない…」という悩みを、根こそぎ解決するための本を執筆しました!その名も…『AI体験カタログ - 画像生成・文章要約・音...
1日前
記事のアイキャッチ画像
エンドツーエンド(E2E)型自動運転を支える学習データとは?技術動向・作成方法・注意点を解説
Zennの「機械学習」のフィード
はじめに現在、自動運転技術の研究開発は主に二つの技術アプローチに分かれています。一つは従来からの「モジュール型」アーキテクチャであり、物体認識、行動予測、経路計画、制御といった処理を各モジュールで分担する方式です。この方法はシステムの可説明性が高く、日本をはじめとする多くの企業が採用しています。もう一つが近年急速に注目を集める「エンドツーエンド型」(E2E)と呼ばれるアプローチです。この手法では、カメラやセンサーからの入力データから直接、操舵角やアクセル/ブレーキ出力を生成するため、従来のモジュール型アプローチ(認識→予測→判断→制御)とは異なるパラダイムでシステム設計が行われま...
2日前
記事のアイキャッチ画像
Pythonを使って 30分 !Web アプリ開発!
Zennの「機械学習」のフィード
🚀 Cursor と Streamlit で学ぶ Python 入門 - 30 分で Web アプリが作れる時代プログラミングを始めたいけれど、何から手をつけていいかわからない...そんな悩みを抱えている方に朗報です。今回は、AI 搭載コードエディタ「Cursor」と、Python で簡単に Web アプリが作れる「Streamlit」を組み合わせた実践的なコーディング配信の内容をご紹介します。 😒 本当に30分でできるの。。?今回はできる限りシンプルなコードで様々な機能を網羅しています!そして AI 搭載 cursor を仕様することで、コード補完・予測コーディングしてくれ...
2日前
記事のアイキャッチ画像
Claude Codeで機械学習コンペに挑戦!Solafune空き地検出コンペでの実践記録
Zennの「機械学習」のフィード
皆さん、おはよう、こんにちは、こんばんは!!最近、X界隈にてClaude Codeが盛り上がりを見せています。皆さんもご存じとは思いますが、Claude Codeはマジで革新的です。ユーザー側から指示を出すと、自分でタスク分解をして、ガンガンとコードを書いてくれます。瞬殺です。自分で書くよりも何十倍も速いです。ただし、クセが強いです。自分が期待するアウトプットを出してもらうには試行錯誤が結構必要です。指示を出せば後は手放しで、はい完成、なんてマジックはありません。そんな背景もあり、沢山のノウハウ記事も見かけるようになりました。一方、それら記事のほとんどがウェブサイト制作や、Web...
3日前
記事のアイキャッチ画像
Llama-3.1-Swallow-8B-v0.5 Technical Report
はてなブックマークアイコン 2
Zennの「機械学習」のフィード
はじめに本日(2025/06/25)、Swallow ProjectよりLlama-3.1-Swallow-8B-Instruct-v0.5、Llama-3.1-Swallow-8B-v0.5をリリースさせていただきました。チャットボット等の用途で利用される場合は-InstructとついているLlama-3.1-Swallow-8B-Instruct-v0.5を利用してください。今回のモデルもこれまでのSwallowシリーズのモデルと同様にLlama-3.1 LicenseおよびGemmaライセンスに抵触しない限り商用利用可能なモデルとなっています。本モデルの開発は、産総研...
3日前
記事のアイキャッチ画像
LLM生成コードのライセンスをチェックをするコマンドを作成した
Zennの「機械学習」のフィード
サマリLLMにコーディングを任せると、生成したコードが実はソースコードの開示が必要なライセンスに抵触している可能性を考えて、プロジェクト内で自動でライセンスチェックをするコマンドをClaude Codeを使用して作成しました。個人用の発展途上なコマンドではありますが、今後の改修で実用向けになりそうです。 マシンスペックMacBook Air M2 arm64 事前の実験まず初めに、生成AIが作成するコードにライセンスに抵触するものがあるのかを確認するような簡単なプロジェクトを作成しました。ローカルLLMがpython, golang, typescriptのコードを...
4日前
記事のアイキャッチ画像
日本語TTS用の学習データの精度を上げる「ふりがなWhisper」を作った話
はてなブックマークアイコン 37
Zennの「機械学習」のフィード
!この記事の内容はどこかに投稿する予定でしたが、この記事ほぼ同じアイデアを持つ論文が先日arXivに2本も立て続けに発表されたため([1, 2]、ともにINTERSPEECH2025採択)、供養のために公開しています。この記事の最後でそれらの論文も軽く紹介します。 はじめにParakeet株式会社リサーチャーの榎本 (X: @henomoto1025)です。純粋数学で博士号を取りポスドクをしていましたが、音声の分野に興味が移り、現在は音声界隈の研究のキャッチアップをしながら研究開発をしています。今回は、弊社で開発している日本語音声合成エンジンParattsの質を向上させるた...
5日前
記事のアイキャッチ画像
日本語医療特化型LLMの現状と展望
はてなブックマークアイコン 13
Zennの「機械学習」のフィード
はじめにこんにちは、株式会社松尾研究所インターンのhashです。LLMや世界モデルの研究開発に興味があり、その知見や技術を応用する形でAI技術の社会実装に取り組んでいます。近年、ChatGPTやClaude、Geminiといった様々な大規模言語モデル(LLM)が登場し、教育、金融、エンターテイメントなど多くの分野で革新的な変化をもたらしています。医療分野においても、LLMは診断支援、患者コミュニケーションの改善、医学研究の加速など、多岐にわたる応用が期待されています。例えば、膨大な医学論文の読解や、複雑な症例に対する情報提供などが挙げられます。しかしながら、医学知識の専門性の高さ...
5日前
記事のアイキャッチ画像
初心者がKaggleチュートリアルのタイタニックに挑戦してみた
Zennの「機械学習」のフィード
挑戦の背景と今回の目的背景機械学習・AIエンジニアになりたい!目的機械学習の一連の流れをハンズオン形式で学ぶとにかく1回提出してみる 今回利用したデータセットタイタニック事故の乗客データと事故での生死がcsv形式で与えられている。訓練データとテストデータが最初から与えられているため、データを分割する必要はない。https://www.kaggle.com/competitions/titanic 実際に分析全体の流れを整理する。特徴量作成データの読み込みと構造把握データの前処理EDA新たな特徴量作成・変更モデルの作成ハ...
6日前
記事のアイキャッチ画像
【備忘録】torch.catのdim
Zennの「機械学習」のフィード
torch.catって何しているの?shape = (2, 3, 4)の3階テンソル[1]に対して、catを施した後の、それぞれのprintの出力結果が想像つきますか?少なくとも、初見で私は全く想像できませんでした。そこで備忘録として、torch.catの使い方や、考えのイメージをまとめました。import torchshape = (2, 3, 4)tensor = torch.ones(shape)print(tensor)print("--------dim=0---------")print(torch.cat([tensor, tensor, tenso...
6日前
記事のアイキャッチ画像
機械学習の可視化「wandb」の使い方
Zennの「機械学習」のフィード
今回は、最近使い始めた機械学習の可視化ツール「wandb」の基本をまとめていきます。機械学習を行う際に便利なツールとなっていますので、ぜひ最後までご覧ください。!この記事でわかることwandbの導入方法wandbの使い方 wandbの概要 名称についてwandbとは「Weights & Biases」の略です。 読み方には様々な派閥があるようですが、公式投票では「ワン・ディー・ビー」が最多得票数を獲得しています。https://x.com/weights_biases/status/1487109033244856320 主な機能wandbは、機...
6日前
記事のアイキャッチ画像
機械学習で使用される目的関数の理論
はてなブックマークアイコン 1
Zennの「機械学習」のフィード
海洋ロボコンをやってた人です。今回は機械学習で使用される目的関数:Objective function(活性化関数、損失関数、最適化関数)の数学的な理論式をパッと確認したく、色々調べたことを書き記しました。どのような理論式かはPytorchの中身や実装時の挙動に意識を向けなければ、なかなか定着しないなと思ったのが背景です。機械学習については専門ではありませんので、修正点等あればご遠慮なくご指摘ください。各目的関数については随時追加し、pytorchで使用するときの関数も記載しています。以下箇条書きになりますが、よろしくお願いします。 1. ニューラルネットワークの学習フロー...
6日前
記事のアイキャッチ画像
身近なデータで試すPythonによる機械学習! その1  家庭の電気使用量と天気の関係を分析してみよう
Zennの「機械学習」のフィード
こんにちは!データ分析や機械学習に興味はあるけど、何から始めればいいかわからない…そんな風に思っていませんか?今回は、私たちの生活に身近な「家庭の電気使用量」と「天気」の関係を、Pythonを使って分析するプロセスをステップバイステップでご紹介します。難しい理論は一旦置いておいて、基本的なモデル作成の練習の題材として参考になればと思います! この記事を読むとわかること:実際のデータ(関西電力の電気使用量、気象庁の気象データ)を使ったデータ分析の基本的な流れPandasライブラリを使ったデータの読み込みと前処理の方法Scikit-learnライブラリを使った簡単な機械学習モデル...
7日前
記事のアイキャッチ画像
「argparse」 × 「Shell Script」 でパラメータを変えながら Python を一括実行
Zennの「機械学習」のフィード
今回は、パラメータを変えながら、プログラムを一括実行する方法についてまとめてみました。『argparse』と『Shell Script』を用いることで、変数の値を変更しつつ、複数回実行することができます。!この記事でわかることパラメータを変えながら、プログラムを一括実行する方法argparseの基本Shell Scriptの基本!注意Shell Script は基本的に Unix 系のシェルでしか動きませんWindows では WSL、Git Bash、MSYS2 などの Unix 互換環境を入れれば同じスクリプトを実行できます argparse の使...
9日前
記事のアイキャッチ画像
Metaphor Generation with Conceptual Mappings
Zennの「機械学習」のフィード
はじめまして、京大たにちゅー研・博士1年の堀江です。今回は ACL 2021 の論文『Metaphor Generation with Conceptual Mappings』を紹介します。やや古い論文ではありますが、数少ない教師なし比喩生成手法であるため取り上げてみました。個人的には、Word2Vec の Queen = King – man + women のような演算でメタファーを生成するところが非常に面白かったです! 論文の要旨当該論文では、どのような領域の言葉を使って比喩を生成するかをコントロールできる比喩生成手法の実現を目指す。当該論文では、フレーム(ある語が使わ...
9日前
記事のアイキャッチ画像
AI-OCR向け学習データセットの調達方法とは?入手先・注意点について解説
Zennの「機械学習」のフィード
はじめに近年、AI技術を活用したOCR(光学式文字認識)が企業や自治体の業務効率化において注目されています。従来のOCRでは限界があった、手書き文字、複雑なレイアウト、多言語混在文書なども、AIを導入することで高精度で認識できるようになり、帳票処理やペーパーレス化などのDX推進にも寄与しています。しかし、その性能を最大限に引き出すには、「質の高い学習データ」が不可欠です。AI-OCRモデルの精度は、どれだけ多様で現実的なデータで訓練されるかによって大きく変わります。本稿では、AI-OCR開発に必要な学習データの調達方法や、品質・法令面での留意点について解説します。 AI-...
9日前
記事のアイキャッチ画像
[Tips] PyTorch Lightning を利用した学習 Tips
Zennの「機械学習」のフィード
はじめにTuringの基盤AIチームに業務委託として所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事では、PyTorch Lightningを利用してマルチノード(=2インスタンス以上の環境)で学習を行う際のTipsと、PyTorch Lightningと Lightningの併用により生じる問題の解決策について紹介を行います。普段はSwallow Projectや横田研究室にて大規模モデルの分散並列学習や低精度学習について研究を行っていますので、そちらもご覧いただけますと幸いです。 2ノード以上で発生する問題PyTorch...
9日前
記事のアイキャッチ画像
Geminiは自らをどう認識するのか?AIの自己解剖ドキュメント
Zennの「機械学習」のフィード
はじめに:AIは自身の「思考」を説明できるか?!本記事は、最先端のAIであるGoogleのGemini2.5Proに、「あなた自身の内部では何が起きているのか?」を尋ねるという対話実験の全記録です。AI、特に大規模言語モデル(LLM)は、その驚異的な能力の一方で、内部の動作原理が複雑さから「ブラックボックス」と比喩されることがよくあります。私たちはその出力結果を利用しますが、AIがどのようにしてその答えを導き出しているのか、その「思考」のプロセスを正確に理解しているわけではありません。もし、このブラックボックスに、AI自身の言葉で光を当ててもらうことができたなら?そんな問...
9日前
記事のアイキャッチ画像
新たなGANのベースライン
Zennの「機械学習」のフィード
はじめにみなさんGANは知っていますか?この記事を読むような人は知っていると思いますが, 拡散モデルが流行る前はGANが画像生成分野を席巻しており, それこそさまざまな分野に転用されたりしていました. GANを日本語で説明する際にはよく「偽札製造と見破る警察官」のような喩えをされたりします. その喩えの通り, GANではなにかデータが与えたれた場合にそれが実データか生成データかを判定するDiscriminatorと, データを生成するGeneratorの2種類のネットワークがあり, 学習においてはGeneratorはDiscriminatorを騙すように, 逆にDiscrimina...
9日前