松尾研究所テックブログのフィード
https://zenn.dev/p/mkj
株式会社松尾研究所のテックブログです。
フィード

LLM-in-the-loop最適化 -明日の献立をLLMで最適化してみる-
1
松尾研究所テックブログのフィード
はじめにこんにちは、株式会社松尾研究所シニアデータサイエンティストの大西です。この記事は、松尾研究所 Advent Calendar 2025の記事です。前職でブラックボックス最適化やHuman-in-the-loop最適化に関する研究開発に携わり、現職ではLLM(大規模言語モデル)を用いたプロジェクトを推進しています。これらの経験と昨今のLLMの進展に伴い、私自身が注目している研究テーマをブログにまとめました。本記事では、従来の最適化と LLM による選好評価を組み合わせた LLM-in-the-loop最適化 を紹介します。近年、LLMを最適化アルゴリズムに組み込み、人間...
19時間前

新人のときに読みたかった ―『先輩データサイエンティストからの指南書』を読んで
5
松尾研究所テックブログのフィード
株式会社松尾研究所のごうやです。本記事は、松尾研究所 Advent Calendar 2025の記事です。株式会社ブレインパッドの浅野様から先輩データサイエンティストからの指南書をご恵贈賜りましたのでレビューします。 はじめにデータサイエンティストとして働いていると、「分析はできたけど、その先どうするの?」と素朴な疑問が湧きました。手元のNotebookで精度の高いモデルができた。技術検証としては成功。それを本番環境で動かして、クライアントに実際に使ってもらうとなると、途端にハードルが上がります。本書『先輩データサイエンティストからの指南書』は、エンジニアリングの観点から「分...
2日前

RAGプロダクトを支える、ベクトルDB構築以外の周辺Tips
52
松尾研究所テックブログのフィード
こんにちは、松尾研究所 データサイエンティストの浮田です。この記事は、松尾研究所Advent Calendar 2025の記事です。RAG (Retrieval-Augmented Generation) と聞くと、「ベクトルDBを構築する」という話に意識が向きがちです。もちろんベクトルDBはRAGの基盤になる重要な要素ですが、実際に使われるRAGプロダクトを作ろうとすると、ベクトルDB構築以外にも様々な工夫が必要となります。本記事では、私が実務でRAGプロダクトを構築する中で遭遇した様々な障壁とその対応を紹介します。!本記事は、RAGを用いて実際に業務プロダクトを構築したい現場...
3日前

AIコーディング実践環境の構築方法【2025年12月】
218
松尾研究所テックブログのフィード
この記事は、松尾研究所 Advent Calendar 2025の記事です。本記事ではAIコーディングを実践するための環境構築方法が分かります。具体的なポイントは以下となります。2025年12月時点での、Claude Code を中心としたAIコーディング環境の構築手順AIコーディングに必要なツールの概要、セットアップ方法、使い方仕様駆動開発でソフトウェア開発する流れと具体的な実践方法!本記事に必要な知識・経験は以下となります。基礎的なプログラミングの知識があるGitHubの基礎的な使い方が分かる生成AI(ChatGPTなど)を使ったことがある AIコーディ...
4日前

【入社エントリ】放送局からデータサイエンティストへ
松尾研究所テックブログのフィード
はじめに初めてテックブログを書きます、10/1に入社した栗原清です。今まで業務の中で自分の意見をブログ等で発信する事が出来なかったので、こういう場をもらえて嬉しいです!良いキッカケだなと思い、研究用のXアカウントを作ってしまいました。研究について書いていきたい!前職では、放送局で音声合成の研究開発の仕事をしていました。いわゆる、テレビの「現場」にも、研究の前に10年ほどいました。特殊な経歴でもありますので、入社エントリーとして自己紹介をさせてください。 入社のきっかけ入社のきっかけは、放送業界を超えてAIの研究開発を行いたかったからです!放送局の中でも、AIの研究開発は...
6日前

GPT-5.1の各パーソナリティの応答を比較してみた
松尾研究所テックブログのフィード
はじめに11月12日(日本時間11月13日)に、OpenAIが最新モデルGPT-5.1をリリースしました。このモデルは、知性とコミュニケーションスタイルの両方で性能向上しており、より分かりやすく読みやすい応答が実現されています。また、ChatGPTのスタイルとトーンを8種類から選べるようになり、より自分にマッチした応答スタイルを簡単に実現できるようになりました。この記事では、論文内容の解説というタスクを例にとり、8つそれぞれの応答スタイルを比較しています。記事中では応答の全文も記載しているので、ぜひ実際の応答を眺めてみて、みなさんの自分好みの設定を見つけていただければうれしい...
21日前

Kaggleコンペ紹介:MAP - Charting Student Math Misunderstandings
松尾研究所テックブログのフィード
はじめにこんにちは、松尾研究所 データサイエンティストの力岡です。今回は、Kaggleで開催された 「MAP - Charting Student Math Misunderstandings」 コンペに参加し、金メダルを獲得することができました。本記事では、コンペの概要と上位解法、私達の取り組みについて紹介します。https://matsuo-institute.com/2025/10/825/!本記事は私の理解として記述をしているため、一部に誤りや解釈の相違が含まれる可能性があります。あらかじめご了承ください。 コンペ概要https://www.kaggle.c...
23日前

uv × DockerでのPython開発環境構築方法
松尾研究所テックブログのフィード
松尾研究所では、Python開発における標準ツールとしてuvを推奨しています。uvはPythonのパッケージ管理ツールで、依存関係の管理や仮想環境の構築を自動化し、高速で再現性のある開発を可能にすることが特長です。Pythonパッケージだけでなく、Node.jsやブラウザ周りのツールなど他の依存も扱うときには、uvとDockerを併用するケースもあるかと思います。Dockerのコンテナ上でuvを使用する方法について社内で話題になったとき、調べたところいくつか方法があることが分かったので、それぞれの方法の違いと松尾研究所推奨の環境構築方法についてまとめました。!本記事では、uv、Do...
1ヶ月前

「著者陣に聞く!PythonではじめるMCP開発入門」イベントレポート
松尾研究所テックブログのフィード
松尾研究所でシニアデータサイエンティストをしている、からあげです。2025年10月14日に開催されたFindy様主催の「著者陣に聞く!PythonではじめるMCP開発入門」に参加(登壇)しました。https://findy.connpass.com/event/370658/このイベントは、10/10に発売されたばかりの書籍「PythonではじめるMCP開発入門」の著者陣が登壇し、MCPの基礎から実践的な活用方法まで幅広く解説するというものです。本記事では、イベントレポートとしてイベントの概要と、発表の概要紹介と資料の掲載をします。MCPに興味がある方、LLMを活用したアプリケー...
2ヶ月前

マルチエージェントフレームワークAIMEの紹介と実装
松尾研究所テックブログのフィード
近年、AI技術の進化に伴い、単一のAIではなく複数のAIエージェントが協調してタスクを遂行する「マルチAIエージェント」の概念が注目を集めています。複雑な問題を解決するためには、各エージェントがそれぞれの専門性を活かし、連携して動くことが不可欠です。今回は、TikTokなどで有名なByteDance社が提唱したマルチエージェントのフレームワーク論文「AIME: TOWARDS FULLY-AUTONOMOUS MULTIAGENT FRAMEWORK」を簡単に紹介します。このフレームワークの肝は、従来の課題であった「静的な計画」と「エージェント能力の固定化」を、動的かつ自律的な仕組みで...
2ヶ月前

第20回言語処理若手シンポジウム(YANS2025)参加報告
松尾研究所テックブログのフィード
こんにちは、松尾研究所シニアデータサイエンティストの大西です。2025年9月15-17日に実施された第20回言語処理若手シンポジウム(YANS2025)に松尾研究所からデータサイエンティスト2名と人事1名が参加しました。今回、記念すべき20回目の開催であり全5セッションですべてポスター発表、発表が257件(学生202件、社会人55件)、参加者は570人(学生286人、社会人284人)でした。今年は 「研究と実装をつなぐ自然言語処理」 をキーワードとして,自然言語処理分野の研究から実社会への実装をつなぐことをテーマに実施されました。私自身、YANSへの参加は初めてでしたが、学生を中心...
2ヶ月前

LLMをゲームプレイで評価するLMGame-Benchを紹介
松尾研究所テックブログのフィード
こんにちは、松尾研究所の奥村です。LLMの性能向上により、従来のNLPタスクだけではなく、より複雑な推論が求められるタスクでの活用が注目されています。特にゲームプレイは、画面の理解や記憶、複雑な意思決定などが要求されるため、LLMの能力を総合的に評価する有効な手段として期待されています。今回はLLMをゲームで評価するLMGame-Benchというベンチマークについて紹介します。公式サイト:https://lmgame.org/論文:https://arxiv.org/pdf/2505.15146 LMGame-Bench概要ゲーム画面のみから直接行動を決定して評価するの...
2ヶ月前

LoRAの進化:基礎から最新のLoRA-Proまで
松尾研究所テックブログのフィード
近年、大規模言語モデル(LLM)のオープンソース化が進み、大小さまざまなモデルが利用できるようになりました。これらのモデルは汎用性が高い一方で、特定分野に特化したモデルを作るためのファインチューニングの需要も増えています。そこで注目されているのが、パラメータ効率的ファインチューニング(PEFT)です。特にLoRA(Low-Rank Adaptation) という手法が広く使われています。LoRAは学習するパラメータ数を大幅に削減できる優れた手法ですが、フルファインチューニング(すべてのパラメータを学習する方法)と比べると性能が劣るという課題があります。この課題を解決するため、ICL...
2ヶ月前

Kaggleコンペ紹介:Make Data Count - Finding Data References
松尾研究所テックブログのフィード
こんにちは、松尾研究所の奥村です。今回はKaggleで開催された「Make Data Count - Finding Data References」というコンペに参加したので、その内容と上位解法について紹介します。https://www.kaggle.com/competitions/make-data-count-finding-data-references コンペティション概要論文からデータ利用に関する引用部分を抽出し、そのデータがPrimary(その論文のために生成)かSecondary(既存データの再利用)かを分類するのが課題でした。データ引用の言及の仕方は多様で...
3ヶ月前

日本 vs 海外 AI活用事例調査:現場起点と基盤先行
松尾研究所テックブログのフィード
はじめにはじめまして、松尾研究所にデータサイエンティストとして入社した勇川です。本記事は、過去のAI関連のニュースや公式資料をもとに過去3年(2023–2025)のAI実装を日本と海外で並べて比較したメモとなります。業種ごとの過去3年間のAI活用の推移を比較した上で、業種横断で日本と海外におけるAI活用の違いを整理しました。 結論起点の違いがスケール差に直結。 日本は現場起点、海外は基盤先行。この傾向は IPA『DX動向2025』が示す"部分最適 vs 全体最適"とも整合している。潮流は“生成AI × 既存システム統合”。 2023→2025で検索/要約/Copil...
3ヶ月前

画像1枚からアノテーションレスで物体検出AIモデル開発
松尾研究所テックブログのフィード
松尾研究所のからあげです。夏休みの宿題に、ロボット(LeRobot SO-101)にワニワニパニックをさせてみたので、テックブログで紹介したいと思います。LeRobotは、模倣学習といった高度なAIで制御するための環境が充実していることで人気なロボットです。ロボットによるワニワニパニックなお、ワニワニパニックと速度感が分からない人は、こちらのメーカー公式の商品紹介動画をご覧ください。せっかくSO-101を使うので最初は模倣学習を試そうとしたのですが、ワニワニパニックのワニさんの速度が速すぎて、早々にアプローチを模倣学習から、AIによる物体検出とロボットの決め打ち動作による手法に...
3ヶ月前

爆音GPUサーバ持ち航空宇宙系オーバードクターが松尾研究所に来ました
松尾研究所テックブログのフィード
【入社エントリ】松尾研究所に新卒入社しましたこんにちは、2025年4月より松尾研究所にシニアデータサイエンティストとしてジョインした髙田直輝(たかだなおき)です。「新卒入社」とはいえ、松尾研究所では4年間インターンとしてお世話になっていたため、あまり新卒感はないのですが......遅ればせながら節目としてこの記事を書かせていただくことにしました。 自己紹介とバックグラウンド 略歴ざっくり出身:大阪府枚方市洛星高校 → 東京農工大学へ進学B1〜M1:JAXAで研究補助アルバイトマルチコプターをたくさん作って飛ばしたり、有人機体での実験用計測システムを作ったりして...
4ヶ月前

マルチエージェント活用術:Google ADKで変わるキャッチコピー生成
松尾研究所テックブログのフィード
こんにちは、松尾研究所 シニアデータサイエンティストの浮田です。生成AI界隈がLLM、AIエージェント、マルチエージェントと複雑化する中、Googleが公開した Agent Development Kit(ADK) が注目を集めています。ADKはマルチエージェントや本番運用 (デプロイやObservabilityなど) にも対応したAIエージェント開発フレームワークで、AIエージェントの活用をさらに広げるツールとなっています。この記事では、ADKを使ってキャッチコピーを自動生成するマルチエージェントを構築した過程を紹介します。複数の役割を持つエージェントをどのように設計し、連携したか...
4ヶ月前

正則化パラメータλをlogスケールで最適化する理由 - ProphetをOptunaで最適化する際に出た疑問 -
松尾研究所テックブログのフィード
結論正則化パラメータ(Prophetのprior_scale系のパラメータなど)はlogスケールでチューニングしよう! はじめにProphetはFacebookが公開しているオープンソースの時系列予測ライブラリであり、シンプルな設計と軽量さ、また実用的な精度を兼ね備えたツールとして広く使われています。https://facebook.github.io/prophet/そんな便利なProphetですが、こちらの記事で示されているように、ハイパーパラメータチューニングを行うことでデフォルトよりも大きく性能改善することが多く、Prophetを活用する場合はハイパーパラメータチ...
5ヶ月前

最新のテーブルデータ向けNNモデルをまとめてみた
松尾研究所テックブログのフィード
はじめに突然ですが、みなさんはテーブルデータの分類や回帰タスクを解くとき、どのようなモデルを使っていますか?とりあえずCPUベースですぐに動かせて、それなりの精度が出せる、LightGBMなどの勾配ブースティング決定木(GBDT)モデルでまずは試してみるという方が多いのではないでしょうか。実際、Kaggleなどの機械学習コンペティションにおいても、テーブルデータに対してはGBDTを試す、というのがここ十年近くの王道となっていたと思います。一方で、ニューラルネット(NN)ベースのモデルとしては、決定木的な挙動とNNモデルを組み合わせたTabNetなどのモデルが有名でしたが、計算...
5ヶ月前