松尾研究所テックブログのフィード
https://zenn.dev/p/mkj
株式会社松尾研究所のテックブログです。
フィード

Kaggleコンペ紹介:Make Data Count - Finding Data References
松尾研究所テックブログのフィード
こんにちは、松尾研究所の奥村です。今回はKaggleで開催された「Make Data Count - Finding Data References」というコンペに参加したので、その内容と上位解法について紹介します。https://www.kaggle.com/competitions/make-data-count-finding-data-references コンペティション概要論文からデータ利用に関する引用部分を抽出し、そのデータがPrimary(その論文のために生成)かSecondary(既存データの再利用)かを分類するのが課題でした。データ引用の言及の仕方は多様で...
1日前

日本 vs 海外 AI活用事例調査:現場起点と基盤先行
松尾研究所テックブログのフィード
はじめにはじめまして、松尾研究所にデータサイエンティストとして入社した勇川です。本記事は、過去のAI関連のニュースや公式資料をもとに過去3年(2023–2025)のAI実装を日本と海外で並べて比較したメモとなります。業種ごとの過去3年間のAI活用の推移を比較した上で、業種横断で日本と海外におけるAI活用の違いを整理しました。 結論起点の違いがスケール差に直結。 日本は現場起点、海外は基盤先行。この傾向は IPA『DX動向2025』が示す"部分最適 vs 全体最適"とも整合している。潮流は“生成AI × 既存システム統合”。 2023→2025で検索/要約/Copil...
7日前

画像1枚からアノテーションレスで物体検出AIモデル開発
松尾研究所テックブログのフィード
松尾研究所のからあげです。夏休みの宿題に、ロボット(LeRobot SO-101)にワニワニパニックをさせてみたので、テックブログで紹介したいと思います。LeRobotは、模倣学習といった高度なAIで制御するための環境が充実していることで人気なロボットです。ロボットによるワニワニパニックなお、ワニワニパニックと速度感が分からない人は、こちらのメーカー公式の商品紹介動画をご覧ください。せっかくSO-101を使うので最初は模倣学習を試そうとしたのですが、ワニワニパニックのワニさんの速度が速すぎて、早々にアプローチを模倣学習から、AIによる物体検出とロボットの決め打ち動作による手法に...
23日前

爆音GPUサーバ持ち航空宇宙系オーバードクターが松尾研究所に来ました
松尾研究所テックブログのフィード
【入社エントリ】松尾研究所に新卒入社しましたこんにちは、2025年4月より松尾研究所にシニアデータサイエンティストとしてジョインした髙田直輝(たかだなおき)です。「新卒入社」とはいえ、松尾研究所では4年間インターンとしてお世話になっていたため、あまり新卒感はないのですが......遅ればせながら節目としてこの記事を書かせていただくことにしました。 自己紹介とバックグラウンド 略歴ざっくり出身:大阪府枚方市洛星高校 → 東京農工大学へ進学B1〜M1:JAXAで研究補助アルバイトマルチコプターをたくさん作って飛ばしたり、有人機体での実験用計測システムを作ったりして...
1ヶ月前

マルチエージェント活用術:Google ADKで変わるキャッチコピー生成
松尾研究所テックブログのフィード
こんにちは、松尾研究所 シニアデータサイエンティストの浮田です。生成AI界隈がLLM、AIエージェント、マルチエージェントと複雑化する中、Googleが公開した Agent Development Kit(ADK) が注目を集めています。ADKはマルチエージェントや本番運用 (デプロイやObservabilityなど) にも対応したAIエージェント開発フレームワークで、AIエージェントの活用をさらに広げるツールとなっています。この記事では、ADKを使ってキャッチコピーを自動生成するマルチエージェントを構築した過程を紹介します。複数の役割を持つエージェントをどのように設計し、連携したか...
2ヶ月前

正則化パラメータλをlogスケールで最適化する理由 - ProphetをOptunaで最適化する際に出た疑問 -
松尾研究所テックブログのフィード
結論正則化パラメータ(Prophetのprior_scale系のパラメータなど)はlogスケールでチューニングしよう! はじめにProphetはFacebookが公開しているオープンソースの時系列予測ライブラリであり、シンプルな設計と軽量さ、また実用的な精度を兼ね備えたツールとして広く使われています。https://facebook.github.io/prophet/そんな便利なProphetですが、こちらの記事で示されているように、ハイパーパラメータチューニングを行うことでデフォルトよりも大きく性能改善することが多く、Prophetを活用する場合はハイパーパラメータチ...
2ヶ月前

最新のテーブルデータ向けNNモデルをまとめてみた
松尾研究所テックブログのフィード
はじめに突然ですが、みなさんはテーブルデータの分類や回帰タスクを解くとき、どのようなモデルを使っていますか?とりあえずCPUベースですぐに動かせて、それなりの精度が出せる、LightGBMなどの勾配ブースティング決定木(GBDT)モデルでまずは試してみるという方が多いのではないでしょうか。実際、Kaggleなどの機械学習コンペティションにおいても、テーブルデータに対してはGBDTを試す、というのがここ十年近くの王道となっていたと思います。一方で、ニューラルネット(NN)ベースのモデルとしては、決定木的な挙動とNNモデルを組み合わせたTabNetなどのモデルが有名でしたが、計算...
2ヶ月前

AIコーディングツール実践比較:Kaggleタスクで見えたClaude Code・Manus AI・Cline・Devinの最適な活用場面
松尾研究所テックブログのフィード
はじめに松尾研究所の梅谷です。2025年が「AIエージェント元年」と呼ばれているように、AIが自律的にタスクを実行する時代が本格的に到来しました。Claude Codeをはじめとして、タスクのゴールを指示するだけでAIが計画、実装を自律的に進めてくれる、さまざまなAIコーディングツールが次々と登場し、開発現場でも注目を集めています。データサイエンスの領域でも、KaggleなどのコンペティションでAIコーディングツールの活用例が増え、人間のデータサイエンティストと同等以上の精度を達成するケースも出てきています(参考例)。このように実用性が高まっている一方で、ツールの種類の多さ...
2ヶ月前

AIエージェントによる社会シミュレーション - Generative Agents, AgentSociety, CitySimの紹介
松尾研究所テックブログのフィード
こんにちは、株式会社松尾研究所シニアデータサイエンティストの大西です。昨今、LLM/AIエージェントの発展に伴い、社会シミュレーションへの活用が進んでいます。都市計画、公共政策、マーケティングなどの分野では、施策や設計の効果を検証するためにシミュレーションが活用されていますが、その前提として人間の行動を忠実に再現することが重要になります。これまではルールベースのエージェントが主流でしたが、近年の大規模言語モデル(LLM)の登場により、より柔軟でリアルな社会シミュレーション構築が可能になりつつあります。本記事では、AIエージェントを用いた社会シミュレーションの進展を、2023年に発表...
2ヶ月前

仮想端末ソフト「byobu」で快適なCLI開発環境構築
松尾研究所テックブログのフィード
はじめにClaude CodeやGemini CLI等のコマンドラインインターフェース(CLI)ベースのAIコーディングツールの登場で、CLIでの開発を支援するツールが再度フィーチャーされています。その中でも代表的なものの1つが仮想端末ソフト(正確には、仮想端末多重化ソフトウェア)です。仮想端末ソフトの解決する問題としては、以下のようなものが挙げられます。CLIベースのソフト(Claude Code, Gemini CLI, AIの学習プログラム等)に長時間かかる作業をさせていたのに、うっかりターミナルを閉じてしまった複数のプロジェクトを同時に進めていて、ウィンドウが散らか...
3ヶ月前

日本語医療特化型LLMの現状と展望
松尾研究所テックブログのフィード
はじめにこんにちは、株式会社松尾研究所インターンのhashです。LLMや世界モデルの研究開発に興味があり、その知見や技術を応用する形でAI技術の社会実装に取り組んでいます。近年、ChatGPTやClaude、Geminiといった様々な大規模言語モデル(LLM)が登場し、教育、金融、エンターテイメントなど多くの分野で革新的な変化をもたらしています。医療分野においても、LLMは診断支援、患者コミュニケーションの改善、医学研究の加速など、多岐にわたる応用が期待されています。例えば、膨大な医学論文の読解や、複雑な症例に対する情報提供などが挙げられます。しかしながら、医学知識の専門性の高さ...
3ヶ月前

人工知能学会2025をきっかけに自分と似た歴史上の人の顔を探すアプリ「reki-gao」を作ってみました
松尾研究所テックブログのフィード
はじめに松尾研究所のからあげです。先日開催された人工知能学会2025年度全国大会(JSAI2025)にて、「日本古典文化と生成AI」というセッションに参加してきました(弊社の参加レポートのテックブログ記事も参照ください!)。そこで、国立情報学研究所の北本朝展さんらが紹介されていたROIS-CODHの「顔貌コレクション(顔コレ)」プロジェクトに興味を持ちました。現代の顔認識技術と歴史的な肖像画データベースを組み合わせることで、「時空を超えた顔探し体験」を実現できるのではないか、そんな発想から「reki-gao」というアプリを作ってみたので紹介したいと思います。なお、私が作った「re...
3ヶ月前

MCPホスト構築:非同期処理とリソース管理の基礎と実装
松尾研究所テックブログのフィード
この記事では、MCPホストを実際に作成するプロセスを通じて、その際に不可欠となる「非同期処理」の考え方と、通信セッションなどを安全に扱うための「リソース管理」のテクニックについて、基礎から具体的な実装までを解説します。記事では「MCPホスト」と「AIエージェント」の両方の表現が使われていますが、AIエージェントもMCPホストで実装されていることを前提に書いています。MCPの概念については以下の記事を参考にしてください。https://zenn.dev/mkj/articles/0ed4d02ef3439cAIエージェントがMCPのような外部サーバと連携して動作する際には、必然的に以...
3ヶ月前

【JSAI2025】松尾研究所参加レポート
松尾研究所テックブログのフィード
こんにちは、株式会社松尾研究所シニアデータサイエンティストの太田です。2025年5月27日〜30日に実施された人工知能学会全国大会2025に松尾研究所からデータサイエンティスト6名が参加しました。今回松尾研究所はゴールドスポンサーとしてJSAIに参加しており、インダストリアルセッションへの登壇や企業ブースでの出展もありましたが、この記事では今年の4月に入社したメンバー5人のフレッシュな視点から、聴講セッションに焦点をおいて大会を振り返りたいと思います。 聴講セッション参加レポート 太田 フィジカルAIシステムの研究開発 身体性に基づく知能の研究企画セッション[1]自分...
3ヶ月前

[入社エントリ]世界と自分を変えたくて松尾研究所へ
松尾研究所テックブログのフィード
4/16から松尾研究所のDSチームに所属している穴井です。入社から1ヶ月半ほど経ち、落ち着いてきたので入社エントリ書いてみました。少し大きめなタイトルつけてますが、その決断に至るまでの心境なども素直に触れていこうと思います。 自己紹介愛知県在住のエンジニアです。Self-supervised learningや異常検知など、Embedding活用してアレコレする技術が好きです。今こそAIやデータサイエンスに関する職についてますが、学生時代や社会人前半は全く異なる分野を経てきました。そんなキャリアの変遷や、松尾研究所に来るまでの経緯・心境が、誰かのキャリア選択のヒントになれ...
3ヶ月前

スライドや資料作成に使える!ちょうどいいイラスト素材サイト
松尾研究所テックブログのフィード
はじめにみなさん、仕事でスライド作っていますか?私は、個人的に生成AIでスライドづくりを試したりしていますが、スライドに関しては、まだ生成AIで完全に自動生成が難しい領域と実感しています。特に、スライドをよりインプレッシブにするために、使い勝手の良いセンスのあるイラストが欲しいけど「検索しても良いものが見つからない!」と困っている方も多いのではないでしょうか?かくいう私も、スライドに使えるようなイラスト素材サイトを全然知らなかったのですが、松尾研究所のSlackでコンサル経験のある清水さんら数名がおすすめサイトをたくさん共有してくれました(松尾研究所ではデータサイエンティストだ...
4ヶ月前

令和7年電気学会全国大会 参加報告 - スマートメーター活用AIの研究開発
松尾研究所テックブログのフィード
株式会社松尾研究所でインターンをしている高木です。松尾研究所は東京電力パワーグリッド様と共同で、スマートメーターの計測データを活用し、エネルギー利用効率化を実現するAIモデルの開発・データサイエンスを進めています。我々は2025年3月に明治大学中野キャンパスにて開催された電気学会全国大会に参加し、研究成果の一部を発表しました。本記事では、現地の様子や我々の発表内容について紹介します。https://matsuo-institute.com/2025/05/743/ 電気学会全国大会電気学会は、電気やその関連分野の基礎研究から技術開発の報告まで幅広く扱う、長い歴史を持つ学会です...
4ヶ月前

[入社エントリ]新卒で松尾研究所に来て早1か月が経ったので振り返ります
松尾研究所テックブログのフィード
はじめに25新卒で株式会社松尾研究所に入社いたしました.尾崎といいます.松尾研究所ではデータサイエンティストをやっています.世間では入社エントリなるものを書くとの教えを賜り,本稿では新卒で松尾研究所に入った経緯や今後について書いてみようと思います. 1. 自己紹介内部の人にも調子こいていると噂のアイコンと大体のSNSで使っているアイコン名前:尾崎大晟出身地:愛媛県愛南町出身大学:大阪公立大学専攻:大学では機械系,ただし主にLLMについて知見や研究が寄っています.所属:株式会社松尾研究所 (同時に大阪公立大学の博士課程に進学しています.)Xのアカウントはこちら...
4ヶ月前

ローカルRAGを手軽に構築できるMCPサーバを作りました
松尾研究所テックブログのフィード
はじめに最近話題のMCP(Model Context Protocol)記事です。MCPに関しては、同僚の李さんが素晴らしい記事を書いてくださいましたので、MCP自体の概要に関しては以下記事参照ください(お約束)。https://zenn.dev/mkj/articles/0ed4d02ef3439c今回は、LLMの代表的なユースケースとも言えるRAG(Retrieval-Augmented Generation)です。RAGはドキュメントから関連情報を検索し、AIの回答生成に活用する技術で、専門知識や最新情報を必要とするタスクに使われます。以前にTanuki-8BとOllam...
4ヶ月前

【入社エントリ】コンサルから松尾研究所のデータサイエンティストへ
松尾研究所テックブログのフィード
はじめにはじめまして!4月に松尾研究所へシニアデータサイエンティストとして入社した渡邊です。前職ではITコンサルタントでしたが、この度データサイエンスの世界へ飛び込みました。この記事では、その理由や入社後に感じたことなどを共有したいと思います! バックグラウンド化学系の修士課程を修了後、新卒で野村総合研究所に入社し、ITコンサルタントとして4年間勤務しました。主にAIを用いた業務改革やPoC推進のプロジェクトに関わる中で、顧客課題を技術を用いて解決することの楽しさを学びました。また、生成AI技術の面白さや可能性に魅了されて、生成AIに関わるプロジェクトやR&D活...
4ヶ月前