直近1週間の更新
8/2 (土)

[つぶやき]-Horizon Beta
Zennの「AI」のフィード

概要想定読者:ai関連のモデルで最近ワイワイしてる「horizon alpha」の性能向上版である「horizon beta」関する他人の呟きを読みたい方そもそもaiモデルのベンチマークの読み方とかわからんからかいつまんでって方 経緯最近は結構gemini使いがちだったのですが、https://openrouter.ai/ に数日前から「horizon alpha」という高性能aiが登場そして性能向上版である「horizon beta」が登場gpt5ではという噂も出ており、ベンチマークみながらつぶやきたい そもそもhttps://openrouter...
32分前

localで動く英会話アプリ開発 #1
Zennの「AI」のフィード

雑談やっぱり、夏はうどんが最強‼︎ってことでうどんを食べてきましたー運動してた頃はたっくさん食べれていたのに、運動やめてから食べる量が減り、大盛りを食べるのが辛くなってきた…美味しいものをたくさん食べれる胃袋が欲しいので運動ちゃんとやろうかなーなんか、運動してた時より痩せてるしショックを受けている今日この頃です 何するの?英語を使う機会が増えて、英語ができたら楽しいんだろうなって思い始めました。そんな中で、最近、AIと英会話するアプリケーションをよく見かけます。めっちゃ良さげだけど、月額料金がかかるため、金欠大学生にはハードルが高い…あれ、こんな感じの英会話アプリ...
1時間前

オンプレミスAI基盤の構築と運用 - Teradata AI Factoryから学ぶベストプラクティス
Zennの「AI」のフィード

オンプレミスAI基盤の構築と運用 - Teradata AI Factoryから学ぶベストプラクティスこの記事はAIによって自動生成されました。 目次は��めにオンプレミスAI基盤の重要性AI Factoryの基本アーキテクチャ実装例:オンプレミスMLOps環境の構築セキュリティと運用管理のポイントまとめ はじめに近年、多くの企業がAIシステムをクラウドで運用していますが、データセキュリティやコンプライアンスの観点から、オンプレミス環境でのAI基盤構築のニーズが高まっています。本記事では、Teradata AI Factoryの事例を参考に、オンプレミスA...
1時間前

Claude Code の「処理中...」の英語表現が難しすぎたのでまとめてみた
Zennの「AI」のフィード

Claude Codeは、Anthropic社が開発したAIコーディング支援ツールで、ターミナル上で動作するのが特徴です。タスクをお願いすると、以下のような「処理中...」という旨の表示がされるのですが、このスクショの例のように、例えば Unravelling... といった、ちょっと変わった英語表現が表示されます。この英語表現が、なんとも難しいものばかりだったので、表にまとめてみました。ABC順で、さらに、日本語訳も記載しています(Claude による翻訳のため、間違っている可能性もありますが)。これを見る限りは、遊びで入れているのかな〜という感じですね。英語日本語訳...
2時間前

【Mac + Kiro + Vim】カーソル移動が長押しでできない場合の対策
Zennの「AI」のフィード

結論(設定方法)以下をKiroのターミナルで入力defaults write dev.kiro.desktop ApplePressAndHoldEnabled -bool falseKiroを再起動する以上! まとめVSCodeの設定方法の記事は結構あるものの、Kiroでの設定方法がなかったので書きました。今VSCodeフォークのエディターがたくさん出てきていますが、基本的には以下のコマンドでバンドル識別子を確認し、それを対象に設定してプレス時のホールド設定をfalseに変えてあげれば良さそうです。// バンドル識別子を確認osascript -e 'i...
4時間前

Durable Functions で Deep Research を実装する
1
Zennの「AI」のフィード


Deep Research リポジトリに PR を出しました先日、同僚の Junpei Tsuchida さんが Microsoftが公開しているDeep Researchのサンプルコードを理解してみる(ついでにC#ライブラリ化も) という記事を公開しました。そのリポジトリに追加してもらって以下の Pull Request を作成しました。Azure.AI.OpenAI を Microsoft.Extensions.AI に変更 + C#の新文法に対応この Pull Request は Deep Research のロジック内で Azure.AI.OpenAI の ChatC...
5時間前

Snowflake Intelligenceをはじめから丁寧に
Zennの「AI」のフィード

はじめにこんにちは。ナウキャストでデータエンジニアをしているTakumiです。ついにSnowflake IntelligenceがPublic Previewになりました!!!!!Snowflake Intelligence触れるようになったので実際に構築してみました!!実際に作ってみて&触ってみて感じたSnowflake Intelligenceのいいところ、改善してほしいところを共有します。 この記事でわかることSnowflake Intelligenceの初期構築方法Cortex Family, Snowflake AI Application Framewo...
7時間前

🚀 Qwen系「7月ラッシュ」まとめ記事(2025年7月22〜2025年7月31日)
Zennの「AI」のフィード

🚀 Qwen系「7月ラッシュ」まとめ記事この1か月だけで少なくとも6つの主要リリースが雪崩れ込みました。公式ブログ・HFモデルカード・ツイートを突き合わせ、「何が出て/何が変わったか」を俯瞰します。⸻ 📊 一覧表:日付順ハイライト日付モデル / ツールパラメータ構成コア特徴典拠7/22Qwen3-Coder-480B-A35B-Instruct480B 全体 / 35B アクティブ (MoE)256K→1M トークン、長ホライズン RL、SWE-Bench SOTAHF Model7/24Qwen Code CLI (npm)—Gem...
8時間前

Tsumiki 使ってみた
Zennの「AI」のフィード

Tsumiki 使ってみた2025/08/01 時点で公開されてるTsumikiを(お試し程度にkairoだけ)使ってみたhttps://github.com/classmethod/tsumiki公開からコマンド自体に手を結構入れてるみたいなので、今後の更新で参考にならない可能性もありますインストールはREADME.mdを参考にnpx tsumiki installですね 作ってみるclaude codeを立ち上げた状態で/kairo-requirements タスク管理アプリを作りたいです。参考ばBacklogです。Wikiはmarkdown形式にして、svn...
9時間前

AIエージェント開発の最前線:contains-studio/agentsで学ぶ実践ガイド
Zennの「AI」のフィード

AIエージェント開発の最前線:contains-studio/agentsで学ぶ実践ガイド 概要:なぜ今、AIエージェントに注目すべきか?近年、AI技術の急速な進化に伴い、自律的にタスクを遂行するAIエージェントの開発が大きな注目を集めています。まるで目標達成のために自ら考え、行動する「デジタルな秘書」のような存在、それがAIエージェントです。その中でも、contains-studio/agentsは、実際のプロダクトで使われているAIエージェントの実装例を共有するオープンソースリポジトリとして、5,000件近いスターを獲得し、開発者コミュニティから高い関心が寄せられています...
9時間前

9割超がAIモデルやAIアプリへの侵害を経験 IBMの年次調査で判明したリスク
1ITmedia AI+ 最新記事一覧

IBMの2025年版調査によると、AI導入が進む中、アクセス制御やガバナンスが整備されていない企業が多数を占めた他、AI関連のセキュリティ侵害が深刻化していることが判明した。
10時間前

Google、マルチエージェントAI「Deep Think」提供開始 「AI Ultra」プランで
1ITmedia AI+ 最新記事一覧

Googleは、高度な問題解決AI「Deep Think」の提供を開始した。「Gemini 2.5 Pro」のマルチエージェント機能で、並列思考により複雑な問題の最適解を導く。国際数学オリンピックで金メダル級の性能を示したモデルの派生版で、「Google AI Ultra」プラン限定で提供される。
11時間前

リモートセンシング領域の基盤モデルと論文まとめ
Zennの「ディープラーニング」のフィード

リモートセンシングへの基盤モデルの影響近年自然言語処理や画像認識で成果を挙げた「基盤モデル: Foundation Models; FM」が、衛星リモートセンシング(Earth Observation; EO)にも波及しつつあります。数十〜数百TB規模の光学・SAR時系列を自己教師ありで学習したモデルは、洪水域抽出や作物分類など多彩なタスクへ、わずかなラベルとプロンプトだけで即応できます。大量データの前処理と真値作成に費やしていた労力を大幅に減らし、「データ準備地獄」から解放する点が最大の期待なんです。学習済み重みは公開されており、専門外のエンジニアでも短時間で高精度モデルを活用で...
18時間前
8/1 (金)

【3: 注意が必要】ChatGPT/OpenAI の安全性調査レポート
Zennの「AI」のフィード

【3: 注意が必要】ChatGPT/OpenAI の安全性調査レポート対象AIサービス: ChatGPT(GPT-4、GPT-3.5等、OpenAI全サービス)公式URL: https://chat.openai.com/安全性レベル: 3: 注意が必要 エグゼクティブ・サマリー2025年7月23日、OpenAI CEO Sam Altman自身による重大なプライバシーリスク告白OpenAI CEOのSam AltmanがTheo Vonポッドキャスト(エピソード#599、7月23日公開)で以下の重大な事実を認めました:"If you go talk to ...
20時間前

【3: 注意が必要】ChatGPT/OpenAI の安全性調査レポート
Zennの「生成 AI」のフィード

【3: 注意が必要】ChatGPT/OpenAI の安全性調査レポート対象AIサービス: ChatGPT(GPT-4、GPT-3.5等、OpenAI全サービス)公式URL: https://chat.openai.com/安全性レベル: 3: 注意が必要 エグゼクティブ・サマリー2025年7月23日、OpenAI CEO Sam Altman自身による重大なプライバシーリスク告白OpenAI CEOのSam AltmanがTheo Vonポッドキャスト(エピソード#599、7月23日公開)で以下の重大な事実を認めました:"If you go talk to ...
20時間前

Mambaで物体検出 完全に理解した
Zennの「AI」のフィード

本記事は『エンジニア達の「完全に理解した」Talk #67』 で発表した内容を再構成したものです。 Mamba とは?皆さんはMamba[1]というアーキテクチャを知っていますか?Mambaは 2023 年に提案されたアーキテクチャで、近年活用が進んでいます。2025 年現在、LLM のような大規模なシーケンスデータを扱うモデルでは、Transformer[2]をベースにしたモデルが主流です。しかし、Transformer には、計算量が O(N^2)のオーダーで増加してしまうという問題がありました。Transformer の中でも重要な Attention 機構は、次...
1日前

gemini CLIに調査させた結果が色々と間違っていた件
Zennの「AI」のフィード

!この記事は人間が書きました。 はじめにみなさん、AIコーディングエージェント使っていますか?Gemini CLIについて調べている中で --ide-modeというオプションを見つけたので一体どんなオプションなのか気になって調査してみました。$ gemini --helpgemini [options]Gemini CLI - Launch an interactive CLI, use -p/--prompt for non-interactive modeオプション: -m, --model Model ...
1日前

頻出するなぁと感じる生成AI用語まとめ
Zennの「LLM」のフィード

生成AIの用語まとめ LLM (Large Language Model)大規模言語モデルの略称。Transformerをベースに、膨大なテキストデータを学習したAIモデルのこと。ChatGPTやGeminiなど。 モデルの次元モデル名の 8b , 127b などの部分。billion の b でモデルにおける次元の数値。数値が大きいほど、高精度でファイルサイズが大きい。 トークンとチャンクトークンとは、LLMがテキストを処理するため、文章を分割すること。英語の場合、単語単位での分割が主流日本語の場合、サブワード化での分割が主流。形態素要素解析は下火?...
1日前

【Github Copilot】設計書があるなら、全部Copilotに実装させよう
Zennの「AI」のフィード

ウォーターフォールモデルに則った大規模開発で設計書があるなら、全部Copilotに実装させよう!をコンセプトに、どうすれば設計書をインプットに、Github Copilotが大規模開発の品質に沿ったコードを生成してくれるか、の完成版です。前回の記事では途中経過でしたが、自分なりに方法が確立したので結果を共有します。このドキュメントでは、現時点での設計書からCopilotを用いて実装を生成する手順の紹介、使用するツールの紹介、工夫したポイントについて記載します。 結論で、本当に全部Copilotに実装させられるの?実装スピードはあがるの?と気になる方もいると思うので結論を先に書きま...
1日前

Tableau の AI
1
Zennの「AI」のフィード


はじめに先日 Google Data Analytics Professional Certificate を受講しました。その中で Tableau Public というデータ公開ができる解析クラウドサービスがあることを知りました。更に Tableau ではAIを使えるとのこと。何ができるのか見ていきたいと思います。 Tableau の AIまず、情報を整理するに当たり 「製品機能」 という言葉と 「体験機能」 という言葉を定義しておきたいと思います。「製品機能」は特定の名前で提供されているもので、AWSで例えると EC2 や S3 等「製品機能」があり Webサービ...
1日前

Pub/Sub の Single Message Transform (SMT) を使ってメッセージを手軽に変換する
Google Cloud Japanのフィード

はじめにCloud Pub/Sub はスケーラブルなメッセージキューですが、キューを流れるメッセージの加工はキューの外部で行う必要がありました。例えば Cloud Dataflow を使ったり VM やコンテナの上で独自のデータ加工アプリを動かしたりする方法が挙げられます。確かに Dataflow は多機能でスケール性に優れたサービスですが、ちょっとしたメッセージの加工に使うのは大がかりに感じられることもあるかと思います。このような場合に手軽に利用できるのが2025年6月に出た Single Message Transform (SMT) です。SMT を使うと Pub/Sub の...
1日前

Gemini CLI 最近のアップデート内容まとめ (v0.1.10 ~ v0.1.15)
Zennの「AI」のフィード

!この記事は補足のセクション以外はGemini CLIが書きました。 はじめにGemini CLIは、開発者のワークフローを支援するためのコマンドラインツールです。この記事では、v0.1.10からv0.1.15までの安定版リリースと、現在Nightlyビルドで開発が進められている新機能について、コミットログを元に客観的な変更点をご紹介します。 アップデートの主な傾向この期間のアップデートは、主に以下のテーマに沿って進められています。IDEとの連携強化: VSCodeやその他のエディタとの連携を深め、よりシームレスな開発体験を目指しています。コマンドの拡充と刷新:...
1日前

AI駆動開発こそデブコン
Zennの「AI」のフィード

!この記事は人間が丹精こめて書きました はじめにQ1. 皆さまClaude Code, Gemini CLI等々のAIコーディングツールは使っていますでしょうか?ほとんどの開発者はYesだと思います。Q2. では、デブコンは使っていますでしょうか?Q1がYesで、Q2がNoのあなたセキュリティ的にマジでやばいですこの記事を最後まで読んで立派なデブコナーになりましょう。デブコン使ってるよ~って方はここから読んでってくれると嬉しいです。因みにここで言ってるデブコンとはVSCodeの Devcontainer のことです。一般金属補修材のことでは無いのでご留意くだ...
1日前

ウサギやクマがトランポリンで跳ねる動画、SNSで話題も、AI生成の可能性 「マジで分からない」との声も ITmedia AI+ 最新記事一覧
動物がトランポリンで跳ねる動画が、TikTokやXなどで話題だ。映像の乱れなどから、その多くは生成AIで作られたものと見られ、その指摘も相次いでいるが、クオリティーの高さから「本物かと思っていた」と反応する人も散見される。
1日前

zedにollamaを繋いでコード生成を完全オフライン化する
Zennの「AI」のフィード

Zedとはhttps://zed.dev/Rustで書かれている、完全オープンソースで爆速なIDEです。ネイティブでVimモードに対応しているため、著者は愛用しています。関連記事:https://zenn.dev/qaynam/articles/43bee23144b83f Gemma3Gemma3は、Google DeepMindが開発した最新のオープンソース大規模言語モデル(LLM)です。少し前に発表されて話題になっており、軽量で非常に高速、そしてスマートフォンでも動作するモデルです。 きっかけ特に困っていたことはなかったのですが、Gemma3が2GBのメモ...
1日前

2025年7月現在の Cursor と VS Code + Github Copilot の比較
Zennの「LLM」のフィード

はじめに僕は普段 Cursor を使って開発しているのですが、チームでは Github Copilot を利用しているので、両者のメリデメを整理するために記事を作成しました。比較記事は過去のものがたくさん存在していますが、アップデートによって状況が大きく変わるため、あらためて作成しています。 🔧 前提ツールひと言で言うと導入方法VS Code + GitHub Copilot“VS Code に AI(Github Copilot)を拡張”Marketplace で Copilot 拡張機能を追加Cursor“VS Code を fork し...
1日前

localで動く英会話アプリ開発 #0
Zennの「AI」のフィード

何するの?英語を使う機会が増えて、英語ができたら楽しいんだろうなって思い始めました。そんな中で、最近、AIと英会話するアプリケーションをよく見かけます。めっちゃ良さげだけど、月額料金がかかるため、金欠大学生にはハードルが高い…あれ、こんな感じの英会話アプリって簡単に作れそうということで、コストがかからない、ローカルで動く英会話アプリを作っていきます! 何かくの?何ページかに分けて、web APIを実装していこうと思います!デザインのセンスを身につけて、いつかちゃんとフロントエンドも触れるように努力します…現在、以下のページ構成を想定しています。Speech-t...
1日前

「本当にすべてクラウドに送るべき?」ブラウザだけで動くローカルAIアシスタントを開発しました
Zennの「生成 AI」のフィード

はじめまして! 👋私たちは「NativeMind」というブラウザ拡張を作り、オープンソースとして公開しました。私は普段からAIツールをよく使っています。毎日のようにChatGPTやClaude、NotebookLMなどを活用していますが、ふとした瞬間に「これらのツールは本当に安全なのかな?」と考えてしまいます🤔。また、AIを使えば使うほど、自分の好みに合った情報だけが提示されて、知らず知らずのうちに新しい情報の偏り(フィルターバブル)ができてしまっているのではないかとも感じています。そんな不安から生まれたのが、ローカルで動くAIブラウザアシスタント「NativeMind」です。...
1日前

「AIエージェントキャッチアップ #43 - BrowserGym」を開催しました
Generative Agents Tech Blog

ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #43 - BrowserGym」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com BrowserGym 今回は、Webエージェント研究のためのフレームワーク「BrowserGym」をキャッチアップしました。 BrowserGymのGitHubリポジトリはこちらです。 github.com 今回のポイント BrowserGymとは BrowserGymは、Webエージェントの研究を加速するための、オープンで使いやすく拡…
1日前

ドキュメント整備をDevinに任せたら、4週間分の作業が6時間のレビューで完了した話
236
Zennの「AI」のフィード


はじめに弊社エスマットでのファームウェア開発において、しばらく悩まされていた課題だった技術ドキュメントの整備を AI エージェントの Devin に任せてみました。結果として、人手で 4 週間と見積もられた作業が、わずか 6 時間のレビュー作業で完了。合計で 1 万行を超える Markdown ドキュメントが作成され、ファームウェアの理解促進と AI コーディング精度の向上という目標を実現できそうなところまできました。この記事では、Devin を活用したドキュメント整備の具体的なアプローチと、実際の運用で得られたノウハウを共有します。 背景:散在・陳腐化したファームウェアド...
1日前

Agent Development Kit 1.9.0 で追加された 新たなPluginのCallback
Zennの「生成 AI」のフィード

こんにちは、サントリーこと大橋です。今日(2025/07/24)Agent Development Kit(以下 ADK) 1.9.0がリリースされました。https://github.com/google/adk-python/releases/tag/v.1.9.0主な更新内容はadk webで起動するFastAPIサーバーをモジュール化し、再利用・カスタマイズしやすい形式に変更新たなPluginのCallback(on_tool_error_callback, on_model_error_callback)追加GeminiのRetryOptions今回はこの中で...
1日前

Agent Development Kit 1.9.0 で追加された 新たなPluginのCallback
Zennの「LLM」のフィード

こんにちは、サントリーこと大橋です。今日(2025/07/24)Agent Development Kit(以下 ADK) 1.9.0がリリースされました。https://github.com/google/adk-python/releases/tag/v.1.9.0主な更新内容はadk webで起動するFastAPIサーバーをモジュール化し、再利用・カスタマイズしやすい形式に変更新たなPluginのCallback(on_tool_error_callback, on_model_error_callback)追加GeminiのRetryOptions今回はこの中で...
1日前

はじめてのMCPサーバー入門
Zennの「生成 AI」のフィード

はじめにヘッドレスCMS「NILTO」所属のえぬさんです。本記事では、AIエージェントと外部ツールを連携させるための重要な仕組みであるMCP(Model Context Protcol)サーバーの基本的な知識と、MCPサーバーをゼロから構築し、実際にAIエージェントから試す方法までを解説します。 MCPサーバーとは?MCPサーバーとは、一言で言えば「AIエージェントと外部ツールをつなぐ窓口」です。AIモデルは、モデル自身が直接外部サービスやデータを操作することはできません。そこで登場するのがMCPサーバーです。AIモデルがこのツールを使いたいと判断すると、そのリクエストを...
1日前

生成AIにおけるハルシネーション防止するには?
Zennの「生成 AI」のフィード

こんにちは今回は、生成AI、特に大規模言語モデル(LLM)の利活用において避けて通れない課題である「ハルシネーション」について、私が実践している具体的な対策を社内LT会で発表しましたので共有をします!先に言っておくと、魔法の銀の弾丸はありませんが、現実的かつ再現可能なアプローチをご紹介します。 ハルシネーションとはハルシネーションとは、AIが誤った情報を「幻覚」のようにユーザーに認識させてしまう現象を指します。最大のリスクは、誤情報を“正しい”かのように提示してしまう点にあります。特に、重要な意思決定が絡むケースでは、出力内容の信頼性を担保するための工夫が必須です。...
1日前

生成AIにおけるハルシネーション防止するには?
Zennの「LLM」のフィード

こんにちは今回は、生成AI、特に大規模言語モデル(LLM)の利活用において避けて通れない課題である「ハルシネーション」について、私が実践している具体的な対策を社内LT会で発表しましたので共有をします!先に言っておくと、魔法の銀の弾丸はありませんが、現実的かつ再現可能なアプローチをご紹介します。 ハルシネーションとはハルシネーションとは、AIが誤った情報を「幻覚」のようにユーザーに認識させてしまう現象を指します。最大のリスクは、誤情報を“正しい”かのように提示してしまう点にあります。特に、重要な意思決定が絡むケースでは、出力内容の信頼性を担保するための工夫が必須です。...
1日前

写真の中を自由に歩き回れるAI「Yume」、AIが自律的に新しいAIを開発する「ASI-ARCH」など生成AI技術5つを解説(生成AIウィークリー)
2
テクノエッジ TechnoEdge


回の「生成AIウィークリー」(第106回)は、写真1枚からその中を自由に歩き回れる動画世界を生成できるAIモデル「Yume」、AIが自律的に新しいAIアーキテクチャを設計・実装・検証するシステム「ASI-ARCH」を取り上げます。
1日前

DifyなどAI社内活用の試行錯誤の末に辿り着いたのは、Notion AIだった
Zennの「LLM」のフィード

はじめに企業での生成 AI 活用は今や必須となりましたが、セキュリティや運用コストの観点から導入ツールに悩む企業も多いのではないでしょうか。私たち Contrea でも 2024 年初頭からさまざまな 社内AI ツールを試行錯誤してきました。最終的に Notion AI に落ち着いた経緯と、その決め手となったポイントについてお話しします。 企業 AI 導入の課題ChatGPT の登場当初、最大の課題はセキュリティでした。社外秘情報を安全に扱えないため、多くの企業が導入を躊躇していました。そこで私たちが最初に検討したのは、学習やデータ保持を行わないAPI を活用したオンプレ...
1日前

“生成AI活用”を明らかにし始めたゲーム企業たち セガ、コロプラ、カプコン……各社の現在地は
21ITmedia AI+ 最新記事一覧

国内ゲーム大手各社が、生成AIの活用を続々と公表し始めている。大規模言語モデル(LLM)活用を中心とした導入事例が次々と明らかになっており、7月22日~24日にかけてパシフィコ横浜で開催されたゲーム開発者向けカンファレンス「CEDEC2025」でもAI関係のセッションが目立った。各社による活用の現在地は。
1日前

ライブラリ脆弱性に対するAIトリアージの試み
1
エムスリーテックブログ


お疲れ様です。エムスリーでセキュリティなどを担当している山本です。 最近は「生成AI x セキュリティ」にも関心を寄せており、色々と試していますので、その辺りの話をブログリレーの中で書いてみたいと思います。 テーマは「検出された少ないライブラリ脆弱性にどのようにAIを武器にして向き合っていくか」です。 脆弱性検出とその対処 脆弱性情報から脆弱性の実効性探索へ 脆弱性情報の収集と形式化 トリアージの試み 「脆弱性判定プロンプトを作れ」 実際のプロジェクトに適用 人間による評価 今後やりたいこと 他にも試していること We are hiring!
1日前

【AIトレンド解説】MLLMを分かりやすく解説!求められる高品質データとは?
Zennの「機械学習」のフィード

はじめにマルチモーダル大規模言語モデル(Multimodal Large Language Model、以下MLLM)とは、テキストに加えて画像、音声、動画、センサーデータなど、複数の情報形式(モダリティ)を統合的に処理・理解・生成できるAIモデルのことです。 MLLMはどのようなタスクに対応可能?MLLMは、単なる「文章の理解」にとどまらず、「画像を読み取り」、「音声を聞き取り」、「映像の動作やシーンを把握する」といった、複数のモーダリティを横断的に理解する能力を備えています。このようなクロスモーダルな理解能力により、MLLMは以下のような高度かつ複雑なタスクの実行を可...
1日前

【AIトレンド解説】MLLMを分かりやすく解説!求められる高品質データとは?
Zennの「生成 AI」のフィード

はじめにマルチモーダル大規模言語モデル(Multimodal Large Language Model、以下MLLM)とは、テキストに加えて画像、音声、動画、センサーデータなど、複数の情報形式(モダリティ)を統合的に処理・理解・生成できるAIモデルのことです。 MLLMはどのようなタスクに対応可能?MLLMは、単なる「文章の理解」にとどまらず、「画像を読み取り」、「音声を聞き取り」、「映像の動作やシーンを把握する」といった、複数のモーダリティを横断的に理解する能力を備えています。このようなクロスモーダルな理解能力により、MLLMは以下のような高度かつ複雑なタスクの実行を可...
1日前

[2025年8月1日] GPT-5を待ちながら (週刊AI)
Zennの「LLM」のフィード

こんにちは、Kaiです。今週はあまり大きな話題はありませんでした。Claude Codeノウハウも一段落して、皆それぞれの使い方で最適化してきたようなイメージですね。ただ、最近のアップデートで急に能力が下がったという話も出ており、ダウングレードして使っている人もいるようです。当社ではDevinも使い始めましたが、まだなかなか使いこなせていません。やはりノウハウの言語化、暗黙知のナレッジ化とセットで進めなければ、意図しない動作が増えてしまうと感じています。それと、やはり何か詰まったときの問題解決能力では、Claude Codeが頭一つ抜けているように思います。さて、そしてGPT-5の...
1日前

Google DeepMind、地球マッピングAI「AlphaEarth Foundations」公開
1ITmedia AI+ 最新記事一覧

Google DeepMindは、地球の地図作成のためのAI基盤モデル「AlphaEarth Foundations」を発表した。仮想衛星のように地球全体を統一的にマッピングし、食料安全保障や森林破壊などの問題解決に貢献する。生成されたデータはオープンライセンスで公開される。
1日前

Looker Studioの計算フィールドを解説
G-gen Tech Blog

G-gen の min です。Looker Studio の機能である計算フィールドについて、その概要から具体的な使い方、トラブルシューティングを解説します。 計算フィールドとは 計算フィールドの種類 計算フィールドの作成方法 データソースの計算フィールドを作成する レポート固有の計算フィールドを作成する 関数 関数とは CASE 文の使い方 トラブルシューティング 構文エラー データ型の不一致 集計エラー 計算フィールドとは Looker Studio における計算フィールドとは、データソースに元々存在するフィールドを基に、関数や数式を用いて新しいディメンションや指標を作成する機能です。 例…
1日前

音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox)
18
テクノエッジ TechnoEdge


AI作曲サービスとしてはSunoが総合力で突出して、それに音質一点突破でUdioが続くという構図が長く(といっても1年くらいですが)続いてきましたが、異変が起きました。
1日前

“生成AI映画”が劇場公開へ 「カメ止め」撮影監督など参加、映像・音声・音楽にAI活用 8月29日から上映
42ITmedia AI+ 最新記事一覧

映像と音声、音楽で生成AIを活用した映画「generAIdoscope:ジェネレイドスコープ」が、映画館「アップリンク吉祥寺」で8月29日から上映される。
1日前

「AIオペレーター」はコンタクトセンターを変えるか? ソフトバンク子会社が開発
1ITmedia AI+ 最新記事一覧

生成AIのSaaSによる開発・運用とコンサル事業を手掛けるGen-AX(ジェナックス)は、コンタクトセンターにおける自律思考型AIの音声応対ソリューション「X-Ghost」(クロスゴースト)を開発した。
1日前

AI時代の不都合な真実 「AI導入したのに業務負担増加」はなぜか
2ITmedia AI+ 最新記事一覧

Asana Japanの公表した調査結果によれば、AI導入が進むものの業務効率化が進んでおらず調整業務が増加している実態があるようだ。その背景には何があるのか。
1日前

2025年の生成AIモデルへの投資は142億ドル Gartnerが「専門分野特化型LLMが拡大する」と予測する背景は?
3ITmedia AI+ 最新記事一覧

Gartnerは、2025年の世界における生成AIモデルへのエンドユーザー支出が142億ドルに達するとの予測を発表した。さらに、業種や業務に特化した「DSLM」の導入が急速に進むという。その背景には何があるのか。
1日前

「私はロボットではありません」をAIが突破? 使われたプロンプトとは
2ITmedia AI+ 最新記事一覧

Redditでの投稿により、OpenAIのAIエージェントがCloudflareのアンチbot検証を突破した事例が注目されている。AIが既存のセキュリティ対策を無効化しつつあり、AIの進化が倫理的・実用的観点で重大な課題を突き付けている。
1日前

AIエージェント元年に考える、これからのITインフラやシステム戦略とは――調査から読み解く3つのAIエージェント活用フェーズと、欠かせない「仕組み」
1ITmedia AI+ 最新記事一覧

Clouderaが実施した調査によるとグローバルで57%、日本でも43%の企業が過去2年以内にAIエージェントの導入を開始しており、2025年はまさに「AIエージェント元年」と呼べる年になります。ユーザーの意図を理解し自律的に推論、行動するAIエージェントは、既存のワークフローを再定義し、ITインフラやシステム戦略の抜本的な見直しを迫るものとなるでしょう。本稿では、AIエージェント導入のステップを3つのフェーズに分けて解説するとともに、導入を成功に導くためのインフラ、セキュリティ、データガバナンスの在り方を考えます。
2日前

Manusとは?完全自立型AIエージェントManusの自律性と可能性
Zennの「機械学習」のフィード

はじめにエンジニア2年目のものです。最近、名前を耳にする自立型AIエージェントmanusについて、気になったので記事として、記録に残したいと思います。 AIは「指示待ち」から「自律行動」へ冒頭の問いかけ: 「もしAIが、与えられた一つの目的を達成するために、自ら考えて行動し、試行錯誤を繰り返すとしたら、私たちの働き方はどう変わるでしょうか?とても気になりますね、manusについて見ていきましょう。 Manusとは何か?Manusとは、単なる質問応答ツールではなく、ユーザーの目的を達成するために自律的に計画を立て、実行するAIエージェントです。!自立型AIエージェ...
2日前

Go1.25リリース連載:sync
1
フューチャー技術ブログ


<img src="/images/20250801a/top.jpg" alt="" width="1024" height="599"><h1 id="はじめに"><a href="#はじめに" class="headerlink"
2日前
7/31 (木)

人間の認知機能に倣ったAGIアーキテクチャの提案【論文要約】
Zennの「LLM」のフィード

はじめにこんにちは、AIエンジニアを目指しているmitaです!今回は、A Universal Knowledge Model and Cognitive Architecture for Prototyping AGIという2024年1月ごろにArtem Sukhobokov氏らが発表したAGIを構成するアーキテクチャを提案している論文を要約 & 考察していきます。https://arxiv.org/pdf/2401.06256 論文要約- AGIを「人間のように多様な課題を解き、異なる領域に適応する存在」と定義- それを作成するために人間の認知機能をモデル...
2日前

【雑談】ツール?習慣?雑談しながら考える"生産性"
Zennの「生成 AI」のフィード

こんにちは!アンドドット技術広報です。社内Podcast「Dot talks」では、アンドドットで働くメンバー同士の会話を中心に、日々の取り組みや考え方をリアルにお届けしています。今回のテーマは「生産性を上げるためにこだわっていること」。共同創業者の東川、CTOの高根沢、SHIFT AIの石井が、雑談のようにこれまで以上にゆるっと日々の工夫や“生産性の源泉”について語り合いました。本記事では、音声の書き起こしをもとに一部編集・再構成し、会話の雰囲気をお届けいたします。👉 Podcast本編はこちら 移動時間×AIで生産性を最大化石井:早速本題に入っていきますね。生産性を...
2日前

アンドドットが仕掛ける新規事業。生成AIは『事業化のスピード』をどう変えた?
Zennの「生成 AI」のフィード

こんにちは!アンドドット技術広報です。社内Podcast「Dot talks」では、アンドドットで働くメンバー同士の会話を中心に、日々の取り組みや考え方をリアルにお届けしています。今回のテーマは「生成AIは事業のスピードをどう変えたか?」。登場するのは、CTOの高根沢、CEOの茨木、そしてファシリテーターを務める共同創業者の東川。複数の新規事業を並行して進めるアンドドットの開発現場で、なぜ少人数でもこれだけのスピードでプロダクトをリリースできるのか。本記事では、音声の書き起こしをもとに一部編集・再構成し、リアルな会話の熱量そのままにお届けいたします。👉 Podcast本編を聴く...
2日前

mabl CLIでエクスポートしたテストをPlaywrightで動かすときの注意点
Ubie テックブログのフィード

はじめにmablのテストを実行回数を気にせず高頻度に回したいと思ったことはありませんか?私はあります。この記事では、mabl CLIでエクスポートしたPlaywrightテストを実際に動作させるまでにハマったポイントをまとめます。mabl CLIについては公式のヘルプをご確認くださいhttps://help.mabl.com/hc/ja/articles/17752848113556-mabl-CLIの概要 1. planに乗っているテストをまとめてエクスポートできないmabl CLIでは、planに含まれるテストを一括でエクスポートする機能が提供されていません。各テス...
2日前

AIプロダクトの立ち上げで学んだ「評価は Day 1 から」
1
Zennの「生成 AI」のフィード


!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の102週目の記事です!2年間連続達成まで残り4週となりました!初めまして、ログラスのKagaya(@ry0_kaga)です。ここ1年弱の間はAIプロダクトの新規立ち上げに勤しんでいました。アイディア・営業スライドだけから始まり、MVPリリース、更新まで回すことができましたが、その過程で色々な反省や学びがあります。今回はその中でも評価・Evalにフォーカスして、体験・失敗談についてセルフ振り返りをしてみます。!こうすべき!というベストプラクティスやレベルの高い取り組み、具体の提...
2日前

AIプロダクトの立ち上げで学んだ「評価は Day 1 から」
1
Zennの「LLM」のフィード


!この記事は毎週必ず記事がでるテックブログ Loglass Tech Blog Sprint の102週目の記事です!2年間連続達成まで残り4週となりました!初めまして、ログラスのKagaya(@ry0_kaga)です。ここ1年弱の間はAIプロダクトの新規立ち上げに勤しんでいました。アイディア・営業スライドだけから始まり、MVPリリース、更新まで回すことができましたが、その過程で色々な反省や学びがあります。今回はその中でも評価・Evalにフォーカスして、体験・失敗談についてセルフ振り返りをしてみます。!こうすべき!というベストプラクティスやレベルの高い取り組み、具体の提...
2日前

TradingAgentsを使ってみた
Zennの「LLM」のフィード

TradingAgents とはTradingAgents は、実世界の金融取引組織における職能分担を模倣することで、LLMを用いた金融市場分析および取引判断の研究を支援する目的で設計された、マルチエージェント型のフレームワークです。https://github.com/TauricResearch/TradingAgents各エージェントは以下のような役割を担い、段階的に分析を進めていきます: アナリスト層(分析の基盤)ファンダメンタルズアナリスト:企業財務・業績データをもとに内在価値とリスクを評価センチメントアナリスト:SNSや市場心理をスコアリングし短期的ム...
2日前

【合格体験記】1ヶ月のスキマ時間学習で「生成AIパスポート」に挑戦しました!
Zennの「生成 AI」のフィード

はじめに皆さん、こんにちは!ユアスタンドでファームウェアの開発を担当している安永です。最近、社内でも「生成AI」という言葉を耳にする機会が本当に増えましたよね。私自身、次に学ぶテーマを探していたことや、業務でAIに触れる機会が増えたことから、「生成AIについて体系的に学ぶ必要がある」と感じ、この「生成AIパスポート」という資格を見つけて挑戦してみました。今回は、2025年6月の試験に無事合格できましたので、その経験をシェアしたいと思います!この記事が、皆さんのAI学習へのモチベーションアップに繋がれば嬉しいです。 「生成AIパスポート」とは?ご存知の方も多いかもしれ...
2日前

楽天がAIエージェントで“勝てる”理由とは? 三木谷会長が語る「最強のAI」作るための戦略
2ITmedia AI+ 最新記事一覧

楽天グループの三木谷浩史代表は、横浜市で開催中の同社のAIに関する取り組みを紹介するイベント「Rakuten AI Optimism」の基調講演に登壇し、同社のAI戦略を語った。
2日前

楽天モバイルとWolt Japan、飲食店のAI活用に向け協業
1ITmedia AI+ 最新記事一覧

楽天モバイルとWolt Japanは、AIを活用して飲食業界のDX化を推進するために提携すると発表した。
2日前

# ローカルLLM+LangchainでRAGする
Zennの「生成 AI」のフィード

ローカルLLM便利やんということでいろいろとやってみています。これまでの記録:https://zenn.dev/hi/articles/b85edebde2caa1https://zenn.dev/hi/articles/b2424189179cd7今回はRAGにチャレンジ。ということで、LANGCHAINのドキュメント進めるかぁと思っていたら、なんと日経に連載されている方の記事が公開されていました。なので詳しく知りたい方は↓の方へ!https://www.ntt-tx.co.jp/column/250624/私はJupyterLabで動かしているので、コマンドラインにはせ...
2日前

ブレインパッド採用メッセージ「Change with Essence」 ~創業者高橋と現代表関口によるPURPOSEをテーマとした未来の仲間たちへのメッセージ~
Platinum Data Blog by BrainPad ブレインパッド

「データ活用の促進を通じて持続可能な未来をつくる」 これは、2004年の創業以来、ブレインパッドが掲げ続けてきたPURPOSE(パーパス)です。このPURPOSEに創業者・高橋のどんな思いが込められているのか、そして、このPURPOSEのバトンを受け継いだ現代表の関口が何を想い、何を目指しているのか。この記事では、創業者・高橋と現社長・関口の対談を通じ、PURPOSEに込められた創業の原点から現在地、そして未来への展望を語り尽くします。 ※本記事は、以下の動画の書き起こしです。動画もあわせてご覧ください。 https://www.youtube.com/watch?v=nfgemTkuUto …
2日前

AIの助けを借りて既存プロジェクトの仕様ドキュメントを作成するときはLLMの癖に気をつける
Zennの「LLM」のフィード

所属プロジェクトが変わったので、移動先のプロジェクトの概要や仕様を把握する必要がでてきたのですが、いくつかの壁がありました。このプロジェクトは複数のサービスで構成される。各サービスが果たす役割や扱うデータなどの概要を説明したドキュメントは存在するが、詳細な仕様が書かれたドキュメントがない。各サービスがローカル環境では実行できない(ローカル環境を使用した開発が行われていない)各サービスは主にJavaで書かれているが、私はJavaに触れたことがない。そこでプロジェクトの各サービスの仕様を把握するために、ドキュメント作成とローカル開発環境の構築がプロジェクト移動後の最初のタスクと...
2日前

Yahoo!検索、商業施設の口コミもAIで要約 OpenAIのAPI活用
1ITmedia AI+ 最新記事一覧

「Yahoo!検索」で、ショッピングモールや小売店、百貨店など全国約4万7000カ所の商業施設のクチコミを生成AIが要約し、検索結果上に表示する機能を導入。
2日前

RiverpodとFlutter Hooksで作る、宣言的UIに適したFlutterアーキテクチャ
29
エムスリーテックブログ


デジスマチームの荒谷(@_a_akira)です。最近の特技は、家の外観1枚と内装4,5枚の写真から施工したハウスメーカーを特定することです。AIにはまだ負けません。 この記事はデジスマチームブログリレーの10日目の記事です。 普段はデジスマ診療のアプリ開発を担当していますが、今年の初めから新規事業のアプリをFlutterで開発しました。このアプリは、エムスリーで7つ目のFlutterアプリとなります。 新規開発にあたり、国内外の設計事例やカンファレンスを調査しましたが、「Flutterのアーキテクチャにおける正解は何か」という問いに、未だ明確な答えがないのが現状だと認識しています。 デジスマの…
2日前

大和証券グループ、AIエージェント活用でMicrosoftと複数年契約
1ITmedia AI+ 最新記事一覧

大和証券グループ本社は、社員のAIエージェント活用などについて、日本マイクロソフトと複数年にわたる契約を結んだと発表した。
2日前

SmolVLA×SO-101で色付きキューブ搬送【同期推論】
ABEJA Tech Blog

はじめに SmolVLAとは タスク設定とデータセット作成 タスク概要 環境 データセット作成 SmolVLA のファインチューニング 評価と結果 汎用性の評価 考察とまとめ We Are Hiring! はじめに こんにちは!ABEJAでエンジニアをしている宇留嶋です。2025年5月にオープンソース化されたSO‑101ロボットアームとHugging FaceのLeRobotライブラリを活用し今回Vision‑Language‑Action(VLA)モデルSmolVLAをファインチューニングして「色付きキューブを所定エリアに運ぶ」タスクに挑戦しました。本記事では、データセット作成から学習・評…
2日前

【衝撃】正体不明のAI「Horizon Alpha」がEQベンチで上位帯に殴り込み!GPT-5の前触れ?それとも...
Zennの「機械学習」のフィード

突如現れた謎のAI「Horizon Alpha」に業界騒然2025年7月30日、OpenRouterに正体不明のAIモデル「Horizon Alpha」が突如登場し、AI界隈に衝撃が走っています。開発元は完全に秘匿、しかしEQ-Bench3でGPT-4oクラスの高スコアを記録し、256k tokenの長文処理が無料という破格の条件で注目を集めています。 📊 まず数字で見る「Horizon Alpha」のインパクト項目内容公開日2025-07-30開発元非公開("cloaked model"表記)料金完全無料(テスト期間中)コンテキ...
2日前

【衝撃】正体不明のAI「Horizon Alpha」がEQベンチで上位帯に殴り込み!GPT-5の前触れ?それとも...
Zennの「LLM」のフィード

突如現れた謎のAI「Horizon Alpha」に業界騒然2025年7月30日、OpenRouterに正体不明のAIモデル「Horizon Alpha」が突如登場し、AI界隈に衝撃が走っています。開発元は完全に秘匿、しかしEQ-Bench3でGPT-4oクラスの高スコアを記録し、256k tokenの長文処理が無料という破格の条件で注目を集めています。 📊 まず数字で見る「Horizon Alpha」のインパクト項目内容公開日2025-07-30開発元非公開("cloaked model"表記)料金完全無料(テスト期間中)コンテキ...
2日前

【Dify】webスクレイピングプラグイン Bright Dataを使ってみる
Zennの「LLM」のフィード

公式リリースhttps://x.com/DifyJapan/status/1948673008446701617📢 Dify × Bright Data 新時代のWebスクレイピング!DifyとBright Dataの連携が新たに可能になり、Webからのデータ収集・スクレイピング作業を大きく効率化できます。市場調査や競合他社の動向監視、そして新規顧客の発見といった重要なタスクを、50を超えるプラットフォームで自動化する力をDifyアプリケーションに追加できます。2つのシンプルな連携方法:1)すぐに使えるプラグイン:Difyマーケットプレイスから導入するだけ。詳細はこちら ...
2日前

ゼロから築くAI協働【第一幕】2週間の作業が1日に。AIアシスタントを"育成"し、開発チームの生産性を爆上げした全記録
4
Zennの「LLM」のフィード


「この仕様、誰に聞けば分かるんだっけ…?」開発チームなら、一度は経験するこんな場面。その原因は、ドキュメントが古びて"遺跡"化しているか、更新が追いつかないか、あるいは——そもそもドキュ-メントなんてものが、存在しないか。私たちのチームが直面していたのは、まさに最後の「ドキュメントが無い」という状況でした。全てがチームメンバーの頭の中にしかない、いわゆる"暗黙知"の状態です。正直、ドキュメント作りって、めちゃくちゃ大事なのは分かっているけど、ゼロから作り上げるのは、本当に骨の折れる作業なんですよね。もし、そんな絶望的な状況から、チームの"教科書"となるドキュメントをたった1日で作...
2日前

自然言語からABEMAの広告プランを自動生成するAIエージェント開発録
CyberAgent Developers Blog | サイバーエージェント デベロッパーズブログ

はじめに はじめまして! 東海大学情報理工学部コンピュータ応用工学科4年の有馬勇人です。私は2025 ...
2日前

形式手法入門:生成 AI 時代の『設計』のあり方について
86
CyberAgent Developers Blog | サイバーエージェント デベロッパーズブログ


はじめに こんにちは、2025 年新卒で ABEMA の広告配信システム開発チームに所属している戸田 ...
2日前

【Next Tokyo】いよいよ来週開催!人気セッションは満席間近
Google Developers Japan

プログラムガイド公開、会場おすすめ情報をお見逃しなく2025 年 8 月 5 日(火)、 6 日(水)に開催する旗艦イベント Google Cloud Next Tokyo のプログラム ガイドを公開しました。会場内 MAP や、セッション タイムテーブル、EXPO のブース位置などの確認にご活用ください。イベント登録がまだの方は、今すぐ公式サイトからご登録ください!基調講演 先着特典今年は熱いアイテムをご用意Day 1 はサウナマット、Day 2 はサウナハットをそれぞれ 500 名様にプレゼント!(なくなり次第終了)ExpoGoogle Cloud の最先端テクノロジーを体感できる注目ブースやエキスパートによるステージ、多様なラーニング プログラムでクラウドスキルを向上!ソーシャル投稿キャンペーンNext Tokyo での体験や学びの投稿に「いいね」が最も多かった方に記念品をプレゼント!* 条件は公式サイトをご確認ください。注目!ブレイクアウト セッション☁️ 日本で初めて Google Distributed Cloud Connected を採用してみた!日本特殊陶業 藤井 亘
2日前

DX最大の壁は「過去の成功」──花王が“必勝パターン”をあえて捨て、大ヒット商品を生み出せたワケ
1ITmedia AI+ 最新記事一覧

時には過去の成功体験を捨て、思い切って新しい手法を試さなければならない。こうした学びを与えてくれるのは、経済産業省と東京証券取引所が「DX注目企業2025」に選定した花王の事例である。同社の常務執行役員で、デジタル戦略部門を統括する村上由泰氏に話を聞いた。
2日前

AIが本当に"私らしい"答えをしてる?パーソナライズ精度を測る8つの方法
Zennの「機械学習」のフィード

はじめにこんにちは!データサイエンティストのふるるんです。生成AIをサービスに組み込む際、個々のユーザーに合わせてモデルを最適化(パーソナライズ)した後、本当にそのユーザーにフィットしているのかを定量的に検証する工程って、意外と見落とされがちなんですよね。本記事では、最新研究で提案されている 8種類のローカル評価指標 を整理し、N1読者(生成AI活用に興味があるエンジニア〜PM)向けに 具体的な計測フローと直感的な評価例 を紹介します。Kaggleでの分析経験も活かして、実践的な内容にまとめてみました! 1. 8つの評価指標一覧#指標カテゴリ代表メトリクス (...
2日前

AIが本当に"私らしい"答えをしてる?パーソナライズ精度を測る8つの方法
Zennの「LLM」のフィード

はじめにこんにちは!データサイエンティストのふるるんです。生成AIをサービスに組み込む際、個々のユーザーに合わせてモデルを最適化(パーソナライズ)した後、本当にそのユーザーにフィットしているのかを定量的に検証する工程って、意外と見落とされがちなんですよね。本記事では、最新研究で提案されている 8種類のローカル評価指標 を整理し、N1読者(生成AI活用に興味があるエンジニア〜PM)向けに 具体的な計測フローと直感的な評価例 を紹介します。Kaggleでの分析経験も活かして、実践的な内容にまとめてみました! 1. 8つの評価指標一覧#指標カテゴリ代表メトリクス (...
2日前

Google、AI年齢推定でYouTubeや広告を自動制限 米国で開始
1ITmedia AI+ 最新記事一覧

Googleは、AIによる年齢推定モデルの利用を米国で開始した。自己申告に関わらず18歳未満と判定されたユーザーに対し、YouTubeの利用時間制限や位置情報記録の無効化など、年齢に適した保護設定を自動で適用し、若者の保護を強化する。
2日前

💬 ChatGPT と一緒に漫画を創る! 画力ゼロのエンジニアの創作プロセス
Zennの「生成 AI」のフィード

Create Comics with ChatGPT! The Creative Process of a Zero-Art-Skills Engineer. 1. 概要 (Overview)AI で漫画って具体的にどう作るの? 🤔・・・と気になったことは無いでしょうか?2025/03 に ChatGPT がアップデートされた際、その画像生成機能が話題になりました。今回のこの記事では AI での漫画作りについて、画力ゼロのエンジニアの私が 2025/04 ~ 06 にChatGPT 無料版で試行錯誤したものを元に紹介します。生成 AI の進化は非常に速いため、クオリティ自...
2日前

生成AIでのテスト設計はこの「勘所3つ」を押さえれば大丈夫
2
Zennの「生成 AI」のフィード


はじめにこんにちは!アルダグラムでQAのお手伝いをしているmiyashitaです!最近、QAのシステムテスト設計でもAI使いたいなぁ~と思い、色々と試行錯誤していました。その中で、こんな勘所を持っていたらAIでうまくテスト設計していけるのかも?と感じたところがありましたので、今回はそちらを紹介できればと思います。 使用するツールChatGPT:o4-mini-high 今回やりたいこと仕様書を解析して、テスト観点表を作成してもらう仕様書及びテスト観点表を基に、テストケースを作成してもらう 主な勘所AIをテスト設計で活用するための勘所は、以下の3つです...
2日前

「Confluenceの検索、精度が悪くてRAGに活用しにくい」にどう挑む? Cygamesの試行錯誤
44ITmedia AI+ 最新記事一覧

Confluenceを活用したRAGの問題。Cygamesはどう解決する?
2日前

LLM初心者が OpenAI の Deep Research API を使ってみた
OPTiM TECH BLOG

🌅はじめに 🤖Deep Research とは 👍Deep Research API でできること ✅実際に使ってみた 1. ユーザ質問受付 2. フォローアップ質問生成・回答 3. プロンプト書き換え・確認 4. Deep Research 実行 💭試してみた感想 コストについて 扱いが若干難しい 出力結果について 📚おわりに 🌅はじめに こんにちは!R&Dチームに配属されました、25卒(新卒)の栗林です。 私はポテンシャル採用というプログラミング未経験者として入社し、約3か月のIT研修を経て、現在はエンジニアとして日々新たな知識と技術の習得に励んでいます。 今回は、2025年6月27日にO…
2日前

MetaのザッカーバーグCEO、「パーソナルな超知能をすべての人に」 AI戦略を語る
6ITmedia AI+ 最新記事一覧

MetaのザッカーバーグCEOは、AI戦略に関する書簡「Personal Superintelligence」を公開した。AIは個人のエンパワーメントのためのツールだとし、「すべての人にパーソナルな超知能を」というビジョンを示した。AIメガネがその主要なデバイスになると強調する。
2日前

H200 GPU x 8基で Qwen2.5-VL-72B-Instruct を使った OCR を試してみる
19
ABEJA Tech Blog


ABEJAでデータサイエンティストをしている藤原です。 今回は、株式会社ハイレゾ様のGPUクラウドサービス「GPUSOROBAN」で H200 GPU × 8基構成のシングルノードサーバを用いて、大規模モデルを使用した検証を実施しました。本記事では、その検証でのGPUサーバの使用方法や、検証内容の一つである Qwen2.5-VL-72B-Instruct を用いたOCRの結果についてご紹介します。 highreso.jp はじめに GPUクラウドサービス「GPUSOROBAN」について GPUサーバの使い方の方針と事前準備 Qwen2.5-VL-72B-Instruct を使った OCR を試…
2日前

Raspberry Pi で作るWebカメラ映像配信(物体検出機能付き)
ABEJA Tech Blog

はじめに ABEJA 新卒エンジニアの和田です。 趣味で購入した Raspberry Pi が使われずに眠っていたため、USB 接続の Web カメラでリアルタイム映像を取得し、何か面白いことをしたいと思い立ちました。本記事では、低コストかつシンプルに映像入力環境を整える方法として、Raspberry Pi と USB カメラを用いたリアルタイム物体認識ストリーミングの構築手順を解説します。必要なのは Raspberry Pi 4 Model B と USB カメラだけ。数十分で映像のキャプチャから物体検出、ブラウザ配信までを一気に実現できます。この仕組みを作ることで、まず自宅に設置したカメラ…
2日前

自然言語での質問を基にBigQueryにクエリするエージェントをADKで開発
G-gen Tech Blog

G-gen の杉村です。人間からの自然言語での質問に基づいて BigQuery にクエリを実行する AI エージェントを、Agent Development Kit(ADK)で開発する方法を紹介します。 概要 Agent Development Kit(ADK)とは BigQuery ツールセット 実装 ソースコード エージェント定義と非同期実行 BigQuery ツールの定義 BigQuery を使うエージェントの定義 動作確認 最終回答 エージェントとツールの挙動 精度確認 質問のしかたを変える 複雑な質問 会話型分析(参考情報) 概要 Agent Development Kit(ADK)…
2日前

ソフトバンク、AIエージェント間通信の安全性向上技術を開発 A2A、ACPを補完
1ITmedia AI+ 最新記事一覧

ソフトバンクはAIエージェント間の安全な連携を実現する技術のプロトタイプ開発に成功したと発表した。この技術は異なる管理基準でもAIエージェントが安全に通信できる仕組みを構築し、動的ガバナンス制御や認証・認可などの特徴を持つ。
2日前

Go 1.25 リリース連載 log/slog
4
フューチャー技術ブログ


<img src="/images/20250731a/top.jpg" alt="" width="512" height="512"><h1 id="はじめに"><a href="#はじめに" class="headerlink"
3日前
7/30 (水)

Agentic Coding時代のオープンソースLLM — GLM-4.5と3B Active実践比較
Zennの「LLM」のフィード

Agentic Coding時代のオープンソースLLM — GLM-4.5と3B Active実践比較「AIにコードを書かせるだけでなく、ツールを使わせて複雑なタスクを自動化したい」「でもOpenAI APIのコストとデータ流出リスクが気になる」—— そんなAgentic Coding時代の課題に、オープンソースLLMが新たな解を提示しています。2025年1月、GLM-4.5(Z.ai)とQwen3-30B-A3B(Alibaba Cloud)という、コーディング+エージェント機能に特化した強力なオープンソースLLMが相次いでリリースされました。どちらもGPT-4レベルの性能を持...
3日前

もうLoadの前処理は不要? BigQueryのデータロードを劇的に改善する4つの新機能
Google Cloud Japanのフィード

tl;drBigQueryのLOAD DATAが強化。タイムゾーン/日時形式の変換、複数NULL値の対応、CSVの列名マッチングがSQLだけで可能になりました。BigQueryをお使いの皆さん、こんにちは!BigQueryへデータを投入する際、ソースデータの形式が多種多様で頭を悩ませた経験はありませんか? これまでは、日時のフォーマットを変換したり、NULL値を整形したりするために、Dataflowなどで前処理パイプラインを組む必要があり、余計なコストと複雑さが課題でした。そんな悩みを解決する、待望のアップデートのお知らせです!🎉この度、BigQueryのデータロー...
3日前

DSPyを用いたAIエージェントの構築への入門
Zennの「LLM」のフィード

今回はDSPyを用いてAIエージェントを開発するチュートリアルを試してみたので共有します。DSPyは昨日公開したmlflow3のプロンプト最適化に関する機能のバックボーンとして利用されていたため、気になって調べた次第です。https://zenn.dev/akasan/articles/a1fec87efaa4a6 DSPyとは?前回の記事にも書きましたが、DSPyは以下のような特徴を持つライブラリとなります。モジュール型AIソフトウェアを構築するための宣言型フレームワークであり、脆弱な文字列ではなく構造化されたコードを高速に反復処理でき、AIプログラムを言語モデルに適した効...
3日前

Claude Codeのカスタマイズ機能:カスタムスラッシュコマンドとカスタムサブエージェントの使い分け
Zennの「LLM」のフィード

Claude Codeでは、カスタムサブエージェント機能が追加され、自動化の選択肢が拡がりました。カスタムスラッシュコマンドとカスタムサブエージェントの特徴と使い分けについて解説します。 カスタムスラッシュコマンドシンプルなテンプレート実行を目的とした機能。Markdownファイルでプロンプトテンプレートを定義し、スラッシュコマンドで呼び出します。 ファイル配置場所ユーザー全体: ~/.claude/commands/プロジェクト固有: [プロジェクトルート]/.claude/commands/ カスタムサブエージェント複雑な多段階タスクを自律実行する専門...
3日前

Kiroがまだ使えない😭ので自作した! #1
4
Zennの「生成 AI」のフィード


はじめに話題のkiro使いたかったのですが、残念ながらwaiting list待ち。。いつになったら使えるのやら。ということで、待つのもダルいし作ろうというわけです。むしろゼロから作ることで新しいカスタマイズ性や新たな発見があるかもしれません。まずは使ってみないことには課題もわかりません。 今回の開発ターゲットkiro自体は、①requirements:要求仕様書(Eras)②design:設計書③tasks:設計書に基づくタスク④code:タスクで定義されたコード…など複数の成果物をステップバイステップで作成します。普段の自分の業務にもせっかくならすぐに使える...
3日前

Claude Codeの利用状況をブラウザから確認できるツール「CCDash」を作りました
Zennの「LLM」のフィード

Claude Code、便利ですよね!私も Pro Plan で利用しているのですが、かなりの頻度で使用制限に達してしまい、作業の途中でタスクが進められなくなることがあります。Claude usage limit reached. Your limit will reset at 6pm (Asia/Tokyo).現在はコマンドラインから使用量を確認できる Claude-Code-Usage-Monitor などのツールもありますが、「ブラウザから確認できて、詳細なログが見えたらもっと便利なのでは?」と思い、CCDash というツールを作ってみました。 CCDashの使...
3日前

自分で分解してバッテリー交換や修理もできちゃう「Fairphone (Gen. 6)」がキニナル(スマホ沼)
1
テクノエッジ TechnoEdge


Fairphone (Gen. 6)は背面アクセサリや修理・分解可能な環境配慮型スマホで、交換・装着できるアクセサリや新しいUI機能を搭載し、長く使える設計。
3日前

Claude Codeで効果的なAIコーディングを実現するボイラープレートを公開しました
8
Zennの「LLM」のフィード


AIコーディングを効果的に実行できるボイラープレートを作りました。https://github.com/shinpr/ai-coding-project-boilerplate作成しようと考えたきっかけは、最近数名のエンジニアと話す中で、AIコーディングの領域でも人によってそれなりに活用状況の差があるのを実感したことです。さらに、よくよく話を聞くと、思ったとおりの結果が生成されなかったことで、そこから先の活用が推進されていかないということが分かりました。そのため、要件の整理などは人と協働しながらも実装はAIが自律的に行える一式のルールとSub agentsをボイラープレートとして...
3日前

Android Auto向けのアプリを開発してみた
1
エムスリーテックブログ


デジスマチームでソフトウェアエンジニアをしている大和です。車で全国各地の温泉を巡るのが趣味です。今回は運転中の困りごとを解決するために開発したAndroid Auto向けアプリの開発過程を通して、開発方法について共有していきます。 この記事はデジスマチームブログリレーの9日目の記事です。 開発のきっかけ 開発するアプリの内容 Android Autoについて Android Autoアプリ開発の基礎知識 制限 サポートされているアプリカテゴリ Android for Cars アプリライブラリとテンプレート 開発環境の設定 Android Studio (Android SDK) の設定 開発…
3日前

【備忘録】Claude Codeの強制自動更新を止める方法 - autoUpdates falseが効かない時の対処法
1
Zennの「LLM」のフィード


!この記事は、GeminiくんやChatGPTくん、Claudeさんの力を借りて書いてます。 TL;DRClaude Codeでコンテキスト喪失やコード削除などの深刻な問題が発生中?旧バージョン(1.0.33など)へのダウングレードで回避可能通常のautoUpdates: false設定では強制更新を止められない対処手順:which claudeで実行パスを確認し、競合ファイルがあれば削除npm install -g @anthropic-ai/claude-code@1.0.33で安定版をインストール~/.claude/settings.jsonに"...
3日前

【重要】Tech BlogをZennに移行しました
ELYZA Tech Blog

日頃より当Tech Blogをご覧いただき、誠にありがとうございます。 この度、当ブログは下記のURLへ移転いたしました。 zenn.dev 今後は、新しいブログにて情報を発信してまいります。 お手数をおかけしますが、ブックマークやRSSフィードの再登録をいただけますと幸いです。 これからも変わらぬご愛顧を賜りますよう、よろしくお願い申し上げます。
3日前

SO-101で試すSmolVLA非同期推論
1
ABEJA Tech Blog


はじめに SmolVLAとは 非同期推論のメリット 非同期推論スタックの仕組み 全体構成 AsyncInference ServiceのRPC設計とデータフロー 実験 タスク定義 実行コマンド Policy Server起動コマンド Robot Client起動コマンド 実験結果 アクションキューサイズの経時変化 成功・失敗動画 考察とまとめ We Are Hiring! はじめに こんにちは、ABEJAでエンジニアをしている宇留嶋です。今回は Vision‑Language‑Action (VLA) モデルSmolVLAをSO‑101ロボットアーム上で非同期推論してみた結果と、その仕組みをア…
3日前

OpenAI、ChatGPTに『学習モード』を追加。学生の「考える力」を育むため
1
テクノエッジ TechnoEdge


OpenAIは、ChatGPTに新機能「学習モード(Study Mode)」を追加したと発表しました。
3日前

ロボティクス開発における学習用データ不足問題の解決手段?NVIDIA の「Isaac Sim & Lab」を使用してシミュレーター上で学習用データセットを生成する
4
ABEJA Tech Blog


こんにちは!ABEJA で ABEJA Platform 開発を行っている坂井(@Yagami360)です。 先日の記事では、NVIDIA のロボティクス用3Dシミュレーター「Isaac Sim & Lab」を使用して、物理演算が考慮された3Dシミュレーター上でロボティクスモデルを学習させたり推論させたりしながらロボットを動かす方法を紹介しました。 tech-blog.abeja.asia 今回の記事では、同じく Isaac Sim & Lab を使用して、シミュレーター上でのロボット遠隔操作や Isaac Lab Mimic により、ロボティクスモデルの学習用データセットを生成したり、生成し…
3日前

【NotebookLM】アップデート:ビデオ概要とSTUDIO UIの進化【音声概要が複数もてるぞ】
Zennの「生成 AI」のフィード

NotebookLMが、ユーザーの生産性をさらに向上させるための画期的なアップデートを発表しました。今回のアップデートでは、ビデオ概要機能の公開、より柔軟な操作を可能にする新しいSTUDIO UIが導入されました。https://blog.google/technology/google-labs/notebooklm-video-overviews-studio-upgrades/ ビデオ概要の公開NotebookLMのビデオ概要機能は、ノートブックのソースから要点を素早く把握するのに役立つ強力なツールです。Google I/O 2025で発表されてから早く来ないかなと思って...
3日前

GeminiアプリでGitHubリポジトリを解説させてみた
G-gen Tech Blog

G-gen の三浦です。当記事では、特定の GitHub リポジトリの内容を Gemini アプリに解説させる方法を紹介します。 概要 当機能について Gemini アプリとは 前提条件 検証手順 検証 リポジトリとディレクトリ構成 main.py error/error.py パブリックリポジトリのインポート コード理解と改善の確認 プライベートリポジトリのフォルダインポート デバッグとコード生成の確認 概要 当機能について Gemini アプリでは、GitHub のパブリックリポジトリまたはプライベートリポジトリをインポートして、その内容に関する質問や依頼ができます。 この機能は、ソースコ…
3日前

Softbank World 2025で披露した音声応対AI「X-Ghost」の裏側
Zennの「生成 AI」のフィード

こんにちは。Gen-AX CTOの木田です。先日開催された Softbank World 2025 にて、私たちGen-AXが開発中の音声応対ソリューション X-Ghost を発表しました。イベント公式ページはこちら:https://global.tm.softbank.jp/business/sbw/2025/今回は、秋頃に予定している続報に先駆けて、講演内でお見せしたデモビデオと、その裏側にある技術について少しだけご紹介したいと思います。 X-Ghostとは?「X-Ghost」は、Gen-AXが開発を進めている 自律思考型の音声応対ソリューション です。単なる「ボイ...
3日前

Go 1.25リリース連載始まります & trace.FlightRecorder
8
フューチャー技術ブログ


<img src="/images/20250730a/top.jpg" alt="" wigth="512" height="512"><p>Go 1.25 のリリースが近づいてきました。今回は比較的シンプルなアップデートかなと思います。</p><div
4日前
7/29 (火)

Re; ollama+langchainでローカルLLMを動かす
Zennの「生成 AI」のフィード

昨日、OllamaとlangchainでローカルLLM: Gemma3: 12bを動かしました。一方で、画像を渡せなーい・・・と悩んでいたところ、どうも、Langchain_Ollamaのtext completion を使っていたようで、chat completionを使わないといけなかったようです。langchainのchatを使ってたのに・・・というのは自己責任で、そのあとドキュメント読んでたら普通に書いてあることでした。という訳で、今日はうまく動いたことを書いていきます。昨日の記事は次のリンク先にございます。https://zenn.dev/hi/articles/b85...
4日前

PostgreSQL を使ったユーザー検索機能のパフォーマンス改善の話
55
エムスリーテックブログ


こんにちは、デジスマチームでソフトウェアエンジニアをしている伊藤です。 この記事はデジスマチームブログリレーの8日目の記事です。 今回は我々が開発しているデジスマ診療 (以降、デジスマ) で、医療機関向けに提供しているユーザー検索機能のパフォーマンスを PostgreSQL の機能を活用して改善した話について紹介します。 ユーザー検索の課題感 データ構造 検索クエリ Step 1: 仕様の変更で対応できることはないか? Step 2: 部分一致検索のままで高速化できないか? (pg_bigm の導入) Step 3: インデックスを効率的に活用できないか? (2段階検索への分解) Step 3…
4日前

【実践解説】オンプレミスで動く最新画像生成AIモデル「Janus-4o」と高精度データセット「ShareGPT-4o-Image」
Zennの「生成 AI」のフィード

この記事の概要2025年6月22日に出版された最新の「ShareGPT-4o-Image」と「Janus-4o」について解説します。GPT-4o-Imageのような先進的な画像生成AIモデルへは一般的にアクセスすることができません。このような技術を民主化するために、新しい効果的な画像データセットが ShareGPT-4o-Imageで、このデータセットを使って学習された画像生成AIが Janus-4o です。つまり高精度の画像生成モデルをオンプレミスで動かすことができるようになったのです。モデルが公開されているので、本記事では実際に使ってみて、この最新のオープン技術を確かめてい...
4日前

LLMエージェントオブサーバビリティ基盤についてまとめてみた
TECH BLOG | 株式会社AI Shift

はじめに こんにちは、AI チームの長澤 (@sp_1999N) です。 弊社では AI Worker という LLM エージェント構築プラットフォームを提供しています。 LLM エージェントを運用していると重要な要素に […]投稿 LLMエージェントオブサーバビリティ基盤についてまとめてみた は 株式会社AI Shift に最初に表示されました。
4日前

はじめまして! 夏のプロジェクト制作→prompt-injection-visualizer
Zennの「機械学習」のフィード

自己紹介はじめまして!京都産業大学 情報理工学部に通う大学1年生です。将来、トップIT企業で、AIセキュリティの専門家として活躍することを目標に学習しています。 この夏の目標この夏休みは、自分のキャリアにとって最も重要な期間だと思っています。目標は、PythonとFlask(その他)を使い、**「プロンプトインジェクション攻撃を可視化するWebアプリケーション」**を自らの手で開発し、公開することです。このZennでは、その開発過程での学びや、ぶつかった壁、そして日々の気づきなどを記録していきたいと思います。どうぞ、よろしくお願いします!
4日前

Claude Codeを使ってMCPサーバーを開発した
Zennの「生成 AI」のフィード

!Claude Codeを活用してZennの記事フィードを取得するMCPサーバーを開発しました。その際のプロセス・工夫・知見を書き記します。ドキュメント作成はClaude Codeベースで行っていますが、アップロード前に内容には人間が目を通し、修正、加筆しています。 📋 全体の概要成果物: 2つのMCPツール(記事検索・トレンド取得)https://github.com/YusukeHayashiii/zenn-topic-summarize概要目的: Zennの記事フィードを取得するMCPサーバーの開発技術スタック: Python 3.10+, FastMCP...
4日前

生成AI連携型セキュリティアラート管理システム: Warren
20
Zennの「生成 AI」のフィード


小規模なセキュリティチームにとって、大量のアラートを限られたリソースで処理することは大きな課題です。突然発生した数百件のアラートのうち、多くは同じ事象の重複や誤検知ですが、その中に重要なアラートが埋もれている可能性もあります。従来のSOAR(Security Orchestration, Automation and Response)ツールによる自動化は、厳密なワークフローの定義とメンテナンスに多大な労力を要します。システム構成の変更や新しい脅威が発生するたびにワークフローを更新する必要があり、小規模チームでは現実的ではありません。そこで、生成AIを活用したセキュリティ監視ツール「...
4日前

Cloud RunのサイドカーでSMTPのモックサーバーを構築する
G-gen Tech Blog

G-gen の高井(Peacock)です。Cloud Run のサイドカー機能と MailHog を利用し、アプリケーションからのメールを捕捉するダミーの SMTP サーバー環境を構築する方法を紹介します。 はじめに やりたいこと 実現方法 サイドカー機能とは 構成 ソースコード デプロイ 動作確認 はじめに やりたいこと Cloud Run services を使い、メール送信機能があるアプリケーションを開発しているケースを考えます。本番環境のアプリケーションでは SMTP サーバーを利用してメールを送信していますが、開発環境のアプリケーションではメールが外部に送信されないようにしたい場合が…
4日前

撮って飾って盛り上がる!WebAR + プリクラアプリで実現したWomenTechTerrace 2025の会場演出
CyberAgent Developers Blog | サイバーエージェント デベロッパーズブログ

こんにちは。サイバーエージェントでxR(Virtual Reality、Augmented Real ...
4日前

伸びる人の条件についてSlackで話した
8
フューチャー技術ブログ


<img src="/images/20250729a/unnamed.jpg" alt="" width="507" height="384"
5日前
7/28 (月)

時間周波数領域で処理するNeural Vocoder、Wavehax解説
1
Zennの「機械学習」のフィード


TL;DRNeural Vocoderはメルスペクトログラム等の音響特徴量から波形を復元するモジュール従来の時間領域型 (HiFi‑GANなど) はエイリアシングを避けられず高F0などの条件で大きく劣化Wavehaxは時間周波数領域でConv2Dにより処理しiSTFTで合成することで、この問題を根本的に回避Harmonic Priorにより周期情報を明示的に与えるため1Mパラメータ未満でも高品質JVSコーパスによる評価で、学習範囲外の高F0を含む音声でも従来手法と比べて大幅な改善を確認本記事ではNeural Vocoderとは何かから、従来手法の問題点・Waveh...
5日前

Pythonで性格診断アプリ!?
Zennの「機械学習」のフィード

🧠 【プログラミング初心者向け】Python Streamlit x 機械学習で作る性格診断AI機械学習の代表的なタスクであるテキスト分類に挑戦してみませんか?今回は、Python で scikit-learn を使って、キーワードから性格を診断するAIアプリを作成します。TF-IDFとランダムフォレストを使った本格的な機械学習アプリを、初心者でも理解できるように詳しく解説していきます。読み進めていくと、コード量が多く感じるかもしれませんが、可読性工場目的で改行を多用しているためですので!機械学習、テキスト処理、分類問題まで含む本格的なAIアプリを、ステップバイステップで学ん...
5日前

幻の5Gケータイを発見!と思いきや… 怪しいパーツがそろうバンコクの深センを練り歩く(スマホ沼)
テクノエッジ TechnoEdge

バンコクのチャイナタウン付近には深センそっくりのスマホパーツ問屋街があり、5Gフィーチャーフォンらしいものも発見した。
5日前

動画レビュー:Switch 2にも合うゲーミングイヤホン Arctis GameBudsを早口で語る (テクノエッジ アルファ ゲーム部)
テクノエッジ TechnoEdge

Nintendo Switch 2にも合うゲーミングイヤホン、SteelSeries GameBuds (ゲームバッズ)の良いところを早口で語りました。
5日前

マルチエージェント活用術:Google ADKで変わるキャッチコピー生成
1
松尾研究所テックブログのフィード


こんにちは、松尾研究所 シニアデータサイエンティストの浮田です。生成AI界隈がLLM、AIエージェント、マルチエージェントと複雑化する中、Googleが公開した Agent Development Kit(ADK) が注目を集めています。ADKはマルチエージェントや本番運用 (デプロイやObservabilityなど) にも対応したAIエージェント開発フレームワークで、AIエージェントの活用をさらに広げるツールとなっています。この記事では、ADKを使ってキャッチコピーを自動生成するマルチエージェントを構築した過程を紹介します。複数の役割を持つエージェントをどのように設計し、連携したか...
5日前

Flutterで音を奏でよう!リアルタイムオーディオ生成アプリの第一歩
1
エムスリーテックブログ


こんにちは、デジスマチームでソフトウェアエンジニアをしている立花です。 最近の趣味は ゆる言語学ラジオ - YouTube を聞くことです。宜しくお願いします。 このブログはデジスマチームブログリレーの7日目の記事です。 Flutterでリアルタイムオーディオ生成 この記事ではFlutterアプリでリアルタイムに音を生成・再生する仕組みを実装し、最終的にAndroid実機で音を鳴らすまでを解説します。 この記事を読むことでFlutterアプリにリアルタイムオーディオ生成機能を組み込むための第一歩が踏み出せるはずです。 Flutterで音の波形を生成・再生する それでは具体的な実装方法を見ていき…
5日前

HUAWEI Pura80 Ultraの世界初スイッチ式デュアルテレフォトをバンコクの発表会で体験してきた(スマホ沼)
テクノエッジ TechnoEdge

タイのバンコクで7月22日に開催されたファーウェイの新スマートフォン発表イベントに、山根ハカセと行ってきました。
5日前

Cloud Run jobsでGoogle Driveの差分ファイルをCloud Storageに同期してみた
G-gen Tech Blog

G-gen の山崎です。 当記事では、Cloud Run jobs を使用して Google Drive の差分を検知し、差分ファイルを Cloud Storage にアップロードする方法を解説します。 システム構成 前提知識 環境構築 API の有効化 サービスアカウントの構築 Cloud Run jobs 用サービスアカウントの作成 Cloud Scheduler 用サービスアカウントの作成 Cloud Storage の構築 ページトークン格納用バケットの作成 アップロードファイル格納用バケットの作成 Cloud Run jobs の構築 Artifact Registry の作成 アプ…
5日前

欠けて読めない古代ローマ碑文、Googleの生成AIが高精度で復元(生成AIクローズアップ)
3
テクノエッジ TechnoEdge


今回は、古代ローマの碑文の欠けた文字を復元し、その文章の内容や書かれた時代、場所を推定するAIシステムを提案した論文「Contextualizing ancient texts with generative neural networks」を取り上げます。Google DeepMindやノッティンガム大学などに所属する研究者らがNature誌で発表しました。
5日前

Padded cmAP:ビジネス現場で真価を発揮する評価指標の実用的活用法
Zennの「機械学習」のフィード

はじめに機械学習プロジェクトにおける評価指標選択は、ビジネス成果に直結する重要な意思決定です。特に多クラス分類やマルチラベル分類において、クラス間の不均衡が激しい場合、従来のmAPやF1スコアでは「希少クラスで真陽性がゼロ」という問題により、評価が不安定になりがちです。本記事では、この課題を解決する**Padded cmAP(Padded class-wise mean Average Precision)**について、実際のビジネス領域での活用例と具体的な実装方法を詳しく解説します。 Padded cmAPとはPadded cmAPは、各クラスに対して少数のダミー真陽性(...
5日前

GoogleカレンダーをGeminiアプリの外部記憶装置として活用する
1
フューチャー技術ブログ


<p><a href="/articles/20250707a/">AI Tips連載</a>、11日目の記事です。</p><h1 id="はじめに"><a href="#はじめに" class="headerlink"
6日前
7/27 (日)

SepLLM: 句読点で大規模言語モデルを高速化する革新的アプローチ
Zennの「機械学習」のフィード

SepLLM: 句読点で大規模言語モデルを高速化する革新的アプローチ大規模言語モデル(LLM)の計算効率化は、現在のAI研究における最重要課題の一つです。今回紹介するSepLLMは、従来の常識を覆す斬新なアプローチで、この問題に挑戦しています。 🎯 核心となる発見:句読点が持つ隠れた力 意外な観察結果研究チームがLlama-3-8Bの注意機構を可視化したところ、驚くべき事実が判明しました。従来の予想: 名詞や動詞などの意味のある単語に高い注意スコアが集中する実際の結果: カンマ(,)やピリオド(.)などの「意味のない」区切り文字に注意が集中 なぜ区切り文字が重要な...
6日前

【7/30(水)20時~】ハカセとバンコク取材旅。HUAWEI Pura80 Ultraのモンスター級カメラに驚愕(スマホ沼)
テクノエッジ TechnoEdge

スマホ沼 第11回配信は第6回でもやりましたハカセとACCNの海外取材ライブビューイングです。
6日前

理論も理解しないでデータ解析するんですか??(機械学習チートシート)
Zennの「ディープラーニング」のフィード

機械学習チートシート対象読者:機械学習に関する講義を履修済みの大学生や社会人の方数式の導出過程に重きを置いていますが、細かい説明や背景は省いているので、これを最初の学習用としないでください参考までにPythonでのデータ解析用コードを記しています 概要 教師あり学習入力データと出力データから関数のパラメータを予測 教師なし学習入力データだけから関数のパラメータを予測 強化学習与えられた状態において報酬を最大化する行動を推定 データ前処理 標準化平均が0、標準偏差が1となるように変換単位や尺度の影響を取り除くz =...
6日前

理論も理解しないでデータ解析するんですか??(機械学習チートシート)
Zennの「機械学習」のフィード

機械学習チートシート対象読者:機械学習に関する講義を履修済みの大学生や社会人の方数式の導出過程に重きを置いていますが、細かい説明や背景は省いているので、これを最初の学習用としないでください参考までにPythonでのデータ解析用コードを記しています 概要 教師あり学習入力データと出力データから関数のパラメータを予測 教師なし学習入力データだけから関数のパラメータを予測 強化学習与えられた状態において報酬を最大化する行動を推定 データ前処理 標準化平均が0、標準偏差が1となるように変換単位や尺度の影響を取り除くz =...
6日前

ウン100万円のスマートフォンに心がグラッと来てしまう(スマホ沼)
テクノエッジ TechnoEdge

バンコクにVERTUの店を発見。超高級スマホが約95万円から。デザインや素材の異なるモデルも販売。スマートウォッチも展開している
6日前

チームでDevinを導入して2ヶ月経ったので振り返ってみた
1
エムスリーテックブログ


こちらはデジスマチームブログリレー6日目の記事です。 デジスマチームで開発チームのリーダーをしている田口です。日々目まぐるしくアップデートされていくAIエージェントを使って、どう生産性を向上させるかを考えることが多くなってきました。そんな中、今回はチームでDevinを導入した結果についてまとめてみました。
6日前