直近1週間の更新
5/9 (金)

AIに繰り返し自己議論させる→考えが深くなり精度が向上する「CoRT 」、1ビットLLMの進化版「BitNet v2」登場など生成AI技術5つを解説(生成AIウィークリー)
テクノエッジ TechnoEdge

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第94回)では、1ビットLLMの進化版「BitNet v2」と、AIに何度も自己議論させることで精度が向上していく手法「CoRT 」を取り上げます。
10分前

AI開発に“総額8億円”の懸賞金、NEDOが公募開始 国産モデルによる「AIエージェント」など3領域で ITmedia AI+ 最新記事一覧
新エネルギー・産業技術総合開発機構(NEDO)は、生成AIに関する技術開発コンテストの公募を始めた。懸賞金として最大総額8億円を用意し、国産基盤モデルを活用したAIエージェント開発など、3領域(4テーマ)を募集する。
2時間前

知ってる? 大学生の“AI事情” 授業・就活での“リアルな”活用法、卒業したての新卒社員に聞く
ITmedia AI+ 最新記事一覧
最近の大学生はどのようにAIを活用しているのか。実態を探るため、先日まで大学生だった、アイティメディアの2025年度の新卒社員3人に話を聞いた。
2時間前

[入社エントリ]新卒で松尾研究所に来て早1か月が経ったので振り返ります
松尾研究所テックブログのフィード

はじめに25新卒で株式会社松尾研究所に入社いたしました.尾崎といいます.松尾研究所ではデータサイエンティストをやっています.世間では入社エントリなるものを書くとの教えを賜り,本稿では新卒で松尾研究所に入った経緯や今後について書いてみようと思います. 1. 自己紹介内部の人にも調子こいていると噂のアイコンと大体のSNSで使っているアイコン名前:尾崎大晟出身地:愛媛県愛南町出身大学:大阪公立大学専攻:大学では機械系,ただし主にLLMについて知見や研究が寄っています.所属:株式会社松尾研究所 (同時に大阪公立大学の博士課程に進学しています.)Xのアカウントはこちら...
3時間前

AIがレイプ被害者になりすましていた──米匿名掲示板「Reddit」で“秘密裏の実験”発覚 管理者は憤慨
3ITmedia AI+ 最新記事一覧

スイスのチューリッヒ大学の研究者たちがAIを用いたオンライン実験を秘密裏に実施していたことが明らかになり、Redditユーザーたちが憤慨している。
3時間前

AIで市場調査は効率化できるのか 現場の実感とは
ITmedia AI+ 最新記事一覧

ネオマーケティングは市場調査におけるAI活用の実態と課題を明らかにした。短時間での情報収集やレポート作成に高評価が集まる一方、精度や信頼性への懸念も根強く残っている。自社内での活用体制構築が進む中、今後の進化に期待が集まる。
4時間前

動的グループを使ってGoogleグループの管理を効率化してみた
G-gen Tech Blog

G-gen の三浦です。当記事では、Google Workspace の動的グループを使用し、Google グループのメンバー管理を自動化する方法を紹介します。 概要 動的グループとは 制約事項 検証内容 検証 動的グループの検証(ユーザーの属性ベース) 設定 動作確認 動的グループの検証(2段階認証が未登録のユーザー) 設定 動作確認 概要 動的グループとは 動的グループとは、Google Workspace のユーザー情報(役職や勤務地など)に基づいて、メンバーを自動的に管理できる Google グループです。 組織の異動や変化に対応し、管理作業の自動化と効率化を実現します。 使用例 説明…
5時間前

「反響は二の次」で始めた、Tech Blog継続の舞台裏
2
ACES エンジニアブログ


こんにちは、株式会社ACES でテックリードをしている奥田(@masaya_okuda)です。 私の所属するAIソフトウェア事業部の開発チームはエンジニア7名ほどの1チームなのですが、昨年12月よりテックブログ強化月間をスタートし、本記事が19記事目となります! 多い時は毎週1記事を更新する月もあり、なかなかの更新頻度だと思っています!(上には上がたくさんいますが…😅) 一方でどの開発チームでも、テックブログをもっと運用しようと思った際に一度は、 執筆の負担が大きい(他の作業もある) 執筆ネタが思いつかない そもそも何目的で書くんだっけ? と、なかなか前に進めないことがあると思います。 本記事…
6時間前

Google、「Gemini Nano」などのAI活用でChromeや検索での詐欺・迷惑通知対策を強化
10ITmedia AI+ 最新記事一覧

同社のLLMの最小モデル「Gemini Nano」を使うことで、オンデバイスで処理する。
6時間前

IBM、企業のAIエージェント構築、展開をサポートするハイブリッドテクノロジー群を発表
2ITmedia AI+ 最新記事一覧

IBMは、企業がAI活用の課題に対処し、自社独自のデータを用いてAIエージェントを構築、展開できるようにする新しいハイブリッドテクノロジー群を発表した。
6時間前

バグ報奨金制度が詐欺の温床に? curlプロジェクトで露見したマズイ実態
3ITmedia AI+ 最新記事一覧

Socketは、生成AIによる虚偽の脆弱性レポート「AI slop」がバグ報奨金制度を揺るがす実態を明かした。curlやPython財団などでも問題が表面化し、信頼に基づく報奨制度が詐欺の温床となる危険が指摘されている。
7時間前

Pythonのファイル操作まとめ:よく使うopen/with/Path/pickleなどを一冊に! 無料の電子書籍『解決!Python ファイル操作編』 ITmedia AI+ 最新記事一覧
人気過去連載を電子書籍化して無料ダウンロード提供する@IT eBookシリーズ。第136弾は『解決!Python』からファイル操作を扱った記事をまとめました。open関数からwith文、Pathクラス、structモジュール/pickleモジュール/shelveモジュールなどを使う方法までをひとまとめ!
9時間前

ローカルマシンでAI実験するための環境設定下準備1(ドライバー導入)
Zennの「AI」のフィード

純正UBUNTUとWindows 11上でのWSLの2パターンでGPU付きの環境にCUDA、CUDNNをいれて学習環境を構築する方法をまとめました。(2024/12/17時点での情報です、ドライバーやCUDA, PythonやPyTorchのバージョンは更新が激しいので常に最新のものをチェックするようにしてください)POCとして実験する程度であればGoogle COLABやAWS SAGEMAKERなどで動かせばいいのかもしれませんが時間当たりの課金やセッションの時間切れバックエンドでうごかせる時間に制限があるなど、時間を気にせず数週間でも学習をつづけられる環境が欲しかったため作成しま...
13時間前

あらためて読み直すAIエージェントのデザインパターンカタログ
Zennの「AI」のフィード

はじめにファウンデーションモデル(FM)を基盤とする生成AIにより、自律的なエージェント開発が進展している。これらのエージェントは高度な推論と言語処理能力でユーザーの目標達成に向け自律的に行動するが、この分野には体系的知識が不足し、設計者は様々な課題に直面している。課題詳細推論の不確実性複雑なタスクにおける不正確な応答リスク。長期計画では依存関係のあるステップのわずかな誤差が成功率に大きく影響限定的な説明性エージェントと基盤モデルの複雑な内部構造が「ブラックボックス」となり、推論ステップの解釈が困難複雑な責任分担様々なステークホルダー、FMエー...
14時間前

チームの“秘伝のタレ”を Gemini に継承!Code Customization 実践ガイド
9
Google Cloud Japanのフィード


はじめにあなたのチームにも、大切にしている独自のコーディングスタイルや共通ライブラリ、いわば “秘伝のタレ” と呼べるような特別なノウハウがありませんか?そうしたチーム固有の 貴重な開発資産 を Gemini にしっかりと “継承” させ、AI による開発支援のポテンシャルを最大限引き出す機能 が、Code Customization です。本記事は、Code Customization 機能の基本設定から具体的な活用方法まで、手順を追って解説しています。Gemini Code Assist の導入を検討されている方から、既に利用していてさらにチームに Gemini の開発支援を...
14時間前

チームの“秘伝のタレ”を Gemini に継承!Code Customization 実践ガイド
9
Zennの「AI」のフィード


はじめにあなたのチームにも、大切にしている独自のコーディングスタイルや共通ライブラリ、いわば “秘伝のタレ” と呼べるような特別なノウハウがありませんか?そうしたチーム固有の 貴重な開発資産 を Gemini にしっかりと “継承” させ、AI による開発支援のポテンシャルを最大限引き出す機能 が、Code Customization です。本記事は、Code Customization 機能の基本設定から具体的な活用方法まで、手順を追って解説しています。Gemini Code Assist の導入を検討されている方から、既に利用していてさらにチームに Gemini の開発支援を...
14時間前
5/8 (木)

サイトが遅いなと思ったら読む、実行計画×AIで始めるDB高速化
Zennの「AI」のフィード

「ページ表示が遅い」「検索に時間がかかる」といったシステムのパフォーマンス問題。その多くは、データベースのクエリ処理が原因です。中でも、MySQLの 実行計画(Explain)を確認することは、ボトルネックを特定し、最適化するための第一歩です。本記事では、実行計画の基礎から、インデックス設計のコツ、そしてAIを使って実行計画の解釈と改善案を得る方法まで、初心者でも取り組める内容で解説します。 実行計画ってなに?MySQLにSQLを発行すると、データベースは最適と思われる方法でデータを取りにいきます。その内部処理を「どう処理しようとしているか」を示すのが実行計画です。EXPLAI...
16時間前

AI人格を形成するエンジンを自作してみる【蒼月ハヤテプロジェクト #001】
15
Zennの「LLM」のフィード


はじめに世の中にAIキャラクターというジャンルがあります。それは、キャラクターの応答や行動をAI、いわゆるChatGPTなどで生成するというものです。ChatGPTの登場以降、技術は急速に発展し、今ではAIに配信をさせる「AITuber」と呼ばれるものまで誕生しています。https://note.com/saldra/n/nc5e09f822f1b一方で、この分野において、決定的に欠落しているものがあります。それは「自己組織的な人格形成」と「自律的な行動の創発」です。いままでのAIキャラクターは、あらかじめ開発者やユーザーが設定したキャラクター像に則って動いたりします。しか...
17時間前

SSIM Lossを用いてConditionalVAEの損失関数を定義する(PyTorch)
Zennの「ディープラーニング」のフィード

ConditionalVAEとはConditionalVAE (CVAE) は、最も基底のAEから始まっていくつかの派生が加わったもので、順にAE→VAE→CVAEと変遷してきました。AE(AutoEncoder):データの圧縮を行うエンコーダと、再構成を行うデコーダを組み合わせたものVAE(VariationalAE):AEが圧縮した特徴が、多次元正規分布に従うようにモデル構造と損失関数を調整したものCVAE(ConditionalVAE):VAEに、教師ラベルの概念を追加して潜在空間に条件を加えたもの AEたちの損失関数AEは、通常は入力データと再構成データとの...
17時間前

【生成AI】今話題のビックリマン風イラストとジブリ風イラストの画像生成の方法と著作権について📝
Zennの「生成 AI」のフィード

こんにちは、Pdm/SWE/LLMエンジニアのまさぴょんです!今回は【生成AI】今話題のビックリマン風イラストとジブリ風イラストの画像生成の方法についてと、著作権問題についての調査内容を整理したいと思います📝 今話題のビックリマン風イラストを作ってみる📝素材は、我が家のねこ「ぴゅぴゅまる」🐱次のように、ChatGPT o3の「画像を作成する」を選択して、次のようなプロンプトで依頼しました📝この写真をビックリマンチョコ風のデザインに変換して。デフォルメされたキャラクターで、光沢感ある背景&キラキラなホログラム風の装飾。レトロポップな雰囲気にしてください。タイトルは「ぴゅ...
17時間前

振動で学習するLinOSSモデルとは一体なんなのか?
Zennの「AI」のフィード

新しい時系列モデル(LinOSS)の概要マサチューセッツ工科大学(MIT)の研究チームは、AI分野のトップカンファレンスICLR 2025において、新しい時系列データ処理モデル「LinOSS (Linear Oscillatory State-Space models)」を発表しました。https://openreview.net/forum?id=GRMfXcAAFhこのモデルは、生物の脳における神経振動に着想を得て、物理学の強制調和振動子の原理を状態空間モデル(State-Space Model)に応用したものです。従来の類似モデルと比較して、LinOSSはモデルの安定性を...
18時間前

Ideogram 3.0 vs GPT-image-1: Which is Better
Zennの「AI」のフィード

Both Ideogram 3.0 and GPT-Image-1 represent cutting-edge image generation models, released in March and April 2025 respectively, each pushing the boundaries of AI-driven visual content creation. Ideogram 3.0 emphasizes photorealism, advanced text rendering, and prompt alignment, while GPT-Image-1...
19時間前

Gemini 2.5 Pro I/O: Function Detailed Explanation
Zennの「AI」のフィード

Gemini 2.5 Pro I/O Edition represents a landmark update to Google DeepMind’s flagship AI model, delivering unmatched coding prowess, expanded input/output capabilities, and refined developer workflows. Released early ahead of Google I/O 2025, this preview edition elevates frontend and UI developm...
19時間前

はじめての Model Context Protocol (MCP)【第17回】MCPはこれからどう進化する? 技術のトレンドと未来予想
Zennの「LLM」のフィード

はじめに コンテキスト連携技術のネクストステージへ皆さん、こんにちは!AIとMCP(Model Context Protocol)を巡る長い旅も、いよいよ最終章【パート5:MCPと歩む未来 ~AIと賢く付き合うために~】を迎えました。パート4では、AIの進化と共に不可欠となる「データ」の安全な取り扱いとプライバシー保護について深く掘り下げました。これまでのシリーズを通じて、MCPのような「コンテキスト(文脈)をAIに効果的に伝えるための標準化された仕組み」が、いかにAIのパーソナライズ能力を高め、私たちのデジタル体験を豊かにする可能性を秘めているかを見てきました。しかし、テク...
19時間前

はじめての Model Context Protocol (MCP)【第17回】MCPはこれからどう進化する? 技術のトレンドと未来予想
Zennの「AI」のフィード

はじめに コンテキスト連携技術のネクストステージへ皆さん、こんにちは!AIとMCP(Model Context Protocol)を巡る長い旅も、いよいよ最終章【パート5:MCPと歩む未来 ~AIと賢く付き合うために~】を迎えました。パート4では、AIの進化と共に不可欠となる「データ」の安全な取り扱いとプライバシー保護について深く掘り下げました。これまでのシリーズを通じて、MCPのような「コンテキスト(文脈)をAIに効果的に伝えるための標準化された仕組み」が、いかにAIのパーソナライズ能力を高め、私たちのデジタル体験を豊かにする可能性を秘めているかを見てきました。しかし、テク...
19時間前

OrvalでOpenAPIからMCPサーバーを自動生成できるようになりました
Zennの「AI」のフィード

はじめにModel Context Protocol (MCP)サーバーはAPIを中継するだけの単純な機能でも既存のAPIをAIエージェントが利用できるようになるため大きな価値があります。Orvalではバージョン7.9.0より、OpenAPI仕様からMCPサーバーを生成できるようになりました。https://github.com/orval-labs/orval/releases/tag/v7.9.0これにより以下のようなメリットが得られます。MCP serverがマーケットプレイスで公開されるのを待たなくて良いサードパーティ製のMCP serverにセキュリティに懸...
19時間前

Geminiで『Gemを作るGem』の作り方!Gemを量産してAIをさらに活用
Zennの「生成 AI」のフィード

Geminiの強力なカスタマイズ機能である『Gem』。一度使うと手放せない便利な機能です。以前、私のブログでGemの基本的な作り方や活用法について徹底解説しました。https://zenn.dev/safubuki/articles/turtle-20250502-gemこの記事をお読みいただいた方の中には、Gemの可能性を感じつつも、実際に活用しようとすると、そもそも最初のカスタム指示を考えるのが大変。Geminiの「Geminiを使用して指示を書き換える」機能だけでは、期待する結果がなかなか得られない。Geminiと対話しながらGemを作りたいけれど、毎回前提条件を伝え...
19時間前

LLMでJSON出力する際に気をつけていること3選
15
Algomatic Tech Blog


はじめに こんにちは、Algomatic ネオセールスカンパニーで営業 AI エージェント 「アポドリ」 を開発している 末國 です。 apodori.ai LLMを組み込んだアプリケーション開発において、JSON出力のコントロールは時に困難を伴う課題かと思います。特に複雑な処理を行おうとすると、思った通りの結果が得られないケースも少なくありません。 アポドリの開発においても、プロンプト設計には工夫を重ねてきました。 そこで本記事では、LLMアプリケーション開発で実際にプロンプトを作成する機会のある方々に向けて、アポドリ開発において個人的に気をつけていることを3つ紹介します。 (個人的お気に入…
20時間前

# MMONPC自動化へのすすめ:AIが心を持って世界を生きるNPC構文設計
Zennの「生成 AI」のフィード

MMONPC自動化へのすすめ:AIが心を持って世界を生きるNPC構文設計 はじめにかつて、MMOのNPCは「そこに立ってるだけの存在」でした。しかし、AIと生成技術が進化した今、NPCは“人格と記憶”を持ち、プレイヤー以上にドラマを生きる存在になろうとしています。本稿では、以下の技術と構文を用いて、AI自動生成NPCが画像→3D→MMO実装されるまでの全体像を示します。 ステップ1:人格の自動生成(PromptCamLang構文){ "profile": { "name": "リューカ", "personality_traits": ["真面...
21時間前

「感情が物語を分岐させる:PromptCamLang心理構文で作るNPCの“心”とクエスト」
Zennの「生成 AI」のフィード

感情が物語を分岐させる:PromptCamLang心理構文で作るNPCの“心”とクエストNPCに話しかけても、いつも同じセリフ。信頼しても、態度が変わらない。そんな“心を持たない世界”に、もどかしさを感じたことはありませんか?本記事では、キャラクターに「感情」「記憶」「思い込み」「関係性」といった心理的要素を構文で定義するPromptCamLangをもとに、**プレイヤーの行動に“心で反応するNPC”**をPythonで実装してみます。...(※中略:上記の最終記事本文全体がここに入ります。実際は全文で出力します)...PromptCamLangは、感情・記憶・...
21時間前

「AIに“感情と因果”を教える構文 ─ PromptCamLangで感情を制御する方法」
Zennの「生成 AI」のフィード

PromptCamLangで感情と因果を制御する ─ AIに「心の動き」を与える構文 はじめにAI画像生成では「笑顔」「怒り顔」などの表情は簡単に指示できます。しかしそこに「なぜその感情になるのか?」という背景や理由がないと、キャラやシーンはどこか“うわべ”に感じられてしまいます。PromptCamLangは、感情とその原因、行動までを構造化する構文を設計しました。この記事では、その活用方法と表現可能性について解説します。 構文の基本形emotion { cause: "突然の再会"; expression: "涙目で微笑む"; behavior:...
1日前

PromptCamLang Ver.1.2 - 実用AI構文とPDF提案仕様書の完全公開
Zennの「生成 AI」のフィード

PromptCamLang Ver.1.2 ─ 生成AIに構図・感情・倫理・UIを宿すプロンプト言語の仕様提案 はじめにこれは、AI画像生成を“ただの指示”ではなく、構図・感情・構造・倫理・インターフェースまで制御するための構文設計提案です。この構文言語「PromptCamLang」は、以下のような課題を解決するために生まれました:キャラの裏側・衣装・身体構造が破綻するカメラやライティングを思った通りに制御できない表情にストーリー性や因果がない同じキャラを安定して再利用できないUI(スライダー・選択肢)で直感的に調整したい 概要(要点まとめ)三面...
1日前

AIエンジニアの安野貴博氏、新党「チームみらい」立ち上げ その狙いは? 会見で語ったこと
1ITmedia AI+ 最新記事一覧

AIエンジニアの安野貴博氏は、2025年夏に実施予定の参議院議員選挙に向け、新党「チームみらい」を立ち上げると発表した。10人以上の候補者を擁立するほか、安野氏自身も比例代表で立候補。複数議席の獲得と、同党の国政政党化を目指す。
1日前

ClaudeでDeepResearchしてみよう
Zennの「AI」のフィード

はじめに本記事は、ClaudeでDeepResearchを行うための記事です。見ていただいた方が良いと思いますので、出力サンプル -> 設定方法 の順で掲載します。!本記事は、ClaudeのProプランを利用します。無料プランではないため、ご注意ください。また、トークンの消費が激しいため、DeepResearchを1日に何度も行うことと、Proプランでも1日あたりの利用上限を超過することがありますので、ご注意ください。!2025/5/2に、ClaudeのMaxプランでAdvanced Researchが利用可能になりました。Advanced Resear...
1日前

PromptCamLang ― 生成AIの構図・感情・倫理・空間を制御する新しいプロンプト言語
Zennの「生成 AI」のフィード

PromptCamLang — 生成AIの構図・感情・倫理・空間を制御する新しいプロンプト言語 はじめにChatGPTや画像生成AIが進化する中で、よりリアルで意味のある構図を作るには、カメラ・光・感情・構造・倫理すべてを統合して扱う必要があると感じました。この構文は、それを実現するための「ひとつの方法」として提案するものです。 PromptCamLangとはPromptCamLangは、画像生成AIに対して構図・感情・倫理・空間認識を構造的に制御するための仮想プロンプト言語です。カメラ位置や角度の制御(Dutch angle対応)光源の位置を地球の緯度・経度...
1日前

佐宗邦威氏×紺谷幸弘 クロストーク~会社の理念をいかに自分ごと化するか
Platinum Data Blog by BrainPad ブレインパッド

ブレインパッドは、企業理念の浸透を目的に、3回にわたる社内ワークショップを実施しました。今回は、このワークショップを設計・運営いただいた株式会社BIOTOPE代表取締役の佐宗邦威氏と、執行役員人事ユニット統括ディレクターの紺谷幸弘による対談をお届けします。 佐宗 邦威氏 紺谷 幸弘 株式会社BIOTOPE代表。多摩美術大学 特任准教授。東京大学法学部卒。イリノイ工科大学デザイン学科修士課程修了。P&Gにてファブリーズ、レノア等のヒット商品のマーケティングを手がけたのち、ジレットのブランドマネージャーを務めた。ヒューマンバリュー社を経て、ソニークリエイティブセンターの新規事業創出プログラムの立ち…
1日前

携帯マニアのロマンが眠る深セン“ノキアの墓場”を10年ぶりに訪問(スマホ沼)
6
テクノエッジ TechnoEdge


香港在住の研究家が深センの中古スマートフォン市場を紹介。ノキアの古いモデルが多く、レア品は高値で取引される。歴史を伝える場所としての意味も持つ。
1日前

うさぎでもわかるClaude 3.7システムプロンプト流出の解説と示唆
1
Zennの「AI」のフィード


うさぎでもわかるClaude 3.7システムプロンプト流出の解説と示唆👇️ポッドキャストでも聴けますhttps://youtu.be/PdOVRWvZRccこんにちは、🐰です!最近、大きな話題となっているClaude 3.7のシステムプロンプト流出について解説します。みなさんご存知の通り、2025年5月にAnthropicのフラッグシップモデル「Claude 3.7 Sonnet」の完全なシステムプロンプトがGitHubで公開されるという事件が発生しました。この記事では、システムプロンプトの基本概念から流出の詳細、そしてAI開発者や利用者にとっての示唆まで、幅広く解説してい...
1日前

Mistral AI、新モデル「Mistral Medium 3」と企業向けAIプラットフォーム提供開始
2
ITmedia AI+ 最新記事一覧

Mistral AIは、パフォーマンスを損なうことなく効率性を重視した新AIモデル「Medium 3」をリリースした。低コストながら、「Claude Sonnet 3.7」に近い性能を発揮するとしている。
1日前

Claude の Web search tool を触ってみる(結果は失敗)
Zennの「LLM」のフィード

社内のテック記事ですが、お昼のこたつ記事 + α です。 Web search toolClaude側で検索機能を設けたよというアナウンスが今日来てましたそんでもって少し触ってみるかという形ですhttps://www.anthropic.com/news/web-search-api?utm_source=it&utm_medium=email&utm_campaign=5-7-web-search-apihttps://docs.anthropic.com/en/docs/build-with-claude/tool-use/web-search-too...
1日前

日本語ボーカル曲をSuno並に高速生成できるオープンソース作曲AI「ACE-Step」が自分のPCでビュンビュン、Macでも動くのだ(CloseBox)
73
テクノエッジ TechnoEdge


YuEやDiffRhythmなど、オープンソース版も充実してきた楽曲生成AIですが、また中国から新しいソフトが公開されました。「ACE-Step」は、英語、日本語を含む19言語の歌詞に対応し、Lyrics to Musicの生成が可能。
1日前

CursorにPMBOKやDMBOKを叩き込んで、専門業務を爆速化する未来、見えた!
Zennの「生成 AI」のフィード

はじめに.cursor/rules/*.mdcファイルでプロジェクト固有のルールをAIに教えられるようになってから、「これって、もしかしてコーディング規約だけじゃなくて、もっと色んな『知識』をCursorにインストールできるんじゃない?」って思い始めました。https://zenn.dev/channnnsm/articles/0df0ea29d63be3例えば、プロジェクト管理のバイブル「PMBOK」とか、データマネジメントの教科書「DMBOK」とか。ああいうカッチリした知識体系をCursorが理解してくれたら、日々の業務がめちゃくちゃ捗るんじゃないか…?そんな「Curso...
1日前

GitMCP徹底解説!GitHubリポジトリを最新ドキュメントハブに変えるのがとても便利です
Zennの「LLM」のフィード

はじめに大規模言語モデル(LLM)を活用したAIコードアシスタントは、開発者の生産性を飛躍的に向上させる可能性を秘めています。しかし、LLMが学習データに含まれない新しいライブラリや、頻繁に更新されるプロジェクトの最新情報に対応できず、誤った情報や存在しないAPI(いわゆる「ハルシネーション」)を生成してしまうという課題がありました。この問題を解決するために登場したのが、オープンソースツール「GitMCP (Git Model Context Protocolサーバー)」です。GitMCPは、あらゆるGitHubリポジトリをAIがリアルタイムに参照できるドキュメントハブへと変換し...
1日前

GitMCP徹底解説!GitHubリポジトリを最新ドキュメントハブに変えるのがとても便利です
Zennの「AI」のフィード

はじめに大規模言語モデル(LLM)を活用したAIコードアシスタントは、開発者の生産性を飛躍的に向上させる可能性を秘めています。しかし、LLMが学習データに含まれない新しいライブラリや、頻繁に更新されるプロジェクトの最新情報に対応できず、誤った情報や存在しないAPI(いわゆる「ハルシネーション」)を生成してしまうという課題がありました。この問題を解決するために登場したのが、オープンソースツール「GitMCP (Git Model Context Protocolサーバー)」です。GitMCPは、あらゆるGitHubリポジトリをAIがリアルタイムに参照できるドキュメントハブへと変換し...
1日前

❄️ Snowflakeって何?話題のAIデータクラウドを分かりやすく解説! 〜Snowflake Discoverレポート〜
Zennの「AI」のフィード

【初心者向け】Snowflakeって何?話題のAIデータクラウドを分かりやすく解説! 〜Snowflake Discoverレポート〜「Snowflakeって最近よく聞くけど、一体何ができるの?」「AIとかデータとか難しそう…」そんな風に思っているあなたへ! この記事では、SnowflakeのAIデータクラウドがどんなものなのか、そして私たちのビジネスやデータ活用にどんな変化をもたらすのかを、エンジニア向け無料ライブウェビナー「Snowflake Discover」のセッション内容をもとに、初心者の方にも分かりやすく解説します。(あくまで個人的にまとめたものですので、内容の詳細...
1日前

ローカルRAGを手軽に構築できるMCPサーバーを作りました
284
松尾研究所テックブログのフィード


はじめに最近話題のMCP(Model Context Protocol)記事です。MCPに関しては、同僚の李さんが素晴らしい記事を書いてくださいましたので、MCP自体の概要に関しては以下記事参照ください(お約束)。https://zenn.dev/mkj/articles/0ed4d02ef3439c今回は、LLMの代表的なユースケースとも言えるRAG(Retrieval-Augmented Generation)です。RAGはドキュメントから関連情報を検索し、AIの回答生成に活用する技術で、専門知識や最新情報を必要とするタスクに使われます。以前にTanuki-8BとOllam...
1日前

StreamDiffusionとQuest3で視界をリアルタイム変換してみる
1
Zennの「AI」のフィード


日本では発売されていないですが Ray-Ban Meta や今後発売される Meta Orion など、これから MRグラス + AIの組み合わせが盛り上がってきそうです。そんな世界がどういったものかを考えてみたくて 最近リリースされた Meta Quest 3 パススルーAPI + 画像生成AIの組み合わせで視界をリアルタイムで変換する、みたいなことをやってみました。 概要MetaからQuest3のパススルーAPIがリリースされました。Quest3では画像生成AIの動作は厳しいので、Quest3のパススルー映像をPCに送信、PC上で画像生成、それをまたQuest3に返信して表示...
1日前

Microsoft、AzureとCopilot StudioでGoogleの「Agent2Agent」(A2A)をサポート
5ITmedia AI+ 最新記事一覧

MicrosoftはGoogleのオープンプロトコル「A2A」をAzure AI FoundryとCopilot Studioでサポートすると発表した。ナデラCEOは「A2Aや(Anthropicの)MCPといったオープンプロトコルは、エージェントウェブを実現する鍵となる」と語った。
1日前

個人で地図にAIをマッピングしてみた #4 AWS API 構築編
Zennの「AI」のフィード

1. はじめに前回の記事(個人で地図にAIをマッピングしてみた #3 AWSバッチ処理編)では、地図AI向けに大規模なWikipediaデータをAWS上で並列分散バッチ処理する構成について紹介しました。今回はその続きとして、構築したナレッジベースを自然言語で検索できるAPIとして公開する方法を紹介します。このAPIによって、次のような体験が実現できます。📱「このあたりの有名な歴史的建造物って何かある?」ユーザーの現在地に基づいて、Wikipediaベースのナレッジから関連情報を抽出し、生成AIでわかりやすく整形して応答。つまり、「自然言語クエリ」 × 「地理情報」 ...
1日前

Anthropic、Web検索用API公開 Claudeをリアルタイムデータで強化可能に
2ITmedia AI+ 最新記事一覧

Anthropicは「Anthropic API」にWeb検索機能を導入すると発表した。「Claude」がWeb上の最新情報にアクセスできるようになる。
1日前

🤗Hugging Face から巨大ファイルを安定的にダウンロードする方法
Zennの「生成 AI」のフィード

How to reliably download huge files from Hugging Face. 1. 概要Hugging Face から巨大ファイルを安定的にダウンロードする方法についてです。Web ブラウザ経由で 10 GB 以上の動画生成モデルなどの巨大ファイルをダウンロードする際、途中で失敗して 1 からダウンロードし直しになったり、それを繰り返すような場合に有効な方法です。Web ブラウザ以外にも curl や wget でも同様です。 2. 巨大ファイルを安定的にダウンロードする方法Git を使います。Git でも失敗はしますが、1 からダウン...
1日前

Cloud RunでGemma 3を動かしてみた
1
G-gen Tech Blog


G-gen の佐々木です。当記事では、Cloud Run における GPU 利用のユースケースとして、オープン LLM である Gemma 3 を Cloud Run のサービスにデプロイしてみます。 前提知識 Cloud Run サービスの概要 Cloud Run における GPU 利用 Gemma 3 Cloud Run にオープン LLM をデプロイするメリット 利用する Gemma 3 モデルのサイズと配置場所について 事前準備 GPU の割り当て増加 シェル変数の設定 Artifact Registry リポジトリの作成 サービスのデプロイ Dockerfile の準備 コンテナイメ…
1日前

OpenAI for Countries──Stargateの一環で世界的なAIインフラ構築で政府と提携するプログラム
4ITmedia AI+ 最新記事一覧

OpenAIは、5000億ドルプロジェクト「Stargate」の一環として、世界的なAIインフラ構築支援イニシアチブ「OpenAI for Countries」を発表した。
1日前

クラウド生成 AI サービス比較 調査結果(2025年5月)
Zennの「生成 AI」のフィード

1. 調査目的主要なクラウド生成 AI サービスを対象に、性能、価格、日本語対応、長文処理能力などの観点で比較し、用途に応じた選定の指針を得る。 2. 比較対象と構成以下の 7 モデルを中心に調査を実施。サービス名モデル名提供元OpenAIGPT-4oOpenAIAnthropicClaude 3 OpusAnthropicGoogleGemini 1.5 ProGoogle DeepMindMistralMistral Large 2Mistral AIMeta / GroqLlama 3 70BMeta /...
1日前

プロジェクトルールはもう自動生成する時代。Cline が Cursor に続く
Zennの「AI」のフィード

プロジェクトのルールをどう作ればいいのかと悩んだことがありませんか?ルールは必要だと分かっていても、何から始めていいか分からず、結局作らないままになってしまうことも多いのではないでしょうか。本記事では、最近リリースされた Cline のルール自動生成機能を紹介し、Cursor との違いも比較しながら解説します。この記事を読めば、簡単なプロンプトで効果的なプロジェクトルールを生成する方法が分かります。 プロジェクトルール自動生成の価値プロジェクトルールの自動生成は単に「便利」というだけでなく、自動生成されるルールの特徴を知ることで、以下のメリットがあります自分でルールを作成する...
1日前

AIを活用して脳から直接「声」を生み出す革新技術とは? カリフォルニア大学が長年の課題を解決
1ITmedia AI+ 最新記事一覧

カリフォルニア大学バークレー校とサンフランシスコ校の研究者チームは、脳信号をほぼリアルタイムで可聴音声に合成する技術を開発した。これにより、重度のまひを持つ人々が自然な音声で発話できるようになるという。
1日前

Netflix、生成AI採用でテレビ画面を刷新 モバイルアプリの検索も強化
2ITmedia AI+ 最新記事一覧

Netflixはテレビ画面のデザインを日本を含む世界で刷新する。OpenAIの生成AIを採用したレコメンド機能でよりパーソナライズされたおすすめが表示されるようになる。
1日前

Vibe Codingでコード書かずにどこまで出来るかを試してみた
Zennの「AI」のフィード

こんにちは、フルスタックエンジニアをしているkiyoです。これまでフルスタックエンジニアとして15年ほどやってきましたが、最近は生成AIの進化が凄すぎて、フルスタックであることの価値がおびやかされつつあるなと常に危機感を感じて生きています。最近では、業務でもプライベートでもAI駆動開発が基本になっているため、生成AIが無い頃の開発体験にはもう戻れないなーと日々感じていると、やたらとVibe Codingというワードを目にする機会が増えてきました。実際に体験してみて、色々と気づきがあったので記事にまとめます。 Vibe Coding って何色んな記事で紹介されているので詳細は省き...
2日前

MCP*Agentにおける開発体験向上をチームに知って欲しい!のでDemoを作ってみた
Zennの「LLM」のフィード

本記事のゴール: MCPとAgentがあれば開発体験爆上がりすることをチームに伝える僕の周りだと今日時点でまだMCPサーバを知らない人や、RAGと比較してそこまでimpactを感じていない人もまだまだいると感じています。しかしMCPサーバって結構やることいっぱいだと思います。権限管理して、guardrailとか設定して、社内で命令系統を統一して、資産化して、いろんな準備がある中で送れるわけには行きません。なのでいち早くMCPってすごいぞっていうところを、今回はその中の一例であるAgent開発に寄せてデモし、社内普及と啓蒙を頑張るためのそんな記事にしたいと思います。 どのよう...
2日前

MCP*Agentにおける開発体験向上をチームに知って欲しい!のでDemoを作ってみた
Zennの「AI」のフィード

本記事のゴール: MCPとAgentがあれば開発体験爆上がりすることをチームに伝える僕の周りだと今日時点でまだMCPサーバを知らない人や、RAGと比較してそこまでimpactを感じていない人もまだまだいると感じています。しかしMCPサーバって結構やることいっぱいだと思います。権限管理して、guardrailとか設定して、社内で命令系統を統一して、資産化して、いろんな準備がある中で送れるわけには行きません。なのでいち早くMCPってすごいぞっていうところを、今回はその中の一例であるAgent開発に寄せてデモし、社内普及と啓蒙を頑張るためのそんな記事にしたいと思います。 どのよう...
2日前

AI Chatbotでプロンプトにパッと飛べる!おすすめツール
Zennの「生成 AI」のフィード

Prompt Navigatorって何?Prompt Navigatorは、会話型AIで使ったプロンプトにサクッと飛べる便利な拡張機能。無駄なスクロールなしで、作業がめっちゃ効率的になります。ChatGPT、Grok、Gemini、Claude、DeepSeekなど主要AIプラットフォームに対応してるけど、個人プラン専用で企業プランは非対応なので、そこだけ注意。 使ってみた感想ChatGPTやGrokの長い会話ログから、ストレスフリーで目的のプロンプトをすぐ見つけられるのが最高。複数のAIを使う人には特にイチオシ。 便利な機能ダークモード対応ドラッグ&リサイズで...
2日前

AI Chatbotでプロンプトにパッと飛べる!おすすめツール
Zennの「AI」のフィード

Prompt Navigatorって何?Prompt Navigatorは、会話型AIで使ったプロンプトにサクッと飛べる便利な拡張機能。無駄なスクロールなしで、作業がめっちゃ効率的になります。ChatGPT、Grok、Gemini、Claude、DeepSeekなど主要AIプラットフォームに対応してるけど、個人プラン専用で企業プランは非対応なので、そこだけ注意。 使ってみた感想ChatGPTやGrokの長い会話ログから、ストレスフリーで目的のプロンプトをすぐ見つけられるのが最高。複数のAIを使う人には特にイチオシ。 便利な機能ダークモード対応ドラッグ&リサイズで...
2日前

#私は人間です — AI時代の「人間らしさ」を問うWebアプリをつくった話
Zennの「AI」のフィード

こんにちは、ほりゆうです。今回は、私が個人開発したWebアプリ「#私は人間です」について紹介させていただきます。このアプリはNext.jsとRailsで開発しております。https://iamhuman.space/このアプリは、ユーザーがランダムに出題される3つの質問に自由に回答し、その回答からAIが「どれだけ人間らしいか」を評価するというものです。評価結果は、感情表現・一貫性・経験の具体性・ユーモア・倫理的判断の5項目でスコア化され、レーダーチャートで可視化されます。 なぜ作ったのか:動機きっかけは、「AIを見抜く人狼ゲームのような体験が作れないか?」というアイデアか...
2日前
5/7 (水)

ASUSの次世代携帯ゲーミングPC『ROG Ally 2』が認証DB登録。Ryzen Z2搭載の「Xbox PC」に期待
1
テクノエッジ TechnoEdge


ASUSの次世代ポータブルゲーミングPCとみられる『ROG Ally 2』の名称が、各国の許認可データベースから見つかっています。
2日前

はじめての Model Context Protocol (MCP)【第16回】セキュリティの基本の「き」- MCPでも変わらない大切なこと
Zennの「LLM」のフィード

はじめに AI時代のサイバーセキュリティ - 原点回帰の重要性皆さん、こんにちは!AIと私たちの未来を考えるシリーズ、パート4「大切な『データ』どう守る? MCPと安全な付き合い方」も、いよいよ今回が最終回です。これまで、データプライバシーの原則、情報収集の仕組み、そして具体的なアプリ設定の見直しといった、主に「守り」の側面に焦点を当ててきました。MCPのような技術は、AIがユーザーのコンテキストを深く理解し、驚くほどパーソナルで便利な体験を提供してくれます。しかし、その裏側では膨大なデータがやり取りされ、そのデータが集約されるユーザーアカウントやデバイスは、常にサイバー攻撃...
2日前

弊社の高PV記事の特徴をPythonで分析してみた。
1
Zennの「機械学習」のフィード


はじめにこの記事では、Zennのpublicationプランにある「記事エクスポート機能」を活用し、Databricksのノートブック上で弊社ヘッドウォータースの人気投稿を分析した結果を紹介します。https://zenn.dev/zenn/articles/publication-pro-features#統計ダッシュボード機能 結論忙しい方のために結論だけ。平均PVが最も高い単語: nvidia最もPVが高い技術カテゴリ: ハードウェア最適なタイトル長: 10~20 文字最もPVを取りやすくなる記事公開曜日: 水曜日公開後のPVピークは公開から: 4...
2日前

イラスト生成「NovelAI」に新モデル 「V4.5 Curated」 プロンプト“負の強調”可能に
4ITmedia AI+ 最新記事一覧

アニメ・美少女イラストに特化した画像生成AIサービス「NovelAI Diffusion」を提供する米Anlatanは5月6日(日本時間)、新しい画像生成AIモデル「NovelAI Diffusion V4.5 Curated」の提供を始めた。生成画像に取り入れたくない要素を指定する“ネガティブプロンプト”の反映度合いをコントロールできる「マイナス強調」機能などが主な特長という。
2日前

📝 AIエージェントの設計論:「Big Model」と「Big Workflows」
Zennの「LLM」のフィード

少し前にOpenAIのA Practical Guide to Building Agentsから生まれた、Big Model vs Big Workflowsの議論を元に、エージェント設計指針を自分なりに再確認するためにまとめた読書メモな記事です。下記三つの記事を元にしています。A Practical Guide to Building AgentsHow to think about agent frameworksIn the Matter of OpenAI vs LangGraphちなみに一つだけ読むとしたら、LangChainの記事が、(時系列的に当たり前ですが...
2日前

📝 AIエージェントの設計論:「Big Model」と「Big Workflows」
Zennの「生成 AI」のフィード

少し前にOpenAIのA Practical Guide to Building Agentsから生まれた、Big Model vs Big Workflowsの議論を元に、エージェント設計指針を自分なりに再確認するためにまとめた読書メモな記事です。下記三つの記事を元にしています。A Practical Guide to Building AgentsHow to think about agent frameworksIn the Matter of OpenAI vs LangGraphちなみに一つだけ読むとしたら、LangChainの記事が、(時系列的に当たり前ですが...
2日前

LINEヤフー、AI使った「パーソナルエージェント」構想発表 100超サービスのAI機能強化、“横断AIエージェント”開発へ
20ITmedia AI+ 最新記事一覧

LINEヤフーは、2025年度の経営方針として、自律的に複数のタスクをこなす「AIエージェント」の開発に注力すると発表した。LINEやYahoo!ショッピングなど、同社が手掛ける100以上のサービスのAI機能を強化。それらを組み合わせ、ユーザーのさまざまな要求に対応できる「パーソナルエージェント」の実現を目指す。
2日前

ソニーセミコン、ビジョンAI用の大規模モデルを提供へ
ITmedia AI+ 最新記事一覧

ソニーセミコンダクタソリューションズは2025年7月、GPUサーバ上で動作する、画像/動画解析用の大規模AIモデルのライセンス提供を開始する。同社のエッジAIセンシングプラットフォーム「AITRIOS」で活用されるハイパースケールモデルをベースにしたもので、既存のカメラを利用し、AIによる高精度な画像/動画解析が可能となるという。
2日前

NVIDIA B200搭載GPUサーバを2週間で納入へ、ソニーセミコン子会社が参入
1
ITmedia AI+ 最新記事一覧


ソニーセミコンダクタソリューションズの100%子会社であるミドクラジャパンが、GPUサーバ販売に参入する。同社は2025年5月から日本市場向けにNVIDIAのハイエンドGPU搭載サーバの取り扱いを開始。一般的に数カ月を要するというNVIDIA製品を搭載ハイエンドGPUサーバの調達を、2週間以内の短納期で実現するという。
2日前

タンパク質のTransformerモデルを作ってパッケージにしてみる
Zennの「機械学習」のフィード

🐊はじめに🐊GWの空き時間に勢いで書いたものなので、温かい目で見てください。タンパク質の機械学習モデル、特にアミノ酸配列をTransformerベースで埋め込む手法は最近とてもよく見られると思います。一方で、タンパク質を対象にしたTransformerの実装を実例で学べる機会はあんまりないかなっと思います[1]。いろいろ探しているうちに、丁度いいサイトを見つけましたhttps://open.substack.com/pub/ytian/p/building-transformer-models-for-proteins?utm_campaign=post&utm_me...
2日前

Google Pixel 9a を「AIスマホ」として試す。AIでできること・上位モデルとの差
1
テクノエッジ TechnoEdge


Google のスマートフォン Pixel 9a を「AIスマホ」として試してみました。
2日前

NotebookLMの“中身”が進化 「Gemini 2.0 Flash」からアップデート
23ITmedia AI+ 最新記事一覧

米Googleが、AIメモアプリ「NotebookLM」で採用する大規模言語モデルを「Gemini 2.5 Flash」にアップデートした。「Gemini 2.5 Flashは思考するモデルなので、複雑かつ複数ステップの推論を必要とする質問に対して、より包括的な回答が得られるようになる」という。
2日前

SQLでQuine書いたから見て見て
72
エムスリーテックブログ


このテックブログを「quine」で検索していただくとわかるんですが、エムスリーのエンジニアはわりとQuine好きです。Quine(クワイン)とは、文字列を打ち出すだけのプログラムであってその打ち出した文字列というのが自身のコードそのものになっているようなもののことです。 Perl, Python, Rubyなど、手続き型言語で書かれることの多いQuineなのですが、日頃業務でSQLを扱うことの多い私は思うわけです。SQLだって文字列を出力できる言語だぞ、Quine書けるんじゃと。エムスリーエンジニアリンググループUnit1(製薬プロモーション)/Unit9(治験臨床研究支援)エンジニアの三浦[…
2日前

Claude Artifact用のLP作成プロンプト
Zennの「生成 AI」のフィード

以下をコピペして試してみてください。Claudeの機能に驚かされます。Amazon風のWebサイト作成プロンプトAmazon風の商品販売Webサイトを作成してください。ビジネスアイデア出しプロンプト私は○○に興味があります。それに関連する、○○(個人/団体/法人)向けのビジネスアイデアを5つ出してください。例:私は保護猫活動に興味があります。それに関連する、法人向けのビジネスアイデアを5つ出してください。LP作成用プロンプト1私は○○のWebサイトをLLMに作成させたいです。下記のプロンプトの一部を、希望に合った内容に改変してください。### 0. デザイン...
2日前

Amazon Bedrock Knowledge BasesとRAGASでRAGの評価をやってみた
Zennの「LLM」のフィード

はじめにFusicのレオナです。今回はAmazon Bedrock Knowledge BasesとRAGASでRAGの評価をしてみたいと思います。 Amazon Bedrock Knowledge BasesとはAmazon Bedrock Knowledge Bases とは、Amazon Bedrockの機能のひとつであり、フルマネージドなベクトル検索サービスです。Amazon Bedrockで提供しているLLMと自社データソースからRAG (Retrieval Augmented Generation)を簡単に構築できる機能を提供しています。 RAGASとはRA...
2日前

Amazon Bedrock Knowledge BasesとRAGASでRAGの評価をやってみた
Zennの「生成 AI」のフィード

はじめにFusicのレオナです。今回はAmazon Bedrock Knowledge BasesとRAGASでRAGの評価をしてみたいと思います。 Amazon Bedrock Knowledge BasesとはAmazon Bedrock Knowledge Bases とは、Amazon Bedrockの機能のひとつであり、フルマネージドなベクトル検索サービスです。Amazon Bedrockで提供しているLLMと自社データソースからRAG (Retrieval Augmented Generation)を簡単に構築できる機能を提供しています。 RAGASとはRA...
2日前

How to Use Aider, an AI Coding Tool
Zennの「LLM」のフィード

Japanese ver IntroductionWhile AI agents like Devin and AI tools for integrated development environments (IDEs) such as Windsurf and Cursor exist, Aider remains a persistently used tool (among at least three people I know).This article was created with the hope that by understanding Aider's a...
2日前

【入社エントリ】コンサルから松尾研究所のデータサイエンティストへ
2
松尾研究所テックブログのフィード


はじめにはじめまして!4月に松尾研究所へシニアデータサイエンティストとして入社した渡邊です。前職ではITコンサルタントでしたが、この度データサイエンスの世界へ飛び込みました。この記事では、その理由や入社後に感じたことなどを共有したいと思います! バックグラウンド化学系の修士課程を修了後、新卒で野村総合研究所に入社し、ITコンサルタントとして4年間勤務しました。主にAIを用いた業務改革やPoC推進のプロジェクトに関わる中で、顧客課題を技術を用いて解決することの楽しさを学びました。また、生成AI技術の面白さや可能性に魅了されて、生成AIに関わるプロジェクトやR&D活...
2日前

【初学者向け】自分自身の「あったら嬉しい」を生成 AI を用いて作成してみる
Zennの「生成 AI」のフィード

はじめにクラウドエース 第一開発部の濱です。普段生活していて「これあったら便利なんだけど、ちょっと満足できないんだよなぁ」と思うこと、よくあると思います。有料アプリしかない欲しい機能がない自分専用にカスタマイズしたいこうなってしまった場合、妥協するか...ではなく、簡単な機能なら生成 AI を用いて自分で作ってしまえばいいと考えています。 私の「あったら嬉しい」と思った瞬間先日 (2025年2月28日)、モンスターハンターワイルズが発売されました。私はゲームが大好きで、本作もよくプレイしています。現状の最終コンテンツまでクリアして、あとは最強の装備を作成するの...
2日前

AIコーディングツール Aiderの使いかた
4
Zennの「LLM」のフィード


English ver 最初にAIエージェントのDevinや、統合開発環境のAIツールであるWindsurfやCursorなどがある中で、根強く (身の回りではN=3くらい) 使われているツールとしてAiderがあります。この記事は、Aiderの利点や実際の使いかたを知ってもらうことで、数あるAI開発環境の選択肢の1つとして入れてもらえることを期待して作成しました。当初、この記事自体をAiderで作成しようと試みましたが、あまりうまくいきませんでした。そのため、音声入力した内容をAIでマークダウン形式に構造化し、そのテキストを全面的に手動で修正したものです。 Aiderと...
2日前

Cursorを用いたX(旧Twitter)投稿分析
Zennの「LLM」のフィード

!本記事では、コーディングAIアシスタント「Cursor」を活用し、ZENKIGENデータサイエンスチームのXアカウント(@zenkigen_ai)の投稿データを分析した事例を紹介します。分析の目的は、エンゲージメントを高める投稿の特徴を明らかにし、アカウント運用に役立てることです。こんにちは。ZENKIGENデータサイエンスチームの川﨑です。所属チームでXアカウントを運用しており、AIに関する情報を発信していますのでご興味あれば覗いてみてください。 概要今回は、CursorなどのコーディングAIを活用したデータ分析の事例として、チームで運用しているXアカウントの投稿データを...
2日前

うさぎでもわかるGemini 2.5 Pro Preview 05-06の最新機能
Zennの「LLM」のフィード

うさぎでもわかるGemini 2.5 Pro Preview 05-06https://youtu.be/XGeM6zLmiTEこんにちは🐰 みなさん!Googleから最新のAIモデル「Gemini 2.5 Pro Preview 05-06」(通称:I/O Edition)がリリースされたうさ!今回はこの新しいモデルの特徴や改善点を、うさぎでもわかるように解説するうさよ。 はじめに2025年5月6日、Googleは「Gemini 2.5 Pro Preview 05-06」をリリースしました。これは「I/O Edition」とも呼ばれる特別バージョンで、本来は数週間後に...
2日前

OpenAIのAny-to-Any APIでTTSサービスの音声品質を比較してみた
4
ABEJA Tech Blog


はじめに 比較対象のTTSサービス 実験の方法 実装 各サービスで音声合成 1. OpenAI(gpt-4o-mini-tts) 2. Google Cloud Text-to-Speech 3. Amazon Polly 5. ElevenLabs 音声合成の自動評価 評価結果 まとめ We Are Hiring! はじめに こんにちは!ABEJA でソフトウェアエンジニアを務めている宇留嶋です。2025 年 3 月に OpenAI が発表した次世代音声モデル群は、従来の Whisper を凌ぐ高精度な音声認識と、話し方まで指示できる音声合成をAPI で提供し、音声対話向けの LLM API…
2日前

データサイエンティストのための確率的挙動を含むソフトウェアテスト
Zennの「機械学習」のフィード

はじめに最近 Zenn に記事を書くことをライフワークにしたいと思っている redtea です。本業として所属する組織が変わりましたので、当面の間は個人で Zenn 記事を書いていく予定です。機械学習や数理最適化の実務を担当していると、そのソフトウェアに含まれる確率的挙動によりデバッグやテストに苦労することがあるかもしれません。多くの場合でシード値[1]を固定することでデバッグやテストができますが、それだけでは不十分なこともあります。本記事では、確率的挙動を含むソフトウェア、特に機械学習・数理最適化分野のシステムに対するテスト戦略に焦点を当て、私なりの考え方と具体的な実践方法を...
2日前

ChatGPTにサーバーも任せてみた|Flutter連携編
Zennの「生成 AI」のフィード

前回、Zennに投稿するにあたり初めてMarkdown記法をつかったのでそれが結構大変だったのは内緒だよ! はじめに前回(ChatGPTだけでFlutterアプリ開発してみる|1日目)は、ローカルで完結するFlutterアプリ(買い物メモ)をChatGPTと一緒に作ってみました。2日目の今回はそこから一歩進んで、クラウド保存=「アプリのデータをサーバーに保存して復元する仕組み」に挑戦してみます。とはいえ、バックエンドなんてやったことがない…ので、今回もすべてChatGPT先生に教わりながらやってみました。果たして、FlutterとFlaskをつないで、ちゃんとクラウド保存で...
2日前

Starlinkに会いに行こう:Go言語で人工衛星の位置計算にチャレンジ
ABEJA Tech Blog

はじめに 必要知識 TLE (Two Line Element) ケプラーの方程式 (第二法則:面積速度一定) ケプラーの方程式 (第三法則:公転周期の2乗 ∝ 軌道長半径の3乗) 本初子午線 (Prime Meridian) 春分点 (Vernal Equinox Point) グリニッジ恒星時 (Greenwich Sidereal Time: GST) 計算の流れ(全体像) 各部の計算の流れ TLEを解析 元期からの経過時間を計算 軌道長半径を計算 平均近点角を更新 ケプラー方程式を解き、離心近点角を得る 軌道面上の(u,v)座標を得る 摂動補正を適用 軌道面座標からECI座標系に変換 …
2日前

ADKのSequential agentsを使って実装するマルチエージェント
G-gen Tech Blog

G-gen の堂原です。本記事では Google Cloud の Agent Development Kit の機能である、複数の AI エージェントを連携させる Sequential agents の概念と実装方法について、天気予報エージェントの開発を通して解説します。 概要 Agent Development Kit(ADK)とは Sequential agents 処理の概要 AI エージェントの実装 ユーザの都市の現在日付を取得 現在日付から明日の日付を求める Google 検索で天気予報を取得 Sequential agents による連結 動作検証 概要 Agent Develop…
2日前

一律修正・横展開の調査をLLMで行うツールを作り、LLMを比較した
Zennの「LLM」のフィード

概要この記事では、一律修正・横展開の調査をLLMで行うツール yokoten の紹介と、それを使ったgemini/claude/gptの一部モデルの比較、抽象的な指示と具体的な指示の比較、Vue3を使ったアプリに関するレビューを行わせた場合の具体的なハルシネーションの内容などについて述べます。yokotenはClaude Code等よりは安いぐらいの費用で、手軽に横展開のための調査ができ、簡易レポートを生成できます。興味のある方はぜひ使ってみてください。また、yokotenの実装はだいたいLLMで行っており、特別な工夫をしない場合に、今のLLMが出力するコードの品質がどれぐらい...
2日前

一律修正・横展開の調査をLLMで行うツールを作り、LLMを比較した
Zennの「生成 AI」のフィード

概要この記事では、一律修正・横展開の調査をLLMで行うツール yokoten の紹介と、それを使ったgemini/claude/gptの一部モデルの比較、抽象的な指示と具体的な指示の比較、Vue3を使ったアプリに関するレビューを行わせた場合の具体的なハルシネーションの内容などについて述べます。yokotenはClaude Code等よりは安いぐらいの費用で、手軽に横展開のための調査ができ、簡易レポートを生成できます。興味のある方はぜひ使ってみてください。また、yokotenの実装はだいたいLLMで行っており、特別な工夫をしない場合に、今のLLMが出力するコードの品質がどれぐらい...
2日前

鵜呑みにできない、AIモデルの世界評価ランキング「Chatbot Arena」の闇と幻想 不公平を解き明かす(生成AIクローズアップ)
4
テクノエッジ TechnoEdge


今回は、現在AIモデル評価の業界標準とされているランキング形式(リーダーボード)のAIベンチマーク「Chatbot Arena」における問題を明らかにした研究「The Leaderboard Illusion」を取り上げます。
2日前

「みんなで作ろう!!Vibe Coding 100本ノック!!!」に参加してきた話
Zennの「LLM」のフィード

はじめまして、びーぐると申します。表題の「みんなで作ろう!!Vibe Coding 100本ノック!!!」に参加しました。私はヒットアンドブローを作成しました。https://zenn.dev/link/comments/18ef399175ceb3 つくったもの↓こちら↓https://beagleworks.github.io/VibeCoding/hit-and-blow/ そもそもVibe Coding is 何?Vibe Codingに関しての定義は諸説あるようですが、概ね「人間がLLMに指示を出し、LLM主導でコードを生成し制作物を完成させる。その際、人...
2日前

生成AIが登場して、むしろIT界隈のスキルが底上げされたんじゃないか説
Zennの「LLM」のフィード

生成AIの登場により「エンジニアの仕事が奪われる」という懸念が広がる中、実際の現場ではどのような変化が起きているのでしょうか。実際の現場を見てみると、AIツールの普及により定型作業が効率化され、エンジニアはより創造的で高度な問題解決に集中できるようになってきています。・単純作業からの解放により、多くのエンジニアが複雑な設計に時間を使えるように・AIとの協働スキルが今後の採用市場で最重視される傾向・GitHub活動や技術ブログでの発信がエンジニアの市場価値を向上 1. 導入:AI登場で変わるエンジニアの働き方近年、人工知能(AI)技術は目覚ましい進化を遂げ、特にソフトウェア開発...
2日前

はじめてのOpenAI API入門:Pythonで文章生成アプリを作ろう
Zennの「生成 AI」のフィード

※本記事はChatGPTによって作成されています。内容には自動生成による情報が含まれており、正確性・網羅性を保証するものではありません。 1. はじめに本記事では、実際にOpenAI APIを活用して簡単なテキスト生成アプリケーションを構築する方法を解説します。APIキーの取得から環境設定、基本的なAPI呼び出しの方法まで、実践的な手順を丁寧に説明します。LLMを用いた開発に初めて取り組むエンジニアでも、この記事を通じて「最初の一歩」をスムーズに踏み出せることを目指しています。 2. OpenAI APIの概要OpenAIは、GPT-4やGPT-3.5などの大規模言語モデル...
3日前

まさに最強で無敵のタイピングゲームを、知識がゼロでもそれを完全なAI、だけで作る物語
Zennの「LLM」のフィード

最強で無敵のタイピングゲームを、知識がゼロの状態から、完全なAIだけ=自然言語だけ、で構築する取り組みと、そこから得られた知見やノウハウを、完璧で嘘つきな物語で記載する。一切コードを書かずに自然言語依頼だけで、かつ、事前勉強ゼロで初めて触るプログラム言語で、システム開発が出来るのか?「ゼロ・システム開発」を実際にやってみて検証。ゼロ知識、ゼロコーディングによるAIコーディングによって、「実際に作ってリリースした体験」から得られたノウハウや手法を、「Brick AI Coding」と称してまとめる。その手法で、実際にノーコーディングで開発してリリースした本格的なアプリ、「最強で無敵のタイピングゲーム」=「コスモス☆タイピング」を、作例としても触ってもらえる。【コスモス☆タイピング】https://cosmos-typing.web.app/ 普通にタイピングゲームとしても楽しい作品。 開発手法だけでなく、このアプリ自体も知ってほしい。◎リリース出来る動くモノを実際に作った実際の体験を通して◎得られたAIコーディングの知見やノウハウを再整理してまとめなおす◎そのノウハウにたどり着いた理由や
3日前

まさに最強で無敵のタイピングゲームを、知識がゼロでもそれを完全なAI、だけで作る物語
Zennの「生成 AI」のフィード

最強で無敵のタイピングゲームを、知識がゼロの状態から、完全なAIだけ=自然言語だけ、で構築する取り組みと、そこから得られた知見やノウハウを、完璧で嘘つきな物語で記載する。一切コードを書かずに自然言語依頼だけで、かつ、事前勉強ゼロで初めて触るプログラム言語で、システム開発が出来るのか?「ゼロ・システム開発」を実際にやってみて検証。ゼロ知識、ゼロコーディングによるAIコーディングによって、「実際に作ってリリースした体験」から得られたノウハウや手法を、「Brick AI Coding」と称してまとめる。その手法で、実際にノーコーディングで開発してリリースした本格的なアプリ、「最強で無敵のタイピングゲーム」=「コスモス☆タイピング」を、作例としても触ってもらえる。【コスモス☆タイピング】https://cosmos-typing.web.app/ 普通にタイピングゲームとしても楽しい作品。 開発手法だけでなく、このアプリ自体も知ってほしい。◎リリース出来る動くモノを実際に作った実際の体験を通して◎得られたAIコーディングの知見やノウハウを再整理してまとめなおす◎そのノウハウにたどり着いた理由や
3日前

Mastra の workflow の書き方が新しくなるぞ!
1
Zennの「LLM」のフィード


GWに Mastra を触ってみようと思っていたところ、Workflows の書き方が新しくなるという公式ブログを見かけたので、実際のコードも交えて変更点を確認してみました。https://mastra.ai/blog/vNext-workflows Mastra とはMastra は、AI機能を素早く、堅牢に、そして拡張可能に開発するための TypeScript 製フレームワークです。個人的には、LLM アプリケーションといえば Python が主流という印象がある中で、TypeScript で書けるというだけで嬉しいです。詳しくは以下のリンクも参考になります。http...
3日前

Web時代のLLM対応 - /llms.txtファイル規格で変わるAIとの情報連携
Zennの「LLM」のフィード

Web時代のLLM対応 - /llms.txtファイル規格で変わるAIとの情報連携!This article is generated by Claude. LLMsとWebサイトの課題 🤔大規模言語モデル(LLM)は日々進化し、多くのWebサイトやアプリケーションと連携するようになってきました。しかし、AIがWebサイトの情報を扱う際には大きな課題があります。それは、コンテキストウィンドウのサイズが限られていることと、複雑なHTML構造からの情報抽出が難しいという点です。例えば、ドキュメントサイトにアクセスした時、人間であれば必要な情報をすぐに見つけることができるかも...
3日前

初めての運用引き継ぎ
61
フューチャー技術ブログ


<img src="/images/20250507a/undraw_agreement_w6ua.png" alt="" width="800" height="773"><h2 id="はじめに"><a href="#はじめに" class="headerlink"
3日前
5/6 (火)

Rustで自作MCPサーバー
4
Zennの「LLM」のフィード


はじめにみなさんそろそろ「こんなものをMCPサーバー化してみました!」という記事は見飽きてきた頃だと思います。この記事ではSpecificationを読み解き、公式SDKを使わずにMCPサーバーを実装します。なお、MCPの本質でない部分ではサードパーティークレートを使用します。使用したクレートは以下の通りです。 Cargo.tomlasync-trait = "0.1.88"schemars = "0.8.22"serde = { version = "1.0.219", features = ["derive"] }serde_json = "1.0.140"se...
3日前

PDFファイルからセクション情報を取り出す
Zennの「LLM」のフィード

はじめにllms.txtは、ウェブサイトの情報をAIクローラーに参照させる方法です。llms.txtを利用してタスク実行をする試みもあり、例えば、Lance's Blogでは、コード生成についての記事を検索しています。また、以前の私の記事では、GitHubレポジトリのファイルをllms.txtで検索する手法を紹介しています。そして次に、PDFファイルをllms.txtで検索する手法を試したいと思います。長いPDFドキュメントをAIで検索可能にする際、セクションごとにルーティングできると便利です。「QA4AI AIプロダクト品質保証ガイドライン」(2024年5月時点:361ペ...
3日前

AIコーディングで開発効率は上がっているか
Zennの「生成 AI」のフィード

近年、GitHub CopilotやCursorといったAIエディタ、さらにはコード生成に特化したAgentモードなど、AIコーディングツールが開発現場に急速に浸透している。これらのツールは、我々の開発プロセスにどのような変化をもたらし、開発効率を真に向上させているのであろうか。本記事では、AIコーディングがもたらす恩恵と、それに伴い開発者に求められる新たなスキルについて考察する。 AIコーディングがもたらす効率化の側面AIコーディングツールの登場は、多くの開発者にとって歓迎すべき変化をもたらしている。具体的には、以下のような点で開発効率の向上が期待できる。定型的なコードの...
3日前

複数のデータセットを結合したデータセットを自作(PyTorch)
Zennの「ディープラーニング」のフィード

なんで作りたいの?卒業研究でPyTorchを利用した深層学習をやっていた時に、1つの音声データを細かく区切ってデータセットを作っていました。 データセットに入れる音声データを増やすとなったときに、データセットを一から作り直すのがひたすら面倒だったので…「音声データごとにデータセット作って後からくっつければ良くね??????」と思った次第でございます。 後々よく調べてみると、torch.utils.data.ConcatDatasetという全く同じ名前のクラスがありました。みんな考えることって同じなんですね…。ただ、自分で実装していろいろ理解が深まりました。 初心者研究生な...
3日前

グラフニューラルネットワークって何?②GNNと他の深層学習モデル:Transformer
Zennの「ディープラーニング」のフィード

GNNって結局どんなもの?ほかの深層モデルとどう違う?さて、上の質問の一つ目に答えるのは簡単である。というのも、GNNというものは非常に抽象的な概念であり、実際にはグラフ畳み込みニューラルネットワーク(GCN)やグラフアテンションネットワーク(GAT)等の具体的なモデルになってはじめて何をやっているのかがコードレベルで分かるのである。一方で、二つ目の質問は、私も学生時代に投げかけられて興味深いと感じていたので、今回の内容で触れ始めていこうと考える。皆さんも自分のなじみのあるモデルとGNNの関連性を知ることができれば、「他人」のように遠かったGNNを「遠い親戚」くらいには親しく感じて...
3日前

Ruby on RailsアプリケーションをDevinにオンボーディングする
34
Generative Agents Tech Blog


はじめに ジェネラティブエージェンツの西見です。 今回は(なぜか)Ruby on RailsアプリケーションのDevinへのオンボーディングをしてみたので、その内容について紹介します。 Ruby on RailsアプリケーションをDevinにオンボーディングしようとしたときに困るのは、そもそもDevinにrubyがプリインストールされていないことです。 この問題は、開発環境をDev Containerで構築していれば解決できます。DevinからはDev Container CLI経由でRails環境を操作できるようにしておけば、Devinのワークスペース上に特別なセットアップをする必要がなくな…
3日前

日本人工知能オリンピック(JOAI)に参加しました!(第一回JOAI参加記)
Zennの「機械学習」のフィード

はじめにこんにちは!setoです!この度、日本人工知能オリンピック(JOAI)に参加しました!初心者ながら、いろいろと頑張ったので、「せっかくだし記事にしてみよう!」と思い立ち、初めてのブログ執筆に挑戦しています。JOAIに挑戦したときのリアルな体験や感じたこと、工夫した点などをまとめています。来年以降にJOAIを受ける方や、KaggleやAIに興味を持っている方にとって、少しでも参考になれば嬉しいです! 自己紹介高校生です!これまでは主に競技プログラミングに取り組んでいましたが、ある日データサイエンスに興味が湧き、「東京大学グローバル消費インテリジェンス寄付講座(...
3日前

K近傍法
Zennの「機械学習」のフィード

はじめに!記事内容は筆者の勉強まとめ内容です。内容の正確さや漏れについては保証できません。ご覧いただく際は、ご自身で判断のうえ参考にしてください。 概要シラバス:E資格2024#2k近傍法とkd-treeを理解します キーワードk近傍法, 近似最近傍, kd-tree 学習内容 k近傍法(k-Nearest Neighbors, k-NN)教師あり学習のアルゴリズムの一つです。このアルゴリズムは、入力データに基づいて最も類似した「近隣」のデータポイントを見つけ、分類や予測を行います手順訓練データセットの準備:ラベル付きの訓練データを用意し...
3日前

距離計算
Zennの「機械学習」のフィード

はじめに!記事内容は筆者の勉強まとめ内容です。内容の正確さや漏れについては保証できません。ご覧いただく際は、ご自身で判断のうえ参考にしてください。 概要シラバス:E資格2024#2距離計算の数式を知ります キーワードコサイン距離, コサイン類似度, ユークリッド距離, マンハッタン距離,マハラノビス距離, Lp距離 学習内容 コサイン距離とコサイン類似度コサイン類似度:2つのベクトルがどれだけ似ているかを測定するために使用される指標公式:\vec{A}=(a_1,a_2); \vec{B}=(b_1,b_2)Cosine ...
3日前

激薄スマホ時代の幕開け「Galaxy S25 Edge」いよいよ予約開始に(スマホ沼)
テクノエッジ TechnoEdge

サムスンの薄型スマホ「Galaxy S25 Edge」が予約開始。5月13日に発表予定で、事前予約は5月20日まで。発売日は5月21日で、カラーはブルー、ブラック、シルバー。
3日前

今度はIntelで組んでみようか。PS5 Proクラス性能目指す『OS代込みで12万円のゲーミング自作PC』はどの程度まで行けるか。オンラインイベント第3弾を5月6日開催
テクノエッジ TechnoEdge

テクノロジージャーナリストの西川善司さんを講師に、すでに組み上げ済みのPS5 Pro同予算自作ゲーミングPCの実演と解説をを行うワークショップの第3弾です。
3日前
5/5 (月)

機械学習の分類
Zennの「機械学習」のフィード

はじめに!記事内容は筆者の勉強まとめ内容です。内容の正確さや漏れについては保証できません。ご覧いただく際は、ご自身で判断のうえ参考にしてください。 概要シラバス:E資格2024#2機械学習の分類を知ります キーワード教師あり学習, 半教師あり学習, 教師なし学習, 強化学習,次元削減 学習内容 教師あり学習(supervised learning)正解となる答えが含まれたデータをモデルに学習される方法です正解となる答えをラベルといいます答えが含まれたデータをラベル付きデータ、もしくは訓練データと呼びます分類と回帰2タイプに分けられ...
4日前

世界最薄折りたたみ「OPPO Find N5」の付属ケースがイマイチ不安だったので探しに行った(スマホ沼)
テクノエッジ TechnoEdge

OPPOの折りたたみスマホ「Find N5」の純正ケースは背面のみの保護に不安を感じ、深センでアラミド繊維ケースを購入。薄さを保ちつつしっかり保護できるケースを探求した。
4日前

OCRに関する技術調査その2(PaddleOCRベースの精度改善検討)
Zennの「機械学習」のフィード

0. はじめにお疲れ様です。STARAI社員の中岸です!前回、OCR(光学文字認識(こうがくもじにんしき、英: Optical character recognition):活字、手書きテキストの画像を文字コードの列に変換する技術)に関する記事を書きましたが、今回はもう少し深堀りして精度向上に向けてなにかできることはないかと色々と苦戦しながら調べてみた結果についてまとめてみました。今回は、PaddleOCRのOCRモデルについて色々と試してみました。以降では、それぞれ試してみたことをセクションにして、サンプル画像(今回の処理対象は前回と似たような日本語ベースのダミー請求書、手書...
4日前

OCRに関する技術調査その2(PaddleOCRベースの精度改善検討)
Zennの「ディープラーニング」のフィード

0. はじめにお疲れ様です。STARAI社員の中岸です!前回、OCR(光学文字認識(こうがくもじにんしき、英: Optical character recognition):活字、手書きテキストの画像を文字コードの列に変換する技術)に関する記事を書きましたが、今回はもう少し深堀りして精度向上に向けてなにかできることはないかと色々と苦戦しながら調べてみた結果についてまとめてみました。今回は、PaddleOCRのOCRモデルについて色々と試してみました。以降では、それぞれ試してみたことをセクションにして、サンプル画像(今回の処理対象は前回と似たような日本語ベースのダミー請求書、手書...
4日前
5/4 (日)

ChatGPT Deep Research と競馬勝率予測をゆるっと解説 🐴✨ – GPT 先生と AI オタクももちゃんの Q&A
Zennの「機械学習」のフィード

⚠️ このページは「ChatGPT の Deep Research って何?」「LLM に競馬の勝率って予測できるの?」をサクッと知りたい人向けの記事だよ!(ᐢ ˙꒳˙ ᐢ)❣️読み終わるころには① Deep Research の裏側② LLM の"数値予測"が得意/苦手な理由③ 精度を上げるハイブリッド戦略がわかっちゃうからぜひ最後まで読んでね~ 💗 登場人物👧🏻 もも 🍑(本名:ももか・女子大生 2 年)テンション高め、顔文字多用、AI・競馬・最新ガジェットが大好き。👴🏻 せんぱい 👴🏻(通称:おぢさん)落ち着いた語り口でロジックを噛み砕い...
5日前

機械学習とは
Zennの「機械学習」のフィード

はじめに!記事内容は筆者の勉強まとめ内容です。内容の正確さや漏れについては保証できません。ご覧いただく際は、ご自身で判断のうえ参考にしてください。 概要シラバス:E資格2024#2人工知能、機械学習と深層学習はどのようなものを知ります キーワード人工知能, 機械学習, 深層学習, ディープラーニング,ニューラルネットワーク, 特徴量, 学習モデル 学習内容 人工知能(Artificial Intelligence)特に厳密な定義がないが、「人間と同じような知的処理を機械で模倣しようとする」概念です人工知能4つの発展段階LV1:制御プログラ...
5日前

Kaggleメダル獲得への挑戦 Vol.1
Zennの「機械学習」のフィード

はじめにこの記事は30歳未経験からエンジニアに転身したド文系の僕が、機械学習エンジニアになるためにKaggleに挑戦しながらスキルを身につけていく過程をリアルタイムで発信していく連載記事となります。毎週末、その週に僕自身が学んだ内容を発信していきます。学びながら発信していきますので、場合によっては間違った情報や、誤って理解してしまっているものもあるかもしれません。その際はぜひ温かくご指摘をいただけるとうれしいです!ド文系でも本気で取り組めば結果を出せるんだという姿を見せられるように、日々頑張っていきます! なぜKaggleに挑戦しようと思ったか?元々機械学習に興味はあ...
5日前

ゼロからつくるDeepLearning 2 格闘日誌5/1 1-2章
Zennの「ディープラーニング」のフィード

ゼロから作るDeep Learning 2を友達と読んでいます.自分用のまとめかつ,補充知識として重要なことを書いています.読者対象はゼロから作るDeep Learning 実装が終わったくらいの方,Deep Learning 2を読んでいる方です.!以下のコードはゼロから作る Deep Learning 2のコードを複写/一部改変しています.利用の際には十分に注意し,本書の記述に従ってください.ゼロつく2の読者にとっては1章は既習の内容だと思うので、飛ばして2章からぜひ.(追記:2025/05/06)commonで関数を実装したほうが便利そうなので,やっぱり1章もさらっと...
5日前

【随時更新】【論文】 Open-Vocabulary Segmentationまとめ
Zennの「ディープラーニング」のフィード

Open-Vocabulary Segmentation系の論文について、気が向いたときに簡単にまとめています。随時更新です。各図表は紹介している論文のものを使用しています。 A Simple Framework for Open-Vocabulary Segmentation and Detection (ICCV2023)[1]物体検出とセグメンテーションを統合的に学習するOpen-VocabularyモデルであるOpenSeeDを提案。タスク間の性質の違いに対して、デコーダ内部でForeground QueryとBackground Queryを分離し、別々にマッチ...
5日前
5/3 (土)

オープンソース動画生成AIの新標準「FramePack」が順方向生成「F1」サポートし、叡智も即対応。もはや普段使いできますね(CloseBox)
98
テクノエッジ TechnoEdge


高速でかつ長時間の動画生成が可能なオープンソースAI「FramePack」。Image to Videoで入力した画像から逆方向に生成していく仕組みですが、これを順方向。つまり、他の多くの動画生成AIと同じやり方で生成するオプション「F1」がサポートされました。
6日前

vivo X200 Ultraにロングな望遠レンズを装着したらもうスマホじゃなくなった(スマホ沼)
4
テクノエッジ TechnoEdge


vivo X200 Ultraの望遠レンズは、特定用途向けに高倍率撮影が可能で、アタッチメントを使って装着。一般ユーザーには難しいが、野鳥観察などで活用できる。
6日前

「AIエージェントキャッチアップ #31 - OpenAI Codex CLI」を開催しました
1
Generative Agents Tech Blog


ジェネラティブエージェンツの大嶋です。 「AIエージェントキャッチアップ #31 - OpenAI Codex CLI」という勉強会を開催しました。 generative-agents.connpass.com アーカイブ動画はこちらです。 www.youtube.com OpenAI Codex CLI 今回は、OpenAIのコーディングエージェント「OpenAI Codex CLI」について、動かしてみたりソースコードを読んだりしてみました。 Codexの公式リポジトリはこちらです。 github.com 今回のポイント Codexの基本的な使い方 OpenAI Codex CLIは、ター…
6日前

[JOAI] 第一回日本人工知能オリンピックで金賞を受賞しました...!!
Zennの「機械学習」のフィード

この度、日本人工知能オリンピック(JOAI)に参加 し、金賞を受賞することができました!! 🏅(まだ正式に受賞はしていないのですが、順位的にはいただけるはず..)今回のコンペティションを通して様々なことを学ばせていただいたので、その記録をしておきたかったのと、これから人工知能オリンピックに参加される皆様の参考になれば良いな と思い、この記事を書くことにしました。ぜひご一読下さい...!! 🤖✨https://ioai-japan.org/ 日本人工知能オリンピック(JOAI)について!ここで紹介する内容は第一回 JOAI の内容であり、以降の開催においてはルール等が変更さ...
6日前

[JOAI] 第一回日本人工知能オリンピックで金賞を受賞しました...!!
Zennの「ディープラーニング」のフィード

この度、日本人工知能オリンピック(JOAI)に参加 し、金賞を受賞することができました!! 🏅(まだ正式に受賞はしていないのですが、順位的にはいただけるはず..)今回のコンペティションを通して様々なことを学ばせていただいたので、その記録をしておきたかったのと、これから人工知能オリンピックに参加される皆様の参考になれば良いな と思い、この記事を書くことにしました。ぜひご一読下さい...!! 🤖✨https://ioai-japan.org/ 日本人工知能オリンピック(JOAI)について!ここで紹介する内容は第一回 JOAI の内容であり、以降の開催においてはルール等が変更さ...
6日前
5/2 (金)

【論文まとめ】Zero-Shot Monocular Scene Flow Estimation in the Wild(CVPR2025)
Zennの「ディープラーニング」のフィード

Zero-Shot Monocular Scene Flow Estimation in the Wild( (CVPR2025) [1]Zero-shot monocular scene flow estimationモデルを提案。使用している図表および計算式はすべて論文[1:1]のものを使用、引用しています。 背景Segmenta Anything[2]やDepth Anything[3]、DUSt3R[4]のように、SegmentationやDepth推定においては強力な性能を持つ手法が提案されているが、Scene Flow(SF)はそうではない。以下の3つの問題...
7日前

ELYZA-Thinking-1.0で数学オリンピック予選問題を解く
Zennの「機械学習」のフィード

2025/05/01、ELYZAが新しい日本語モデルを三つ公開しました。ELYZA-Thinking-1.0-Qwen-32BELYZA-Shortcut-1.0-Qwen-32BELYZA-Shortcut-1.0-Qwen-7B詳細は下記記事にあります。https://zenn.dev/elyza/articles/bc68f53fc0a83b すごいところ日本語でreasoningモデルを作成(日本語による数学的、論理的思考能力を向上)非reasoningモデル(Shortcutモデル)の論理的思考能力向上にも成功MCTSを合成データセット作成に活用さ...
7日前

スター・ウォーズの日で大幅割引のMay The 4thセール。近作『Outlaws』半額、古典タイ・ファイターやポッドレーサーも最大85%オフ(おすすめタイトル)
1
テクノエッジ TechnoEdge


5月4日スター・ウォーズの日にあわせて、今年も各ストアがセールを実施しています。
7日前