detection」の検索結果

168
githubGitHubあり2026-06-09

cvat — Computer Vision Annotation Tool (CVAT) is a leading platform for building high-quality visual datasets for vision AI. It offers open-source, cloud, and enterprise products, as well as labeling services, for image, video, and 3D annotation with AI-assisted labeling, quality assurance, team collaboration, analytics, and developer APIs.

CVATは、機械学習用の業界標準のデータエンジンです。さまざまなスケールのチームが使用し、さまざまなスケールのデータに対応しています。

品質予測/異常検知コンピュータビジョンセグメンテーション分類検出画像
用途
データのラベル付けと管理
難易度
Easy
コスト
High
arxivPaper only2026-06-08

What the Eyes See, the LLMs Miss: Exploiting Human Perception for Adversarial Text Attacks

大規模言語モデル(LLM)を運用するコンテンツモデレーションシステムは、有害なオンラインコンテンツを防止するために重要な役割を果たします。しかし、これらのシステムの主な目標は単にトークナイズされたテキストを操作することに

自然言語処理大規模言語モデル分類検出画像
用途
文書の分類
難易度
Hard
コスト
High
arxivPaper only2026-06-08

LargeMonitor: Monitoring Online Task-Free Continual Learning via Large Pretrained Models

オンライン学習の継続学習では、モデルは非駅性データ ストリームから知識を継続的に蓄積する必要があります。モデルのパラメータはトレーニング中に効果的に調整される必要がありますが、パラメータ効率的なプロンプト チューニングや

深層学習軽量化・量子化検出テキストマルチモーダル
用途
オンライン学習の継続学習
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Now You (Still) See Me: Detecting Evasive Steganographic Payloads in LLMs

最近の研究では、線形プローブを使用して暗示された秘密を内部アクティブ化から回復し、ステラングラフィック侵入の検出を改善しました。しかし、ステラングラフィック侵入を検出し、内部アクティブ化を検知するには、ステラングラフィッ

自然言語処理大規模言語モデル検出テキスト
用途
ステルタグラフィックの侵入検出
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Multi-View Speech Representation Learning for Parkinson's Disease Detection Using Context-guided Cross-modal Attention

パーキンソン病(PD)の早期検出への取り組みとして、脳の損傷が発症前に生じる話術障害を分析するため、音声分析を用いてパーキンソン病の診断を提唱しています。

センサ/時系列深層学習Transformer検出生成埋め込み
用途
パーキンソン病の早期 検出
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Alcmean's: Unsupervised community detection using local Laplacian, automatic detection of the number of centers

Alcmean's アルゴリズムは、複雑なネットワークの分析において基本的な問題であるコミュニティ検出に取り組んでいます。従来のアルゴリズムはマニュアルなパラメータ調整を必要としており、中心の選択も不正確です。この課題を

深層学習グラフニューラルネット検出埋め込み教師なし
用途
コミュニティ検出問題
難易度
Hard
コスト
Low
arxivPaper only2026-06-08

ArtiFact: A Large-Scale Multi-Modal Cultural Heritage Dataset

LLMを用いた臨床研究論文の草案作成を支援するために、生成されたテキストを検証するためのアーキテクチャを設計。これにより、虚偽の citaion、数字の不正確な記録、およびガイドライン違反が防がれます。

品質予測/異常検知コンピュータビジョン動画認識検出画像テキスト
用途
医学論文執筆のサポート
難易度
Hard
コスト
High
arxivPaper only2026-06-08

ATN3D: Density-Aware LiDAR-Radar Early 3D Object Detection Under Extreme Sparsity

自動運転車やインテリジェント輸送システムなどの自動化された車両の感知には3次元オブジェクト検出が必要です。道路での長距離検出は困難ですが、道路ではこの「長距離」に対する感知と決定の時間は約1-2秒です。2つの主な課題が現

センサ/時系列深層学習Transformer分類検出テキスト
用途
車のデッキの長距離認識に対する3次元オブジェクト検出
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Vision Language Model Helps Private Information De-Identification in Vision Data

ビジュアル言語モデル(VLM)は、プライバシー保護において有効性の高い能力をもつ。しかし、視覚データを扱う際のプライバシーリスクについては、それまでほとんど注目されていなかった。VLMを使用して、プライバシー保護を確保す

コンピュータビジョン物体検出分類検出画像
用途
ビジョン言語モデルを使用したビジュアルデータのプライバシー保護
難易度
Hard
コスト
High
arxivPaper only2026-06-08

SpaceVLN: A Zero-Shot Vision-and-Language Navigation Agent with Online Spatial Cognitive Memory and Reasoning

Vision-and-Languageナビゲーションエージェントは、言語指示に従って環境を探索できる。Zero-shot Vision-and-Languageナビゲーションエージェントには、未知の環境における安全性と信

深層学習軽量化・量子化検出画像3D
用途
バイオインフォマティクスのための零-shot Vision-and-Languageナビゲーションエージェント
難易度
Hard
コスト
High
arxivPaper only2026-06-08

Detecting Differences Is Not Understanding Structure: Large Language Models Fail at Graph Isomorphism

この研究では、大きな言語モデルがグラフの同型性を推論できるかどうか調査し、小さなグラフでは同型性を認識できたものの、シードノードラベルを入れ替えてグラフ同型性を検証した結果、同型性が識別されなかった。

自然言語処理大規模言語モデル検出テキスト
用途
グラフの同型性を推論する
難易度
Hard
コスト
High
githubGitHubあり2026-06-08

pycaret — Open-source, low-code AutoML platform for Python. PyCaret 4.0: sklearn-native engine + React control plane.

pycaretは、Pythonによるオープンソースの低コストオートMLプラットフォームで、Reactコントロールプレーンを備えたsklearnネイティブエンジンを搭載しています。

CPUで試しやすい機械学習教師あり学習分類検出回帰
用途
オートMLプラットフォーム
難易度
Easy
コスト
Low
githubGitHubあり2026-06-07

presidio — An open-source framework for detecting, redacting, masking, and anonymizing sensitive data (PII) across text, images, and structured data. Supports NLP, pattern matching, and customizable pipelines.

presidioは、テキスト、画像、構造化データを含む敏感データを検出、削除、マスク、アノニマイズするオープンソースフレームワークです。自然言語処理、パターンマッチング、カスタマイズ可能なパイプラインをサポートします。

表形式向き深層学習Transformer分類検出画像
用途
データのプライバシーを保護する
難易度
Easy
コスト
Low
arxivPaper only2026-06-05

Does Appearance Help? A Systematic Study of Image-Based Re-Identification in Online 3D Multi-Pedestrian Tracking

3D Multi-Object Tracking (MOT)では、人の動きを検出し続けるために、3D点群データから3D人体の姿勢姿勢を推測する必要があり、主に幾何学情報に依存しているが、これは状況によっては人を分別するの

深層学習Transformer検出画像テキスト
用途
3D人間の追跡システムの外観の有用性
難易度
Hard
コスト
High
arxivPaper only2026-06-05

A Causal Probabilistic Framework for Perception-Informed Closed-Loop Simulation of Autonomous Driving

この論文では、自動運転安全性評価のための新しいフレームワークを提案した。CAusalProbabilisticFrameworkは、現実世界の感知能力を考慮したシミュレーションを用いて、安全性を評価することによって、安全

センサ/時系列数学・理論確率・統計検出
用途
自動運転安全性評価のための新しいフレームワーク
難易度
Hard
コスト
Medium
arxivPaper only2026-06-04

Symmetric Divergence and Normalized Similarity: A Unified Topological Framework for Representation Analysis

ペアのトポロジー的な距離に関する制約を満たすための統一的なトポロジーコーラムを開発しました。これにより、トポロジー的な距離の精度を向上でき、信頼できる結果として得られることができました。

深層学習CNN検出
用途
頂点間のトポロジー的な距離
難易度
Hard
コスト
High
arxivPaper only2026-06-04

TinyML-Driven Cybersecurity for Autonomous Spacecraft: Latency-Accuracy Analysis for SPARTA RF and Cyber Threat Detection

この研究では、自律宇宙船のサイバーセキュリティ対策を実施しました。研究結果によると、TinyMLを用いたクラシカルなモデルは、SPARTA 攻撃モデルに対する対策が最も効果的であると報告されました。

表形式向きCPUで試しやすい深層学習軽量化・量子化検出回帰
用途
自律宇宙船のサイバーセキュリティ対策
難易度
Hard
コスト
Medium
arxivPaper only2026-06-04

AffordanceVLA: A Vision-Language-Action Model Empowering Action Generation through Affordance-Aware Understanding

このリポジトリでは、画像認識モデルにアクション生成能力を付与することを目指したモデルを提案します。このモデルは、画像認識のための事前訓練モデルを用いて、複雑なアクションを生成することができます。

深層学習Transformer検出生成予測
用途
画像認識とアクションの生成
難易度
Hard
コスト
High
arxivPaper only2026-06-04

Towards a Data Flywheel for Embodied Intelligence in Logistics

Autonomous drivingでは、ロボットが視覚認識した情報に基づいて行動を決定する必要があるが、過去のデータで構築された空間モデルでは、ロボットの行動を予測することが困難であるため、空間モデルを構築することによ

コンピュータビジョンマルチモーダル異常検知テキスト動画
用途
ロボットの行動予測に適した空間を構築
難易度
Hard
コスト
High
arxivPaper only2026-06-03

TabSODA: Tabular Diffusion based Imputation with Skip Pattern Detection and Ordinal Awareness

本論文では、欠損値がある表格型データの欠損補完に関して取り組み、欠損値がないセルと同様に動作するSkipパターン検出と順序性意識のあるdiffusionベースの欠損補完アルゴリズムを提案しました。

表形式向きコンピュータビジョンセグメンテーション検出テキスト表形式
用途
表格型データの欠損補完
難易度
Hard
コスト
High
arxivPaper only2026-06-03

Identifying Gems from Roman RAPIDly

この研究では、将来の天文台 Roman が取得するデータに対して、変換検出と変換エラー検出の自動パイプラインを提案している。変換検出は、特に天文台 Roman のデータでは重要な機能であり、天文現象を検出するために迅速な

機械学習教師あり学習分類検出画像
用途
有望な天体に自動エラー検出と変換検出機能
難易度
Hard
コスト
High
arxivPaper only2026-05-21

Quantum Genetic Optimization for Negative Selection Algorithms in Anomaly Detection

この論文では、アノマリーディテクションにおける負の選択アルゴリズムを最適化するために、量子遺伝アルゴリズムを導入します。这により、検出器の生成効率を向上させることができ、精度も向上します。

品質予測/異常検知自然言語処理ファインチューニング検出生成異常検知
用途
アノマリーディテクションにおける負の選択アルゴリズムの最適化
難易度
Hard
コスト
Medium
githubGitHubあり2026-05-21

pytorch-grad-cam — Advanced AI Explainability for computer vision. Support for CNNs, Vision Transformers, Classification, Object detection, Segmentation, Image similarity and more.

このライブラリは、コンピューター ビジョンのための高度なAI解釈と可視化ソリューションです。このライブラリは、CNN、ビジョン トランスフォーム、分類、物体検出、分割、画像類似度など、さまざまなコンピューター ビジョンの

深層学習Transformer分類検出セグメンテーション
用途
AIの解釈と可視化ソリューション
難易度
Easy
コスト
Low