screenpipe — YC (S26) | AI that knows what you've seen, said, or heard. Records everything you do, say, hear 24/7, local, private, secure
ユーザーの行動を認識し、オートエージェントを構築するためのツール。
- 用途
- オートエージェント構築
- 難易度
- Easy
- コスト
- High
「LLM」の検索結果
195 件ユーザーの行動を認識し、オートエージェントを構築するためのツール。
このリポジトリでは、AIエンジニアリングのためのリソースを提供しています。
音声認識、声活動検出、テキスト処理などを行う、基盤となる音声認識ツールキットを提供する。
このリポジトリでは、私的なAIプラットフォームであるDocGPTを提供しています。
prompts.chatは、コミュニティが共有したChatGPT用のプロンプットを発見・収集できる場所で、無料でオープンソースで提供されている。
rayは、core分布ランタイムとAIライブラリで構成されたAI計算エンジンで、スケーラブルなAI計算をサポートする。
AIを使ったwebスクレイピングツールです。
Rustを使ってモジュラーLLMアプリケーションを構築することができるライブラリです。
AIエージェントを組み立てるためのライブラリ。
Apple Silicon上でLLM推論サービスをシステムエンジニアが作成するチュートリアル。
このリポジトリは大規モデルの無学習に関するリソースをまとめたものです。
セキュリティゲートウェイを提供するクラウドネイティブなプラットフォームです。
デバイス上のLLM推論をXビット量化を使用したもの。
本研究では、生成推奨システムにおけるアイテムIDの構築、調整、生成の手法について、アイテムIDの構築方法を分析しています。
Unsloth Studioは、オープンモデルのトレーニングと実行を支援するWebUIです。このライブラリは、Gemma4、Qwen3.5などのオープンモデルのテストとトレーニングを支援するために使われます。
ARTは、多段強化学習トレーナーです。このトレーナーは、GRPOを使用して、現実世界のタスクに対して、多段強化学習を行うことができます。
OpenRLHFは、Ray上に構築された強化学習フレームワークです。このフレームワークは、PPO、DAPO、REINFORCE++など、様々な強化学習アルゴリズムをサポートしています。
この論文では、LLM を提供するために使用される Mooncake サービス プラットフォームについて説明しています。Mooncakeは、Kimi というリーディングのLLMサービスを提供するサービスです。Kimiは、M
このリポジトリでは、高性能で大規模なベクトルデータベースとベクトル検索エンジンを提供しています。
xtunerは、超大規模MoEモデルを高速にトレーニングするためのトレーニングエンジンです。
このリポジトリでは、AIワークロードを管理するためのシステムであるSkypilotを提供しています。
TensorZeroは、LLMゲートウェイ、オブザーバビリティ、評価、最適化、実験を統一したオープンソースのLLMOpsプラットフォームです。
このリポジトリでは、AIアプリケーションをローカルに実行できるツールキットであるRunAnywhere-sdksを提供しています。
metaflowは、AI/MLシステムを構築・管理・ディプロイするために使用できるプラットフォームです。
マルチモーダルAIに適したオープンレイクハウスフォーマットです。このフォーマットでは、パレットからデータを2行のコードで変換することができ、100倍速くなります。また、ベクトルインデックスやデータバージョニングが可能です
AIエージェントをGoogle Cloudに展開することが可能で、CI/CD、評価、観察など、プロダクションリードテンプレートが事前に用意されています。
flyteは、高度に動的で堅牢なAIオーケストレーションプラットフォームであり、データ、モデル、コンピューティングを統合してAIワークフローを作成することができます。
このリポジトリでは、AIモデルの互換性を確保するためのオープンスタンダードであるONNXを提供しています。
オープンソースのAIオーケストレーションフレームワークです。LLMアプリケーションの構築に必要なパイプラインやエージェントワークフローの設計ができるようになっています。
このリポジトリでは、中文LLaMA & Alpaca LLMsを提供しています。
ドキュメントを構造化するために使えるオープンソースのETLソリューション。
オープンソースのGPT/LLMエージェント作成ツールです。
LLMを利用するために、セマンティック検索やLLMのオーケストレーションなどを行えるフレームワーク。
AutoMegaKernel(AMK)は、Hugging Face Llama-family モデルを単一のパフォーマンスを最適化した CUDA Kernalで動作する単一のPersistent Cooperative
自然言語から機械設計や技術図案などの正確な構成を作成することができるシステムを開発しました。このシステムは、Geometric Constraintsを満たす正確な構成を作成するために、Constraint DSL (D
Agentic reinforcement learning (RL) has become an important post-training paradigm for turning LLMs from stati
オンポリシーディストリレーションは、近年、重要なポストトレーニングの研究分野となりました。強い教師モデルを使用して学習トレッジを密に細かく指示することで、トピック認識を実現します。しかしなだな的にトークンレベルにおいてデ
分析研究は、LLM推論速度を速めるため、トークン、レイヤー、ヘッド、次元、注意パターンの削減技術である削減技術を適用し、広範なパラダイムとして成長しています。削減方法の実装によって、実現された加速の度合いは、ハードウェア
Clinical early warning systems built on electronic health records, in which clinical observations are recorded
Existing sparse attention and KV cache compression methods for long-context LLM inference typically apply fixe
Ensuring the reliability of Large Language Models (LLMs) under distribution drift requires inference-time adap
Court simulation bridges legal education and judicial practice, yet human-based simulations are costly and dif
この研究では、低リソース言語や絶滅言語の辞書のデジタル化が重要であるが、マルチモーダル辞書をデジタル化する方法は今まで難しかったが、この研究では、最近のビジョン言語モデルを用いて辞書のデジタル化が容易になり、辞書内の文字
Large language model agents increasingly rely on skills: reusable procedural documents encoding workflows, too
As large language models (LLMs) are increasingly applied to real-world legal tasks, evaluating the reliability
Large language models (LLMs) sometimes exhibit language confusion when generating non-English text. Existing a
Multi-modal Large Language Models (MLLMs) have achieved remarkable progress in video temporal grounding with r
このリポジトリには、LLM、RAG、およびオーソリティの認識を含む、AIエンジニアリングのための深いドキュメントがあります。
データをAIに変換する基盤を構築することで、ビジネス上の問題を解決できます。この研究では、Model eXecution + Context ProtocolであるMXCPを提案し、データの変換を簡素化した上で、AIアプ
Ludwigは、LLM (Large Language Model) のカスタム化と構築のための低コストフレームワークです。このフレームワークは、ユーザーがカスタム LLM を構築し、トレーニングするのを容易にします。
PyTorchベースのリージョニングLMMを作成するためのチュートリアルです。
OpenAIに互換性があり、Cloud APIとして利用できるLLM。
LLMのマージに関してのマニュアルです。理論、方法、応用などについての概要が記載されています。
LLMやVLMのFine-Tuningを簡素化したライブラリ。
Simulation plays a key role in automated robotics research supported by large language models (LLMs). However,
Mathematical reasoning has long served as a stringent test of machine intelligence; over the past decade, it h
Recently, large time series models (LTSMs) have gained increasing attention due to their similarities to large
Expert writing feedback from experienced researchers is critical for early-career scholars to improve their ma
Symbolic music evaluation for large language models remains fragmented across representations, datasets, and m
We present a multilingual fact-checking system deployed at Factiverse, designed for high-throughput and low-la
Chain-of-thought (CoT) reasoning has proven effective for enhancing problem-solving in large language models.
Palmprint modality offers a privacy-preserving biometric solution, yet its deployment is hindered by the domai
On-policy distillation (OPD) has become a central post-training tool for large language models (LLMs), providi
分析システムの性能を向上するための学習モデル開発を行う。
LLM agents increasingly rely on external inference conditions: prompts, tools, memory, SOPs, skills, and harne
Multimodal Large Language Models (MLLMs) have demonstrated remarkable success in visual understanding, yet the
Current open-weight large language models (LLMs) are prone to malicious finetuning attacks, which could compro
Human evaluation plays a critical role in assessing the quality of generated text. However, the reliability an
Recent agent frameworks such as Claude Code, Codex, and OpenClaw are strong at tool use and orchestration, but
Existing scientific relation extraction benchmarks mainly target domains such as computer science, where entit
大規模言語モデルのテスト時間調整に関する調査のリポジトリ。
AIエージェントの開発と実装を行うためのエンドツーマンド、コードファーストのチュートリアル。
Dagsterは、データアセットの開発、生産、観察を支援するオーケストレーションプラットフォームです。
医学画像に対する疾患検出モデルを開発し、臨床現場で早期検出と迅速な介入を容易にすることを目的としたフレームワークを提案します。
Adapting large language models (LLMs) to clinical workflows often requires costly fine-tuning or manual prompt
Are tool-calling LLM agents equally safe throughout a conversation? We discover they are not: agents are most
We present SigmaScale, a method for learning auxiliary scaling matrices S to aid truncated Singular Value Deco
Large language models exhibit impressive zero-shot capabilities across a wide range of downstream tasks. Howev
We introduce MMAE, a Massive Multitask Audio Editing benchmark, serving as the first comprehensive evaluation
Video understanding is being rapidly transformed by multimodal large language models (MLLMs), as research move
LLM-driven software engineering agents have become a central testbed for real-world language-model capability,
Retrieval for search agents is still inherited from non-agentic information retrieval: a retriever ranks the c
Despite advances in 3D scene understanding, existing 3D Large Multimodal Models operate in offline settings, r
Developers increasingly use AI tools such as ChatGPT, Copilot, and Claude in everyday software workflows, but
Hard-negative source selection for dense retrieval is usually decided only after fine-tuning and downstream ev
LLMを評価するプラットフォームであり、さまざまなモデルとデータセットをサポートする。
NestJSベースのAIチャットボット開発ツールです。
この研究では、人間-ロボット 協力のためのDistributed Conversational Frameworkを提案します。
Agent systems increasingly use textual skills to encode reusable task procedures, but injecting these skills i
Retrieval-augmented QA pipelines often route retrieved passages through an LLM rewriter before a smaller reade
Evaluating LLM mediators remains challenging, as mediation unfolds as a real-time trajectory shaped by disputa
Self-evolving agents requires adaptation after deployment, but existing approaches assume a usable learning lo
Existing benchmarks evaluate Tool-Integrated Reasoning (TIR) in LLMs on idealized ''happy paths'', largely ove
We introduce UnpredictaBench, an evaluation that tests the ability of large language models (LLMs) to capture
While Vision-Language Models (VLMs) have shown strong visual reasoning capabilities, their spatial reasoning a
Causal graphs provide a high-level language for making mechanisms transparent. Recent work uses Large Language
In real-world applications, models are expected to perform reliably across diverse settings. Yet, many existin
Planning for real-world problems by language models often involves both world and user constraints, which may
Developing unified video generation and editing models capable of interpreting interleaved multimodal inputs i
Prior work has shown that large language models (LLMs) can translate unseen or low-resource languages by under
Large language model (LLM) agents are increasingly applied to long-horizon tasks such as scientific discovery
Large language models can reproduce training data, but existing memorization evaluations mostly measure whethe
Temporal Grounding (TG) aims to localize video segments corresponding to a textual query. Prior research predo
Large language models often improve reasoning by generating explicit chain-of-thought (CoT), demonstrating the
Video event prediction (VEP) requires models to infer unobserved future states from partial video evidence. Ex
Multimodal Large Language Models (MLLMs) excel at 2D semantic understanding but lack intrinsic 3D awareness, r
Large language models are increasingly used to simulate social media users and infer how individuals may respo
Benchmarks are fundamental for evaluating and advancing LLMs and MLLMs by providing standardized and explicit
A situated query like "where is Lin Wei?" often encodes more than its literal content: the user may also want
AI research often requires decisions before future evidence exists: which bottleneck to attack, which directio
Large Language Models (LLMs)を高速化するためには、Transformerの構造を改善する必要があります。この研究では、早期・中期のTransformer層を繰り返し使用することで、Langua
LLMがプログラムを変換する際の動態学を調査し、変換は収束し、制限された吸引領域に収束することが多いことを示す。
Large language models are increasingly evaluated by other models, raising a natural question: can a model pred
Experience internalization converts contextual experience from past interactions into reusable parametric capa
Rubric-based reinforcement learning (RL) uses an LLM-as-a-Judge (LaaJ) to score model outputs according to rub
Multi-agent reasoning systems adopt a "generate-then-transfer" paradigm that forces end-to-end latency to scal
Scientific and engineering progress is fundamentally a long-horizon iterative process: proposing changes, runn
Deontic reasoning is the task of answering questions by applying explicit rules and policies to case-specific
Training Data Attribution (TDA) seeks to trace a model's predictions back to its training data. The gold stand
Large language models (LLMs) are increasingly proposed as clinical agents, yet static, single-turn benchmarks
Instruction-guided speech editing requires a model to modify specified speech attributes while preserving unre
LLMs can appear cautious in risk decision-making tasks, yet cautious-looking outputs do not necessarily indica
この論文では、RAG、AIパイプライン、企業検索を含むクラウド テンプレートを提供するアプリケーション「llm-app」を紹介します。 llm-app は Docker で動作し、Sharepoint、Google Dr
このリストは、金融市場で使用できる強化言語モデル(LLM)と深層学習の戦略やツールに関するawesomeリストです。
モデルをサービングするためのライブラリを紹介している。
Reward models (RMs) provide critical feedback signals for LLM post-training, notably in reinforced fine-tuning
Equipping Large Language Models (LLMs) to execute reliable multi-step workflows has become a central challenge
While household robots are often evaluated based on task completion, everyday domestic environments involve va
Inference-time scaling has emerged as a critical avenue for enhancing Large Language Models' performance, yet
Recent progress in Large Language Model (LLM) agents has enabled promising advances in automated data science.
Multimodal agents in robotics, AR, and autonomous driving must reason about places and layouts from continuous
Memory is an indispensable capability for long-horizon LLM agents, enabling them to preserve and utilize infor
Wide-baseline matching (WBM) requires integrating geometric understanding, viewpoint changes, fine-grained per
Reinforcement learning (RL) has become a dominant post-training paradigm, enabling large language models (LLMs
Existing benchmarks for MLLM-generated web artifacts assess interaction through local evidence and miss the re
Structured financial audit verification is difficult for language-model agents because correctness depends on
Computer-use agents extend language models from text generation to sustained interaction with files, terminals
Large language model (LLM) agents are evolving from request-response assistants into long-running software act
Graph Language Models (GLMs) have become a promising direction for adapting Large Language Models (LLMs) to gr
Large language models improve final-answer accuracy through extended chain-of-thought reasoning, but often spe
この研究では、COVID-19臨床パスウェイズの予測監視を支援するために、パイプラインを構築しました。このパイプラインには、データリフティング、時間的再構成、イベントログの構築、プリフィックスベースの表現、予測モデルの整
LLM agents are increasingly expected to operate across heterogeneous task regimes that require distinct execut
Large language models (LLMs) have recently been adopted as synthetic agents for public opinion simulation, off
Financial AI agents often fail for a simple reason: they make users carry the complexity. A user must repeated
Video is temporally redundant: adjacent frames usually share most objects, background, and layout. Yet existin
Agentic LLMs with web search change the threat model for text anonymization: weak contextual cues can become c
Deep-research agents solve tasks through long trajectories of search, tool use, evidence inspection, and answe
このライブラリは、空間情報を扱うためのコンピュータビジョンライブラリです。
Summarize group chat with AI, LLM && query group chat, FREE to deploy your own, support img, link meta info, r
このリポジトリでは、Lecture Learning Modelsに対してReinforcement Learningを実行するライブラリを提供しています。
Large language models are increasingly deployed as coding agents, shifting safety from individual responses to
The rapid progress of frontier large language models has led to widespread benchmark saturation, limiting the
この論文では、Large Language Model (LLM) の「データミックス診断」手法を提案し、LLM の診断に役立つ新しい手法であることを示しました。この手法により、LLM のデータミックスを分析し、問題を特
home-llmは、ローカルLIMを使ってスマートホームの制御を可能にするHome Assistantの統合モデルです。
さまざまなLLMのゲートウェイとして使えるライブラリ。
このリポジトリでは、高スループットと低メモリ消費のLLMインフェレンザエンジンであるVLLMを提供しています。
Open-dLLMはOpen diffusion language modelを公開しており、コード生成の前トレーニング、評価、推論、チェックポイントを公開しています。
Safety alignment in LLMs does not improve monotonically across model generations. Studying four generations of
Current approaches to LLM adversarial testing suffer from coverage gaps: manual red-teaming does not scale, LL
Reinforcement learning with verifiable rewards has rapidly advanced reasoning in vision--language models. Howe
AI glasses present a compelling platform for AI agents to serve as personalized memory assistants. To be genui
We examine whether human psychometric questionnaires can serve as reliable tools for characterizing and predic
Prompt-injection detectors are heterogeneous: each is strong on a different slice of attacks, and none is alwa
Multimodal Large Language Models (MLLMs) have demonstrated significant achievements in general visual question
Reinforcement Learning with Verifiable Rewards (RLVR) has recently emerged as the cornerstone for shaping the
このリポジトリはChatGPT、GPT-3、FlanT5などのLLMsの在り方や、in-context learningとprompt engineeringのリソースをまとめたものです。
この論文では、Reinforcement Learning with Human Feedback (RLHF) を元にしたPaLMアーキテクチャの実装を提示します。基本的にChatGPTのようなLLMですが、PaLMと
LoMoは、画像とテキストの両方から情報を取り入れるモデルを作成するために、画像変換後のテキストをモデル内で使用できるようにすることで、ビジョンや言語の間の境界を越える能力を強化します。
ポーカーはIAの代表的な問題です。しかし、強いエキスパートレベルを達成するために、長時間にわたるトレーニングと解釈が必要とされてきました。LLMを使用すると、トレーニングやソルバーが不要となり、ポーカーをプレイすることが
AI coding agents are increasingly used for scientific work, but their end-to-end autonomous research capabilit
Automatic speech recognition (ASR) is a core component of human--computer interaction and an increasingly impo
Memory-augmented LLM agents tackle complex long-horizon tasks by recursively summarizing interaction trajector
Music recommendation systems typically treat songs as opaque tokens, relying on collaborative interaction hist
Weight-space model merging is usually formulated as an algebraic operation on checkpoints, yet at LLM scale th
DEFault++は、Transformerアーキテクチャでの内部コンポーネントの不正常な動作を認識するために、3つのレベルでハイエラルキーの学習ベースの診断手法を実装しました。
MemVidは、サーバーレスで単一ファイルの記憶層を提案し、AIエージェントが即時検索と長期的な記憶を持つようにする記憶層です。
We present DEI: Diversity in Evolutionary Inference, a distributed Quality-Diversity (QD) search framework tha
LLM agents are rapidly evolving from coding assistants into autonomous software engineering systems. However,
エージェントRRLに関連するアワーショットリスト。
Customizing an LLM judge to a specific task or domain often involves optimizing its prompt across multiple eva
微舆は人人可用的多Agent舆情分析助手であり、情報茧房を打破して舆情の原貌を還元し、未来の走向を予測し、決策を助けることができます。
このリポジトリは、大模型の算法原理图を100本以上収録しています。これは、"大模型算法"著者の巨献です。
PaddleNLPは、分類モデルと言語モデルを簡単に使用できる強力なライブラリであり、モデルズーという素晴らしいモデル・ザーのコレクションを備えています。
自動変換により、モデルはテスト時に計算量を最適化し、難しいステップでより多く計算すると同時に、簡単なステップでより少ない計算を実行します。
An awesome & curated list of best LLMOps tools for developers
LLMを使用して、自然言語処理における情報抽出を行うためのPythonライブラリです。
LLM(大規模言語モデル)を利用してテキストパラメータを最適化するシステムを提案しました。このシステムは、単一のシステムでさまざまなタスク(単一タスク、複数タスク、未知の入力など)を実行可能でした。また、システムは、最適
LLMモデリングのチュートリアルです。インフェレンスタイム、フィネチュニング、RAGなど、さまざまな機能とサービスの使用方法が解説されています。
A comprehensive toolkit that provides building blocks for LLM-based named entity recognition, attribute extrac
(この項は、MiniOneRec — Minimal reproduction of OneRecのリポジトリで説明しているため、このリポジトリは削除しました)
LLM-guided evolutionary methods such as AlphaEvolve have proven effective in domains like math, systems resear
We present ARES-LSHADE, a memetic differential-evolution variant submitted to the GECCO 2026 competition on LL
インスタテストタスクの推論を高速化するために、スケーリングを適用して、推論時間を短縮することができる。
CoupleEvoは、大規模言語モデルを活用したカップルの最適化問題の自動ヒューリスティクーデザインアプローチを提案します。3つの進化的調整戦略が提示されます。
Speech-based large language models are typically constrained to spoken replies, which limits their user-facing