livekit · longcw · Mar 18, 2026 · Mar 16, 2026 · Mar 16, 2026 · Mar 16, 2026
diff --git a/livekit-agents/livekit/agents/llm/__init__.py b/livekit-agents/livekit/agents/llm/__init__.py
@@ -36,6 +36,7 @@
     RealtimeModelError,
     RealtimeSession,
     RealtimeSessionReconnectedEvent,
+    RemoteItemAddedEvent,
 )
 from .tool_context import (
     FunctionTool,
@@ -106,6 +107,7 @@
     "RealtimeSessionReconnectedEvent",
     "RealtimeSessionRestoredEvent",
     "LLMError",
+    "RemoteItemAddedEvent",
 ]
 
 # Cleanup docs of unexported modules

diff --git a/livekit-agents/livekit/agents/llm/chat_context.py b/livekit-agents/livekit/agents/llm/chat_context.py
@@ -672,6 +672,16 @@ def find_insertion_index(self, *, created_at: float) -> int:
 
         return 0
 
+    def _upsert_item(self, item: ChatItem, *, allow_type_mismatch: bool = False) -> None:
+        """Update an item with the same ID if it exists, otherwise append it."""
+        idx = self.index_by_id(item.id)
+        if idx is not None:
+            if not allow_type_mismatch and item.type != self._items[idx].type:
+                raise ValueError(f"Item type mismatch: {item.type} != {self._items[idx].type}")
+            self._items[idx] = item
+        else:
+            self._items.append(item)
+
     async def _summarize(
         self,
         llm_v: LLM,

diff --git a/livekit-agents/livekit/agents/llm/realtime.py b/livekit-agents/livekit/agents/llm/realtime.py
@@ -12,7 +12,7 @@
 from livekit import rtc
 
 from ..types import NOT_GIVEN, NotGivenOr
-from .chat_context import ChatContext, FunctionCall
+from .chat_context import ChatContext, ChatItem, FunctionCall
 from .tool_context import Tool, ToolChoice, ToolContext
 
 
@@ -114,6 +114,7 @@ async def __aexit__(
     "generation_created",
     "session_reconnected",
     "metrics_collected",
+    "remote_item_added",
     "error",
 ]
 
@@ -136,6 +137,12 @@ class RealtimeSessionReconnectedEvent:
     pass
 
 
+@dataclass
+class RemoteItemAddedEvent:
+    previous_item_id: str | None
+    item: ChatItem
+
+
 class RealtimeSession(ABC, rtc.EventEmitter[EventTypes | TEvent], Generic[TEvent]):
     def __init__(self, realtime_model: RealtimeModel) -> None:
         super().__init__()

diff --git a/livekit-agents/livekit/agents/voice/agent_activity.py b/livekit-agents/livekit/agents/voice/agent_activity.py
@@ -564,6 +564,7 @@ async def _list_mcp_tools_task(
                 self._on_input_audio_transcription_completed,
             )
             self._rt_session.on("metrics_collected", self._on_metrics_collected)
+            self._rt_session.on("remote_item_added", self._on_remote_item_added)
             self._rt_session.on("error", self._on_error)
 
             remove_instructions(self._agent._chat_ctx)
@@ -736,6 +737,7 @@ async def _close_session(self) -> None:
                 self._on_input_audio_transcription_completed,
             )
             self._rt_session.off("metrics_collected", self._on_metrics_collected)
+            self._rt_session.off("remote_item_added", self._on_remote_item_added)
             self._rt_session.off("error", self._on_error)
 
         if isinstance(self.stt, stt.STT):
@@ -1161,6 +1163,20 @@ def _on_metrics_collected(
             trace_utils.record_realtime_metrics(realtime_span, ev)
         self._session.emit("metrics_collected", MetricsCollectedEvent(metrics=ev))
 
+    def _on_remote_item_added(self, ev: llm.RemoteItemAddedEvent) -> None:
+        # add the remote item to the local chat context as a placeholder
+        local_chat_ctx = self._agent._chat_ctx
+        if local_chat_ctx.get_by_id(ev.item.id) is not None:
+            return
+
+        # only add placeholders for server-initiated items (responses, function calls),
+        # which always append at the end of the conversation. client-initiated items
+        # (from update_chat_ctx) already exist in _agent._chat_ctx and go local→remote,
+        # so they don't need placeholders.
+        last_item_id = local_chat_ctx.items[-1].id if local_chat_ctx.items else None
+        if ev.previous_item_id is None or ev.previous_item_id == last_item_id:
+            local_chat_ctx.items.append(ev.item.model_copy())
+
     def _on_error(
         self, error: llm.LLMError | stt.STTError | tts.TTSError | llm.RealtimeModelError
     ) -> None:
@@ -1210,7 +1226,7 @@ def _on_input_audio_transcription_completed(self, ev: llm.InputTranscriptionComp
             # TODO: for realtime models, the created_at field is off. it should be set to when the user started speaking.
             # but we don't have that information here.
             msg = llm.ChatMessage(role="user", content=[ev.transcript], id=ev.item_id)
-            self._agent._chat_ctx.items.append(msg)
+            self._agent._chat_ctx._upsert_item(msg)
             self._session._conversation_item_added(msg)
 
     def _on_generation_created(self, ev: llm.GenerationCreatedEvent) -> None:
@@ -2328,7 +2344,7 @@ async def _realtime_reply_task(
             chat_ctx = self._rt_session.chat_ctx.copy()
             msg = chat_ctx.add_message(role="user", content=user_input)
             await self._rt_session.update_chat_ctx(chat_ctx)
-            self._agent._chat_ctx.items.append(msg)
+            self._agent._chat_ctx._upsert_item(msg)
             self._session._conversation_item_added(msg)
 
         ori_tool_choice = self._tool_choice
@@ -2587,7 +2603,7 @@ async def _read_fnc_stream() -> None:
 
         def _tool_execution_started_cb(fnc_call: llm.FunctionCall) -> None:
             speech_handle._item_added([fnc_call])
-            self._agent._chat_ctx.items.append(fnc_call)
+            self._agent._chat_ctx._upsert_item(fnc_call)
             self._session._tool_items_added([fnc_call])
 
         def _tool_execution_completed_cb(out: ToolExecutionOutput) -> None:
@@ -2689,7 +2705,7 @@ def _create_assistant_message(
                 forwarded_text=forwarded_text,
                 interrupted=speech_handle.interrupted,
             )
-            self._agent._chat_ctx.items.append(msg)
+            self._agent._chat_ctx._upsert_item(msg)
             speech_handle._item_added([msg])
             self._session._conversation_item_added(msg)
             current_span.set_attribute(trace_types.ATTR_RESPONSE_TEXT, forwarded_text)
@@ -2741,7 +2757,7 @@ def _create_assistant_message(
                         fnc_executed_ev._reply_required = True
 
                     # add tool output to the chat context
-                    self._agent._chat_ctx.items.append(sanitized_out.fnc_call_out)
+                    self._agent._chat_ctx._upsert_item(sanitized_out.fnc_call_out)
                     self._session._tool_items_added([sanitized_out.fnc_call_out])
 
                 if new_agent_task is not None and sanitized_out.agent_task is not None:

diff --git a/livekit-plugins/livekit-plugins-openai/livekit/plugins/openai/realtime/realtime_model.py b/livekit-plugins/livekit-plugins-openai/livekit/plugins/openai/realtime/realtime_model.py
@@ -1491,8 +1491,11 @@ def _handle_conversion_item_added(self, event: ConversationItemAdded) -> None:
         assert event.item.id is not None, "item.id is None"
 
         try:
-            self._remote_chat_ctx.insert(
-                event.previous_item_id, openai_item_to_livekit_item(event.item)
+            lk_item = openai_item_to_livekit_item(event.item)
+            self._remote_chat_ctx.insert(event.previous_item_id, lk_item)
+            self.emit(
+                "remote_item_added",
+                llm.RemoteItemAddedEvent(previous_item_id=event.previous_item_id, item=lk_item),
             )
         except ValueError as e:
             logger.warning(

diff --git a/...kit-plugins/livekit-plugins-openai/livekit/plugins/openai/realtime/realtime_model_beta.py b/...kit-plugins/livekit-plugins-openai/livekit/plugins/openai/realtime/realtime_model_beta.py
@@ -1304,8 +1304,11 @@ def _handle_conversion_item_created(self, event: ConversationItemCreatedEvent) -
         assert event.item.id is not None, "item.id is None"
 
         try:
-            self._remote_chat_ctx.insert(
-                event.previous_item_id, _openai_item_to_livekit_item(event.item)
+            lk_item = _openai_item_to_livekit_item(event.item)
+            self._remote_chat_ctx.insert(event.previous_item_id, lk_item)
+            self.emit(
+                "remote_item_added",
+                llm.RemoteItemAddedEvent(previous_item_id=event.previous_item_id, item=lk_item),
             )
         except ValueError as e:
             logger.warning(