hace 1 mes · 0940c378fb
--- a/src/translator/__init__.py
+++ b/src/translator/__init__.py
@@ -18,6 +18,7 @@ from .term_injector import (
 
				     TermUsageRecord,
			
 
				 )
			
 
				 from .resume_tracker import ResumeTracker, ResumeState
			
 
				+from .fallback_handler import FallbackHandler, FallbackEvent, FallbackReason
			
 
				 
			
 
				 __all__ = [
			
 
				     "TranslationEngine",
			
@@ -33,4 +34,7 @@ __all__ = [
 
				     "TermUsageRecord",
			
 
				     "ResumeTracker",
			
 
				     "ResumeState",
			
 
				+    "FallbackHandler",
			
 
				+    "FallbackEvent",
			
 
				+    "FallbackReason",
			
 
				 ]
			
--- a/src/translator/fallback_handler.py
+++ b/src/translator/fallback_handler.py
@@ -0,0 +1,290 @@
 
				+"""
			
 
				+GPU batch failure fallback handler.
			
 
				+
			
 
				+This module provides automatic fallback to batch_size=1 when
			
 
				+GPU batch translation fails (e.g., due to OOM errors).
			
 
				+"""
			
 
				+
			
 
				+import logging
			
 
				+from dataclasses import dataclass, field
			
 
				+from datetime import datetime
			
 
				+from typing import List, Optional, Callable, Any
			
 
				+from enum import Enum
			
 
				+
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+
			
 
				+class FallbackReason(str, Enum):
			
 
				+    """Reason for fallback to batch_size=1."""
			
 
				+
			
 
				+    OUT_OF_MEMORY = "out_of_memory"
			
 
				+    CUDA_ERROR = "cuda_error"
			
 
				+    RUNTIME_ERROR = "runtime_error"
			
 
				+    UNKNOWN_ERROR = "unknown_error"
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class FallbackEvent:
			
 
				+    """
			
 
				+    Record of a fallback event.
			
 
				+
			
 
				+    Attributes:
			
 
				+        timestamp: When the fallback occurred
			
 
				+        original_batch_size: The batch size that failed
			
 
				+        reason: The reason for the fallback
			
 
				+        error_message: The error message that triggered fallback
			
 
				+        recovered: Whether the fallback was successful
			
 
				+    """
			
 
				+
			
 
				+    timestamp: datetime = field(default_factory=datetime.now)
			
 
				+    original_batch_size: int = 0
			
 
				+    reason: FallbackReason = FallbackReason.UNKNOWN_ERROR
			
 
				+    error_message: str = ""
			
 
				+    recovered: bool = False
			
 
				+
			
 
				+    def to_dict(self) -> dict:
			
 
				+        """Convert to dictionary for serialization."""
			
 
				+        return {
			
 
				+            "timestamp": self.timestamp.isoformat(),
			
 
				+            "original_batch_size": self.original_batch_size,
			
 
				+            "reason": self.reason.value,
			
 
				+            "error_message": self.error_message,
			
 
				+            "recovered": self.recovered,
			
 
				+        }
			
 
				+
			
 
				+
			
 
				+class FallbackHandler:
			
 
				+    """
			
 
				+    Handler for GPU batch translation fallback.
			
 
				+
			
 
				+    This class wraps translation operations and automatically
			
 
				+    falls back to batch_size=1 when batch translation fails.
			
 
				+    """
			
 
				+
			
 
				+    # Default batch size for batch translation
			
 
				+    DEFAULT_BATCH_SIZE = 4
			
 
				+
			
 
				+    # Error strings that indicate GPU memory issues
			
 
				+    OOM_ERROR_PATTERNS = [
			
 
				+        "out of memory",
			
 
				+        "CUDA out of memory",
			
 
				+        "CUDA error",
			
 
				+        "RuntimeError: CUDA",
			
 
				+    ]
			
 
				+
			
 
				+    def __init__(
			
 
				+        self,
			
 
				+        engine: Any,
			
 
				+        fallback_callback: Optional[Callable[[FallbackEvent], None]] = None
			
 
				+    ):
			
 
				+        """
			
 
				+        Initialize the fallback handler.
			
 
				+
			
 
				+        Args:
			
 
				+            engine: The translation engine to wrap
			
 
				+            fallback_callback: Optional callback for fallback events
			
 
				+        """
			
 
				+        self.engine = engine
			
 
				+        self.fallback_callback = fallback_callback
			
 
				+        self.fallback_events: List[FallbackEvent] = []
			
 
				+        self._has_fallback_occurred = False
			
 
				+
			
 
				+    def translate(
			
 
				+        self,
			
 
				+        text: str,
			
 
				+        src_lang: str = "zh",
			
 
				+        tgt_lang: str = "en",
			
 
				+        max_length: Optional[int] = None
			
 
				+    ) -> str:
			
 
				+        """
			
 
				+        Translate a single text (no fallback needed).
			
 
				+
			
 
				+        Args:
			
 
				+            text: The text to translate
			
 
				+            src_lang: Source language code
			
 
				+            tgt_lang: Target language code
			
 
				+            max_length: Maximum generation length
			
 
				+
			
 
				+        Returns:
			
 
				+            The translated text
			
 
				+        """
			
 
				+        return self.engine.translate(text, src_lang, tgt_lang, max_length)
			
 
				+
			
 
				+    def translate_batch(
			
 
				+        self,
			
 
				+        texts: List[str],
			
 
				+        src_lang: str = "zh",
			
 
				+        tgt_lang: str = "en",
			
 
				+        batch_size: int = None,
			
 
				+        max_length: Optional[int] = None
			
 
				+    ) -> List[str]:
			
 
				+        """
			
 
				+        Translate multiple texts with automatic fallback.
			
 
				+
			
 
				+        Args:
			
 
				+            texts: List of texts to translate
			
 
				+            src_lang: Source language code
			
 
				+            tgt_lang: Target language code
			
 
				+            batch_size: Number of texts to process at once (default: DEFAULT_BATCH_SIZE)
			
 
				+            max_length: Maximum generation length per text
			
 
				+
			
 
				+        Returns:
			
 
				+            List of translated texts in the same order as input
			
 
				+        """
			
 
				+        if batch_size is None:
			
 
				+            batch_size = self.DEFAULT_BATCH_SIZE
			
 
				+
			
 
				+        # If batch_size is already 1 or we're on CPU, no fallback needed
			
 
				+        if batch_size == 1 or not self.engine.is_gpu_enabled:
			
 
				+            return self.engine.translate_batch(texts, src_lang, tgt_lang, batch_size, max_length)
			
 
				+
			
 
				+        # Try batch translation with fallback
			
 
				+        try:
			
 
				+            return self.engine.translate_batch(texts, src_lang, tgt_lang, batch_size, max_length)
			
 
				+        except Exception as e:
			
 
				+            # Check if this is a GPU-related error
			
 
				+            error_str = str(e).lower()
			
 
				+            is_gpu_error = any(pattern.lower() in error_str for pattern in self.OOM_ERROR_PATTERNS)
			
 
				+
			
 
				+            if is_gpu_error:
			
 
				+                # Determine the reason
			
 
				+                if "out of memory" in error_str:
			
 
				+                    reason = FallbackReason.OUT_OF_MEMORY
			
 
				+                elif "cuda error" in error_str:
			
 
				+                    reason = FallbackReason.CUDA_ERROR
			
 
				+                else:
			
 
				+                    reason = FallbackReason.RUNTIME_ERROR
			
 
				+
			
 
				+                # Record the fallback event
			
 
				+                event = FallbackEvent(
			
 
				+                    original_batch_size=batch_size,
			
 
				+                    reason=reason,
			
 
				+                    error_message=str(e),
			
 
				+                )
			
 
				+
			
 
				+                self.fallback_events.append(event)
			
 
				+                self._has_fallback_occurred = True
			
 
				+
			
 
				+                # Log the fallback
			
 
				+                logger.warning(
			
 
				+                    f"Batch translation failed with batch_size={batch_size}: {e}. "
			
 
				+                    f"Falling back to batch_size=1"
			
 
				+                )
			
 
				+
			
 
				+                # Notify callback if provided
			
 
				+                if self.fallback_callback:
			
 
				+                    self.fallback_callback(event)
			
 
				+
			
 
				+                # Retry with batch_size=1
			
 
				+                try:
			
 
				+                    results = self.engine.translate_batch(texts, src_lang, tgt_lang, 1, max_length)
			
 
				+                    event.recovered = True
			
 
				+                    logger.info("Successfully recovered with batch_size=1")
			
 
				+                    return results
			
 
				+                except Exception as e2:
			
 
				+                    event.recovered = False
			
 
				+                    logger.error(f"Fallback to batch_size=1 also failed: {e2}")
			
 
				+                    raise
			
 
				+            else:
			
 
				+                # Not a GPU-related error, re-raise
			
 
				+                raise
			
 
				+
			
 
				+    def get_fallback_events(self) -> List[FallbackEvent]:
			
 
				+        """
			
 
				+        Get all fallback events that have occurred.
			
 
				+
			
 
				+        Returns:
			
 
				+            List of FallbackEvent objects
			
 
				+        """
			
 
				+        return list(self.fallback_events)
			
 
				+
			
 
				+    def has_fallback_occurred(self) -> bool:
			
 
				+        """
			
 
				+        Check if any fallback has occurred.
			
 
				+
			
 
				+        Returns:
			
 
				+            True if at least one fallback event has occurred
			
 
				+        """
			
 
				+        return self._has_fallback_occurred
			
 
				+
			
 
				+    def get_fallback_summary(self) -> dict:
			
 
				+        """
			
 
				+        Get a summary of fallback events.
			
 
				+
			
 
				+        Returns:
			
 
				+            Dictionary with fallback statistics
			
 
				+        """
			
 
				+        if not self.fallback_events:
			
 
				+            return {
			
 
				+                "total_fallbacks": 0,
			
 
				+                "successful_recoveries": 0,
			
 
				+                "failed_recoveries": 0,
			
 
				+                "last_event": None,
			
 
				+            }
			
 
				+
			
 
				+        successful = sum(1 for e in self.fallback_events if e.recovered)
			
 
				+
			
 
				+        return {
			
 
				+            "total_fallbacks": len(self.fallback_events),
			
 
				+            "successful_recoveries": successful,
			
 
				+            "failed_recoveries": len(self.fallback_events) - successful,
			
 
				+            "last_event": self.fallback_events[-1].to_dict() if self.fallback_events else None,
			
 
				+        }
			
 
				+
			
 
				+    def clear_fallback_history(self) -> None:
			
 
				+        """Clear the fallback event history."""
			
 
				+        self.fallback_events.clear()
			
 
				+        self._has_fallback_occurred = False
			
 
				+
			
 
				+    def get_user_message(self) -> Optional[str]:
			
 
				+        """
			
 
				+        Get a user-friendly message about fallback.
			
 
				+
			
 
				+        Returns:
			
 
				+            User-friendly message if fallback occurred, None otherwise
			
 
				+        """
			
 
				+        if not self._has_fallback_occurred:
			
 
				+            return None
			
 
				+
			
 
				+        summary = self.get_fallback_summary()
			
 
				+        last_event = summary["last_event"]
			
 
				+
			
 
				+        if last_event and last_event["recovered"]:
			
 
				+            return (
			
 
				+                f"Translation continued with reduced batch size due to GPU memory constraints. "
			
 
				+                f"This may be slower but will ensure completion."
			
 
				+            )
			
 
				+        elif last_event:
			
 
				+            return (
			
 
				+                f"Translation failed due to: {last_event['reason']}. "
			
 
				+                f"Please check your GPU memory or use CPU mode."
			
 
				+            )
			
 
				+
			
 
				+        return "Translation performance was adjusted due to GPU constraints."
			
 
				+
			
 
				+    def is_recommended_batch_size(self, batch_size: int) -> bool:
			
 
				+        """
			
 
				+        Check if a batch size is recommended based on fallback history.
			
 
				+
			
 
				+        Args:
			
 
				+            batch_size: The batch size to check
			
 
				+
			
 
				+        Returns:
			
 
				+            True if the batch size is recommended, False if fallback has occurred
			
 
				+        """
			
 
				+        if not self._has_fallback_occurred:
			
 
				+            return batch_size > 1
			
 
				+
			
 
				+        # If fallback occurred, only recommend batch_size=1
			
 
				+        return batch_size == 1
			
 
				+
			
 
				+    def get_recommended_batch_size(self) -> int:
			
 
				+        """
			
 
				+        Get the recommended batch size based on fallback history.
			
 
				+
			
 
				+        Returns:
			
 
				+            Recommended batch size (1 if fallback occurred, DEFAULT_BATCH_SIZE otherwise)
			
 
				+        """
			
 
				+        if self._has_fallback_occurred:
			
 
				+            return 1
			
 
				+        return self.DEFAULT_BATCH_SIZE
			
--- a/src/translator/pipeline.py
+++ b/src/translator/pipeline.py
@@ -13,6 +13,7 @@ from ..glossary.pipeline import GlossaryPipeline
 
				 from ..glossary.postprocessor import GlossaryPostprocessor
			
 
				 from .engine import TranslationEngine
			
 
				 from .term_injector import TermInjector, TermValidator, TermStatistics, TermValidationResult
			
 
				+from .fallback_handler import FallbackHandler, FallbackEvent
			
 
				 
			
 
				 
			
 
				 @dataclass
			
@@ -64,7 +65,8 @@ class TranslationPipeline:
 
				         glossary: Optional[Glossary] = None,
			
 
				         src_lang: str = "zh",
			
 
				         tgt_lang: str = "en",
			
 
				-        enable_validation: bool = True
			
 
				+        enable_validation: bool = True,
			
 
				+        enable_fallback: bool = True
			
 
				     ):
			
 
				         """
			
 
				         Initialize the translation pipeline.
			
@@ -75,6 +77,7 @@ class TranslationPipeline:
 
				             src_lang: Source language code
			
 
				             tgt_lang: Target language code
			
 
				             enable_validation: Whether to enable term validation
			
 
				+            enable_fallback: Whether to enable GPU batch fallback
			
 
				         """
			
 
				         self.engine = engine
			
 
				         self.glossary = glossary or Glossary()
			
@@ -83,12 +86,19 @@ class TranslationPipeline:
 
				         self.src_lang = src_lang
			
 
				         self.tgt_lang = tgt_lang
			
 
				         self.enable_validation = enable_validation
			
 
				+        self.enable_fallback = enable_fallback
			
 
				 
			
 
				         # Initialize term injection components
			
 
				         self.term_injector = TermInjector(self.glossary, src_lang, tgt_lang)
			
 
				         self.term_validator = TermValidator(self.glossary)
			
 
				         self.statistics = TermStatistics()
			
 
				 
			
 
				+        # Initialize fallback handler
			
 
				+        if enable_fallback:
			
 
				+            self.fallback_handler = FallbackHandler(engine)
			
 
				+        else:
			
 
				+            self.fallback_handler = None
			
 
				+
			
 
				     @property
			
 
				     def has_glossary(self) -> bool:
			
 
				         """Check if a glossary is configured."""
			
@@ -350,3 +360,53 @@ class TranslationPipeline:
 
				             return None
			
 
				 
			
 
				         return self.term_validator.validate_translation(source, target, entries)
			
 
				+
			
 
				+    def has_fallback_occurred(self) -> bool:
			
 
				+        """
			
 
				+        Check if GPU batch fallback has occurred.
			
 
				+
			
 
				+        Returns:
			
 
				+            True if fallback was triggered, False otherwise
			
 
				+        """
			
 
				+        if self.fallback_handler:
			
 
				+            return self.fallback_handler.has_fallback_occurred()
			
 
				+        return False
			
 
				+
			
 
				+    def get_fallback_summary(self) -> Optional[Dict[str, Any]]:
			
 
				+        """
			
 
				+        Get fallback event summary.
			
 
				+
			
 
				+        Returns:
			
 
				+            Dictionary with fallback statistics, or None if fallback not enabled
			
 
				+        """
			
 
				+        if self.fallback_handler:
			
 
				+            return self.fallback_handler.get_fallback_summary()
			
 
				+        return None
			
 
				+
			
 
				+    def get_fallback_message(self) -> Optional[str]:
			
 
				+        """
			
 
				+        Get user-friendly fallback message.
			
 
				+
			
 
				+        Returns:
			
 
				+            User-friendly message if fallback occurred, None otherwise
			
 
				+        """
			
 
				+        if self.fallback_handler:
			
 
				+            return self.fallback_handler.get_user_message()
			
 
				+        return None
			
 
				+
			
 
				+    def get_recommended_batch_size(self) -> int:
			
 
				+        """
			
 
				+        Get recommended batch size based on fallback history.
			
 
				+
			
 
				+        Returns:
			
 
				+            Recommended batch size (4 if no fallback, 1 if fallback occurred)
			
 
				+        """
			
 
				+        if self.fallback_handler:
			
 
				+            return self.fallback_handler.get_recommended_batch_size()
			
 
				+        return 4
			
 
				+
			
 
				+    def clear_fallback_history(self) -> None:
			
 
				+        """Clear the fallback event history."""
			
 
				+        if self.fallback_handler:
			
 
				+            self.fallback_handler.clear_fallback_history()
			
 
				+
			
--- a/tests/translator/test_fallback_handler.py
+++ b/tests/translator/test_fallback_handler.py
@@ -0,0 +1,406 @@
 
				+"""
			
 
				+Unit tests for the GPU fallback handler module.
			
 
				+
			
 
				+Tests cover automatic fallback to batch_size=1 on GPU errors.
			
 
				+"""
			
 
				+
			
 
				+import sys
			
 
				+from unittest.mock import Mock, MagicMock, patch
			
 
				+
			
 
				+# Mock torch and transformers before importing
			
 
				+sys_mock = Mock()
			
 
				+sys.modules["torch"] = sys_mock
			
 
				+sys.modules["transformers"] = sys_mock
			
 
				+
			
 
				+import pytest
			
 
				+
			
 
				+from src.translator.fallback_handler import (
			
 
				+    FallbackHandler,
			
 
				+    FallbackEvent,
			
 
				+    FallbackReason,
			
 
				+)
			
 
				+
			
 
				+
			
 
				+class MockEngine:
			
 
				+    """Mock translation engine for testing."""
			
 
				+
			
 
				+    def __init__(self, fail_on_batch: bool = False, error_msg: str = ""):
			
 
				+        self.fail_on_batch = fail_on_batch
			
 
				+        self.error_msg = error_msg
			
 
				+        self._is_gpu_enabled = True
			
 
				+        self._call_count = 0
			
 
				+
			
 
				+    def translate(self, text: str, src_lang: str = "zh", tgt_lang: str = "en", max_length: int = None) -> str:
			
 
				+        return f"Translated: {text}"
			
 
				+
			
 
				+    def translate_batch(
			
 
				+        self,
			
 
				+        texts: list,
			
 
				+        src_lang: str = "zh",
			
 
				+        tgt_lang: str = "en",
			
 
				+        batch_size: int = 4,
			
 
				+        max_length: int = None
			
 
				+    ) -> list:
			
 
				+        self._call_count += 1
			
 
				+        # Only fail on first call (with larger batch size), succeed with batch_size=1
			
 
				+        if self.fail_on_batch and batch_size > 1:
			
 
				+            raise RuntimeError(self.error_msg or "CUDA out of memory")
			
 
				+        return [f"Translated: {t}" for t in texts]
			
 
				+
			
 
				+    # Use a property with setter for flexibility
			
 
				+    @property
			
 
				+    def is_gpu_enabled(self):
			
 
				+        return self._is_gpu_enabled
			
 
				+
			
 
				+    @is_gpu_enabled.setter
			
 
				+    def is_gpu_enabled(self, value):
			
 
				+        self._is_gpu_enabled = value
			
 
				+
			
 
				+
			
 
				+class TestFallbackEvent:
			
 
				+    """Test cases for FallbackEvent dataclass."""
			
 
				+
			
 
				+    def test_create_fallback_event(self):
			
 
				+        """Test creating a fallback event."""
			
 
				+        event = FallbackEvent(
			
 
				+            original_batch_size=4,
			
 
				+            reason=FallbackReason.OUT_OF_MEMORY,
			
 
				+            error_message="CUDA out of memory",
			
 
				+        )
			
 
				+
			
 
				+        assert event.original_batch_size == 4
			
 
				+        assert event.reason == FallbackReason.OUT_OF_MEMORY
			
 
				+        assert event.error_message == "CUDA out of memory"
			
 
				+
			
 
				+    def test_to_dict(self):
			
 
				+        """Test converting fallback event to dictionary."""
			
 
				+        event = FallbackEvent(
			
 
				+            original_batch_size=4,
			
 
				+            reason=FallbackReason.OUT_OF_MEMORY,
			
 
				+            error_message="CUDA error",
			
 
				+        )
			
 
				+
			
 
				+        data = event.to_dict()
			
 
				+
			
 
				+        assert data["original_batch_size"] == 4
			
 
				+        assert data["reason"] == "out_of_memory"
			
 
				+        assert data["error_message"] == "CUDA error"
			
 
				+        assert "timestamp" in data
			
 
				+        assert data["recovered"] is False  # default
			
 
				+
			
 
				+
			
 
				+class TestFallbackHandler:
			
 
				+    """Test cases for FallbackHandler class."""
			
 
				+
			
 
				+    def test_init(self):
			
 
				+        """Test FallbackHandler initialization."""
			
 
				+        engine = MockEngine()
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        assert handler.engine == engine
			
 
				+        assert handler.fallback_callback is None
			
 
				+        assert not handler.has_fallback_occurred()
			
 
				+
			
 
				+    def test_init_with_callback(self):
			
 
				+        """Test FallbackHandler with callback."""
			
 
				+        engine = MockEngine()
			
 
				+        callback = Mock()
			
 
				+        handler = FallbackHandler(engine, fallback_callback=callback)
			
 
				+
			
 
				+        assert handler.fallback_callback == callback
			
 
				+
			
 
				+    def test_translate_single(self):
			
 
				+        """Test single text translation (no fallback)."""
			
 
				+        engine = MockEngine()
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        result = handler.translate("Hello")
			
 
				+
			
 
				+        assert result == "Translated: Hello"
			
 
				+        assert not handler.has_fallback_occurred()
			
 
				+
			
 
				+    def test_translate_batch_success(self):
			
 
				+        """Test successful batch translation."""
			
 
				+        engine = MockEngine()
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+        results = handler.translate_batch(texts)
			
 
				+
			
 
				+        assert len(results) == 2
			
 
				+        assert results[0] == "Translated: Hello"
			
 
				+        assert results[1] == "Translated: World"
			
 
				+        assert not handler.has_fallback_occurred()
			
 
				+
			
 
				+    def test_translate_batch_oom_fallback(self):
			
 
				+        """Test batch translation with OOM fallback."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+        results = handler.translate_batch(texts, batch_size=4)
			
 
				+
			
 
				+        assert len(results) == 2
			
 
				+        assert handler.has_fallback_occurred()
			
 
				+        events = handler.get_fallback_events()
			
 
				+        assert len(events) == 1
			
 
				+        assert events[0].reason == FallbackReason.OUT_OF_MEMORY
			
 
				+        assert events[0].original_batch_size == 4
			
 
				+        assert events[0].recovered is True
			
 
				+
			
 
				+    def test_translate_batch_cuda_error_fallback(self):
			
 
				+        """Test batch translation with CUDA error fallback."""
			
 
				+        # Create a custom mock that fails on batch_size > 1, succeeds on batch_size=1
			
 
				+        class CustomMockEngine:
			
 
				+            def __init__(self):
			
 
				+                self._gpu = True  # Use different name to avoid property conflict
			
 
				+                self.call_count = 0
			
 
				+
			
 
				+            def translate(self, text, src_lang="zh", tgt_lang="en", max_length=None):
			
 
				+                return f"Translated: {text}"
			
 
				+
			
 
				+            def translate_batch(self, texts, src_lang="zh", tgt_lang="en", batch_size=4, max_length=None):
			
 
				+                self.call_count += 1
			
 
				+                # Only fail when batch_size > 1
			
 
				+                if batch_size > 1:
			
 
				+                    raise RuntimeError("CUDA error: invalid argument")
			
 
				+                return [f"Translated: {t}" for t in texts]
			
 
				+
			
 
				+            @property
			
 
				+            def is_gpu_enabled(self):
			
 
				+                return self._gpu
			
 
				+
			
 
				+        engine = CustomMockEngine()
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+        results = handler.translate_batch(texts, batch_size=4)
			
 
				+
			
 
				+        assert len(results) == 2
			
 
				+        events = handler.get_fallback_events()
			
 
				+        assert events[0].reason == FallbackReason.CUDA_ERROR
			
 
				+
			
 
				+    def test_translate_batch_runtime_error_fallback(self):
			
 
				+        """Test batch translation with runtime error fallback."""
			
 
				+        # Create a custom mock that fails on batch_size > 1, succeeds on batch_size=1
			
 
				+        class CustomMockEngine:
			
 
				+            def __init__(self):
			
 
				+                self._gpu = True  # Use different name to avoid property conflict
			
 
				+                self.call_count = 0
			
 
				+
			
 
				+            def translate(self, text, src_lang="zh", tgt_lang="en", max_length=None):
			
 
				+                return f"Translated: {text}"
			
 
				+
			
 
				+            def translate_batch(self, texts, src_lang="zh", tgt_lang="en", batch_size=4, max_length=None):
			
 
				+                self.call_count += 1
			
 
				+                # Only fail when batch_size > 1
			
 
				+                # Use a message that matches RUNTIME_ERROR pattern
			
 
				+                if batch_size > 1:
			
 
				+                    raise RuntimeError("RuntimeError: CUDA device error")
			
 
				+                return [f"Translated: {t}" for t in texts]
			
 
				+
			
 
				+            @property
			
 
				+            def is_gpu_enabled(self):
			
 
				+                return self._gpu
			
 
				+
			
 
				+        engine = CustomMockEngine()
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+        results = handler.translate_batch(texts, batch_size=4)
			
 
				+
			
 
				+        assert len(results) == 2
			
 
				+        events = handler.get_fallback_events()
			
 
				+        assert events[0].reason == FallbackReason.RUNTIME_ERROR
			
 
				+
			
 
				+    def test_fallback_callback_invoked(self):
			
 
				+        """Test that fallback callback is invoked."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        callback = Mock()
			
 
				+        handler = FallbackHandler(engine, fallback_callback=callback)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+        handler.translate_batch(texts, batch_size=4)
			
 
				+
			
 
				+        assert callback.called
			
 
				+        event_arg = callback.call_args[0][0]
			
 
				+        assert isinstance(event_arg, FallbackEvent)
			
 
				+        assert event_arg.reason == FallbackReason.OUT_OF_MEMORY
			
 
				+
			
 
				+    def test_no_fallback_for_non_gpu_errors(self):
			
 
				+        """Test that non-GPU errors are not caught."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="Some other error")
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+
			
 
				+        with pytest.raises(RuntimeError):
			
 
				+            handler.translate_batch(texts, batch_size=4)
			
 
				+
			
 
				+        assert not handler.has_fallback_occurred()
			
 
				+
			
 
				+    def test_no_fallback_when_cpu_mode(self):
			
 
				+        """Test that fallback doesn't occur on CPU mode."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        engine.is_gpu_enabled = False  # Use property setter
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+
			
 
				+        # Should raise the error, not fall back
			
 
				+        with pytest.raises(RuntimeError):
			
 
				+            handler.translate_batch(texts, batch_size=4)
			
 
				+
			
 
				+    def test_no_fallback_when_batch_size_is_1(self):
			
 
				+        """Test that fallback doesn't occur when batch_size is already 1."""
			
 
				+        # Use a custom engine that always fails
			
 
				+        engine = Mock()
			
 
				+        engine._is_gpu_enabled = True
			
 
				+
			
 
				+        def always_fail(texts, src_lang=None, tgt_lang=None, batch_size=4, max_length=None):
			
 
				+            raise RuntimeError("CUDA out of memory")
			
 
				+
			
 
				+        engine.translate = Mock(return_value="Translated: test")
			
 
				+        engine.translate_batch = always_fail
			
 
				+
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+
			
 
				+        # Should raise the error, not fall back (already at batch_size=1)
			
 
				+        with pytest.raises(RuntimeError):
			
 
				+            handler.translate_batch(texts, batch_size=1)
			
 
				+
			
 
				+        # Verify no fallback occurred
			
 
				+        assert not handler.has_fallback_occurred()
			
 
				+
			
 
				+    def test_fallback_failure_propagates(self):
			
 
				+        """Test that fallback failure is propagated."""
			
 
				+        # Create an engine that fails both in batch and in retry
			
 
				+        engine = Mock()
			
 
				+        engine.is_gpu_enabled = True
			
 
				+
			
 
				+        def fail_batch(*args, **kwargs):
			
 
				+            raise RuntimeError("CUDA out of memory")
			
 
				+
			
 
				+        engine.translate = Mock(return_value="Translated: test")
			
 
				+        engine.translate_batch = fail_batch
			
 
				+
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        texts = ["Hello", "World"]
			
 
				+
			
 
				+        with pytest.raises(RuntimeError):
			
 
				+            handler.translate_batch(texts, batch_size=4)
			
 
				+
			
 
				+        events = handler.get_fallback_events()
			
 
				+        assert events[0].recovered is False
			
 
				+
			
 
				+    def test_get_fallback_summary(self):
			
 
				+        """Test getting fallback summary."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        # No events initially
			
 
				+        summary = handler.get_fallback_summary()
			
 
				+        assert summary["total_fallbacks"] == 0
			
 
				+        assert summary["successful_recoveries"] == 0
			
 
				+
			
 
				+        # Trigger a fallback
			
 
				+        handler.translate_batch(["Hello"], batch_size=4)
			
 
				+
			
 
				+        summary = handler.get_fallback_summary()
			
 
				+        assert summary["total_fallbacks"] == 1
			
 
				+        assert summary["successful_recoveries"] == 1
			
 
				+        assert summary["last_event"] is not None
			
 
				+
			
 
				+    def test_clear_fallback_history(self):
			
 
				+        """Test clearing fallback history."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        # Trigger a fallback
			
 
				+        handler.translate_batch(["Hello"], batch_size=4)
			
 
				+        assert handler.has_fallback_occurred()
			
 
				+
			
 
				+        # Clear history
			
 
				+        handler.clear_fallback_history()
			
 
				+        assert not handler.has_fallback_occurred()
			
 
				+        assert len(handler.get_fallback_events()) == 0
			
 
				+
			
 
				+    def test_get_user_message_with_fallback(self):
			
 
				+        """Test getting user message after fallback."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        # Before fallback
			
 
				+        assert handler.get_user_message() is None
			
 
				+
			
 
				+        # After fallback
			
 
				+        handler.translate_batch(["Hello"], batch_size=4)
			
 
				+        message = handler.get_user_message()
			
 
				+        assert message is not None
			
 
				+        assert "reduced batch size" in message.lower()
			
 
				+
			
 
				+    def test_get_user_message_after_failed_recovery(self):
			
 
				+        """Test getting user message after failed recovery."""
			
 
				+        engine = Mock()
			
 
				+        engine.is_gpu_enabled = True
			
 
				+        engine.translate = Mock(return_value="Translated")
			
 
				+
			
 
				+        def fail_batch(*args, **kwargs):
			
 
				+            raise RuntimeError("CUDA out of memory")
			
 
				+
			
 
				+        engine.translate_batch = fail_batch
			
 
				+
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        try:
			
 
				+            handler.translate_batch(["Hello"], batch_size=4)
			
 
				+        except RuntimeError:
			
 
				+            pass
			
 
				+
			
 
				+        message = handler.get_user_message()
			
 
				+        assert message is not None
			
 
				+        assert "failed" in message.lower()
			
 
				+
			
 
				+    def test_is_recommended_batch_size(self):
			
 
				+        """Test checking recommended batch size."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        # Before fallback, any size > 1 is recommended
			
 
				+        assert handler.is_recommended_batch_size(4)
			
 
				+        assert not handler.is_recommended_batch_size(1)
			
 
				+
			
 
				+        # After fallback, only batch_size=1 is recommended
			
 
				+        handler.translate_batch(["Hello"], batch_size=4)
			
 
				+        assert not handler.is_recommended_batch_size(4)
			
 
				+        assert handler.is_recommended_batch_size(1)
			
 
				+
			
 
				+    def test_get_recommended_batch_size(self):
			
 
				+        """Test getting recommended batch size."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        # Before fallback
			
 
				+        assert handler.get_recommended_batch_size() == 4
			
 
				+
			
 
				+        # After fallback
			
 
				+        handler.translate_batch(["Hello"], batch_size=4)
			
 
				+        assert handler.get_recommended_batch_size() == 1
			
 
				+
			
 
				+    def test_multiple_fallback_events(self):
			
 
				+        """Test tracking multiple fallback events."""
			
 
				+        engine = MockEngine(fail_on_batch=True, error_msg="CUDA out of memory")
			
 
				+        handler = FallbackHandler(engine)
			
 
				+
			
 
				+        # Trigger multiple fallbacks
			
 
				+        for _ in range(3):
			
 
				+            handler.translate_batch(["Hello"], batch_size=4)
			
 
				+
			
 
				+        events = handler.get_fallback_events()
			
 
				+        assert len(events) == 3
			
 
				+
			
 
				+        summary = handler.get_fallback_summary()
			
 
				+        assert summary["total_fallbacks"] == 3