# Duck Stain YOLO

MVP aplikacji okienkowej do podgladu kamery USB, wykrywania etykiety modelem YOLOv8 i zapisu zdjec/filmow z metadanymi JSON.

## Uruchomienie

```bash
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python main.py
```

Na macOS z Tesseractem:

```bash
brew install tesseract
```

Na Ubuntu/WSL:

```bash
sudo apt install tesseract-ocr
```

Na Linuksie `requirements.txt` wymusza CPU build PyTorch, zeby nie pobierac wariantu CUDA. Na macOS pip zainstaluje standardowy wariant CPU dla procesora Intel.

Umiesc wytrenowany model jako `models/best.pt` albo zmien `detection.model_path` w `app_config.json`.

## Konfiguracja

Glowny plik konfiguracji: `app_config.json`.

Istotne ustawienia:

- `camera.width`, `camera.height`, `camera.fps` - rozdzielczosc i FPS kamery.
- `camera.rotation_degrees` - obrot obrazu z kamery: `0`, `90`, `180` albo `270`.
- `camera.properties` - parametry OpenCV ustawiane na kamerze, np. jasnosc, kontrast, ekspozycja. `null` oznacza brak wymuszania wartosci.
- `detection.mode` - `best` rysuje najlepsza etykiete, `all` rysuje wszystkie wykrycia.
- `detection.frame_stride` - YOLO uruchamiany co N klatek podczas aktywnego wykrywania.
- `label_data.models`, `label_data.colors` - slowniki do walidacji tekstu z etykiety.
- `ocr.enabled`, `ocr.engine` - wlaczenie OCR i wybor silnika: `none`, `tesseract`, `paddle`.

Zdjecia trafiaja do `captures/photos`, filmy do `captures/videos`. Obok kazdego pliku media zapisywany jest JSON z aktualnym wynikiem detekcji/OCR.

## Testowanie OCR poza aplikacja

OCR mozna testowac na gotowych cropach bez uruchamiania kamery i YOLO:

```bash
.venv-lin/bin/python -m app.ocr.cli crop --engine none
.venv-lin/bin/python -m app.ocr.cli crop --engine tesseract
.venv-lin/bin/python -m app.ocr.cli crop --engine paddle --json
```

Backend PaddleOCR jest opcjonalny. Zaleznosci do testow PaddleOCR sa w osobnym pliku:

```bash
.venv-lin/bin/pip install -r requirements-ocr-paddle.txt
```