Cache et bases de données¶

Stream Fusion repose sur 4 couches de données spécialisées, chacune avec un rôle et des caractéristiques distincts.

Vue d'ensemble¶

graph TB
    subgraph Privé["Cache Privé"]
        PG[("PostgreSQL<br/>Résultats d'indexeurs<br/>~5ms")]
    end

    subgraph Public["Cache Public"]
        MEILI[("Meilisearch<br/>Torrents publics<br/>~10ms")]
    end

    subgraph Hot["Cache Hot"]
        REDIS[("Redis<br/>Résultats récents<br/>~1ms")]
    end

    subgraph Matching["Matching"]
        DUCK[("DuckDB<br/>IMDB + TMDB<br/>Matching local")]
    end

    Query["Requête Stremio"] --> REDIS
    REDIS -->|"Miss"| PG
    PG -->|"Insuffisant"| MEILI
    MEILI -->|"Besoin d'indexeurs"| INDEX["Indexeurs privés"]
    INDEX --> PG
    DUCK -.->|"IMDB ID + TMDB ID"| PG
    DUCK -.->|"IMDB ID + TMDB ID"| MEILI

    style Privé fill:#311b92,color:#fff
    style Public fill:#1b5e20,color:#fff
    style Hot fill:#bf360c,color:#fff
    style Matching fill:#4a148c,color:#fff

Les 4 couches¶

L1 — Redis (hot cache)

Latence ~1ms, TTL 7 jours

Résultats de recherche récents, streams, métadonnées TMDB

Se remplit automatiquement au fil des requêtes
L2 — PostgreSQL (cache privé)

Latence ~5ms, persistant

Torrents issus des indexeurs privés (C411, Torr9, LaCale…)

Se remplit au fil des requêtes utilisateur
L3 — Meilisearch (cache public)

Latence ~10ms, full-text

Torrents publics (DMM, Zilean, U2P, peers)

Se remplit via les syncs (DMM, U2P) et le peering
L4 — DuckDB (matching IMDB)

Base locale analytique

Datasets IMDB + mapping TMDB

4 passes de matching (exact → flou)

Redis — Cache hot¶

Clé	Contenu	TTL
`search:{hash}`	Résultats de recherche	7 jours
`stream:{hash}`	Résultats stream	10-20 min
`media:{hash}`	Métadonnées TMDB	7 jours
`stream_link:{hash}`	Liens debrid	6 heures
`download:{hash}`	Flags download	10 min
`ready:{hash}`	Flags stream prêt	6 heures

Stratégie cache-first : si une entrée existe, elle est retournée immédiatement. Si l'entrée est présente mais ancienne, un refresh asynchrone est lancé pendant que l'utilisateur reçoit les résultats en cache.

PostgreSQL — Cache privé¶

Caractéristique	Détail
Type	Persistant, structuré
Rôle	Torrents issus des indexeurs privés
Remplissage	Automatique, au fil des requêtes
Contenu	Hash, titre, taille, langues, seeders, IMDB, TMDB

Cache privé = résultats de requêtes

PostgreSQL ne contient que les torrents effectivement cherchés par les utilisateurs. Plus l'instance est utilisée, plus le cache se remplit.

Meilisearch — Cache public¶

Caractéristique	Détail
Type	Full-text, latence ~10ms
Rôle	Torrents publics, recherche rapide
Remplissage	Syncs DMM, U2P, Zilean + peering
Contenu	Hash, titre parsé, résolution, codec, langues, IMDB, TMDB

Source	`hash_source`	Méthode
DMM Hashlists	`DMM - Hashlist` / `DMM - hashlist`	Clone GitHub quotidien
Zilean	`Zilean`	API REST
U2P / Utopeer	`U2P - Nostr`	WebSocket Nostr
Peers distants	`Peer - {nom}`	API HMAC+Fernet

Peuplement intentionnel

Contrairement à PostgreSQL, Meilisearch doit être peuplé intentionnellement via les syncs. Voir le tutoriel de population initiale.

DuckDB — Matching IMDB¶

DuckDB est une base analytique locale construite automatiquement. Elle agrège les datasets publics IMDB et un mapping IMDB→TMDB.

Dataset	Source	Table	Filtre
Title Basics	`datasets.imdbws.com`	`imdb_basics`	`movie`, `tvSeries`, `tvMiniSeries`, `tvMovie` ; exclut `isAdult=1`
Title AKAs	`datasets.imdbws.com`	`imdb_akas`	Régions `FR`, `BE`, `CH`, `CA`, `LU` ou langue `fr`
Title Ratings	`datasets.imdbws.com`	`imdb_ratings`	Aucun filtre
IMDB→TMDB	GitHub Gist	`imdb_tmdb`	IDs sans préfixe `tt` corrigés

Construction automatique

La base DuckDB est construite au premier démarrage ou sur cron. Voir les détails techniques.

Sections détaillées¶

Matching IMDB

Schéma des tables DuckDB, 4 passes de matching, normalisation des titres, enrichissement TMDB
Population initiale

Tutoriel pas-à-pas pour peupler les caches sur une nouvelle instance (DMM, U2P, RTN, IMDB)
Pipeline de recherche

Flux complet d'une requête Stremio à travers les 4 couches