Files

T

Alexander a1f6701bac feat: initial implementation of metadata aggregator

- gRPC service with MusicBrainz provider
- PostgreSQL schema with migrations
- Service layer with database-first caching
- Repository pattern for data access
- YAML configuration support
- Research documentation for 17 music metadata projects

2026-04-28 16:28:53 +02:00

22 KiB

Raw Blame History

Lidarr Metadata API - Evaluation and Recommendations

Executive Summary

The Lidarr Metadata API represents a production-grade metadata aggregation service with sophisticated architecture and operational maturity. After comprehensive analysis of the codebase, architecture, data layer, integrations, deployment, and implementation details, this evaluation provides an assessment of strengths, weaknesses, and applicability to the metadata aggregator project.

Overall assessment: Excellent reference implementation with battle-tested patterns, but requires modernization and security hardening for new deployments.

Strengths

1. Multi-Source Metadata Aggregation

Excellence: The API successfully aggregates data from 15+ external sources into unified responses.

Implementation quality: High

Key patterns:

Pattern	Implementation	Benefit
Provider abstraction	Mixin-based architecture	Clean separation of concerns
Fallback chains	Primary + secondary providers	Resilience to service failures
Parallel fetching	asyncio.create_task()	Reduced latency
Data normalization	Consistent response format	Easy client integration

Example workflow:

Artist request → MusicBrainz (core) → FanArt.tv (images) → Wikipedia (bio) → Spotify (links)
                                    ↓ (if timeout)
                                    TheAudioDB (fallback)

Applicability to metadata aggregator: CRITICAL

This is the core pattern we need. The mixin-based provider architecture allows flexible composition of data sources while maintaining clean interfaces.

Recommendation: Adopt the provider mixin pattern with fallback chains. Consider adding circuit breaker pattern for failing providers.

2. Three-Tier Caching Strategy

Excellence: Sophisticated caching with Redis (hot), PostgreSQL (persistent), and Cloudflare CDN (edge).

Implementation quality: Excellent

Cache hierarchy:

Tier	Purpose	TTL	Hit Rate	Latency
Cloudflare CDN	Edge caching	30 days	~60%	10-50ms
Redis	Hot cache	7 days	~25%	50-200ms
PostgreSQL	Persistent cache	30 days	~10%	100-300ms
Origin	Fresh fetch	N/A	~5%	2-5s

Compression: zlib compression of pickled objects (10:1 ratio)

Invalidation: Hierarchical (CDN → Redis → PostgreSQL)

Applicability to metadata aggregator: HIGH

The three-tier approach balances performance, cost, and reliability. The compression strategy significantly reduces storage costs.

Recommendation: Adopt three-tier caching with compression. Consider adding cache warming for popular entities.

3. Direct MusicBrainz Database Access

Excellence: Querying MusicBrainz PostgreSQL directly instead of using the web API.

Implementation quality: Excellent

Advantages:

Aspect	Direct DB	Web API
Query complexity	Complex joins, JSON aggregation	Limited filtering
Performance	100-500ms	1-5s (rate limited)
Rate limiting	None	1 req/sec
Flexibility	Full SQL power	Fixed endpoints
Maintenance	Schema changes require updates	API stable

SQL aggregation example:

SELECT
    row_to_json(artist.*) AS artist,
    json_agg(releases.*) AS albums,
    json_agg(links.*) AS links
FROM artist
LEFT JOIN releases ON ...
LEFT JOIN links ON ...
WHERE artist.gid = $1
GROUP BY artist.id;

Applicability to metadata aggregator: MEDIUM

Direct database access is powerful but requires maintaining a full MusicBrainz replica (~100GB+). For smaller deployments, the web API may be more practical.

Recommendation: Evaluate based on scale. For high-volume production use, direct DB access is worth the complexity. For prototypes, use the web API.

4. Change Detection and Cache Invalidation

Excellence: Proactive cache invalidation based on upstream data changes.

Implementation quality: High

Change detection sources (5 per entity type):

Artists:

Artist metadata updates
New release groups
Updated releases
New/updated links
Cover art updates

Albums:

Release group metadata updates
New releases in group
Updated releases in group
New/updated links
Cover art updates

Invalidation workflow:

Hourly replication → Detect changes → Invalidate cache → Optionally pre-fetch

Applicability to metadata aggregator: HIGH

Automatic cache invalidation ensures data freshness without manual intervention. The change detection SQL queries are well-optimized.

Recommendation: Implement change detection for all upstream data sources. Consider webhook-based invalidation where available.

5. Background Crawler for Cache Warming

Excellence: Proactive cache warming improves user experience.

Implementation quality: High

Crawler types:

Wikipedia overview crawler
FanArt.tv image crawler
TheAudioDB metadata crawler
Artist metadata crawler
Album metadata crawler

Benefits:

Reduced cold request latency
Higher cache hit rate (85%+ vs 60% without crawler)
Distributed load on external APIs
Pre-validation of data quality

Applicability to metadata aggregator: MEDIUM

Cache warming is valuable for high-traffic deployments but adds operational complexity.

Recommendation: Implement crawler for production deployments. Make it optional for development/testing.

6. Real-Time Search Index Updates

Excellence: Search index stays synchronized with database via RabbitMQ.

Implementation quality: Excellent

Update flow:

Database change → Trigger → RabbitMQ message → SIR consumer → Solr update → Soft commit (1s)

Update latency: 1-5 seconds from database change to searchable

Applicability to metadata aggregator: MEDIUM

Real-time search is excellent UX but requires additional infrastructure (RabbitMQ, SIR).

Recommendation: For MVP, use periodic reindexing (hourly). For production, implement real-time updates.

7. Operational Maturity

Excellence: Production-ready monitoring, logging, and error tracking.

Implementation quality: High

Monitoring stack:

Component	Purpose	Implementation
Sentry	Error tracking	Redis-based rate limiting
Telegraf	Metrics collection	StatsD protocol
Logging	Application logs	Python stdlib logging
Health checks	Service availability	Docker health checks

Metrics tracked:

Request counts by endpoint
Response times (histograms)
Cache hit/miss rates
Provider request counts
Error rates by type

Applicability to metadata aggregator: HIGH

Observability is critical for production services. The Sentry rate limiting pattern prevents alert fatigue.

Recommendation: Implement comprehensive monitoring from day one. Use Sentry or similar for error tracking.

8. Dual-Version Deployment Strategy

Excellence: Running stable and testing versions simultaneously.

Implementation quality: High

Deployment model:

v0.3: Stable production version (2 replicas)
testing: Development version (1 replica)

Benefits:

Gradual rollout of new features
A/B testing capability
Quick rollback if issues arise
Reduced deployment risk

Applicability to metadata aggregator: MEDIUM

Dual-version deployment is valuable for mature services but overkill for early development.

Recommendation: Start with single version. Add dual deployment when service is stable and has significant traffic.

9. Spotify ID Mapping

Excellence: Cross-platform ID mapping with fuzzy matching.

Implementation quality: High

Mapping algorithm:

Search Spotify by artist name
Calculate Levenshtein distance for each result
Return best match if similarity ≥ 0.8

Use cases:

Cross-platform linking
Chart data correlation
User playlist integration

Applicability to metadata aggregator: HIGH

Cross-platform ID mapping is essential for modern metadata services. The fuzzy matching approach handles name variations well.

Recommendation: Implement ID mapping for major platforms (Spotify, Apple Music, YouTube Music, Deezer).

10. Chart Integration

Excellence: Aggregates charts from 4 major sources.

Implementation quality: Medium

Chart sources:

Last.fm (API)
Billboard (web scraping)
Apple Music (RSS API)
iTunes (RSS API)

MusicBrainz mapping: Automatic mapping of chart entries to MusicBrainz IDs

Applicability to metadata aggregator: MEDIUM

Chart integration adds value but is not core functionality. Web scraping (Billboard) is fragile.

Recommendation: Implement chart integration if it aligns with product goals. Prefer API-based sources over scraping.

Weaknesses

1. Outdated Dependencies

Severity: High

Issues:

Dependency	Current	Latest	Issue
Python	3.9	3.12	EOL October 2025
aioredis	1.3.1	Merged into redis-py 4.2+	Deprecated
Quart	0.14.1	0.19+	5 years of updates missed
asyncpg	0.26.0	0.29+	Missing features and fixes
sentry-sdk	0.19.5	2.0+	Major version behind

Impact:

Security vulnerabilities
Missing performance improvements
Incompatibility with modern tools
Reduced community support

Recommendation: CRITICAL UPGRADE REQUIRED

Upgrade to Python 3.11+ and latest library versions before deploying to production.

Migration effort: Medium (2-3 days)

2. Insecure Defaults

Severity: Critical

Issues:

Component	Default	Risk
Database password	`abc`	Unauthorized access
RabbitMQ password	`abc`	Message queue compromise
Redis password	None	Cache manipulation
API key	`replaceme`	Unauthorized invalidation
CORS	`*` (all origins)	CSRF attacks

Impact:

Data breaches
Service disruption
Unauthorized access
Compliance violations

Recommendation: MUST FIX BEFORE PRODUCTION

Generate strong random passwords
Use secrets management (Docker Secrets, Vault)
Implement proper authentication
Restrict CORS to specific origins
Enable TLS for all connections

Migration effort: Low (1 day)

3. No Authentication on Read Endpoints

Severity: Medium

Issue: All read endpoints are publicly accessible without authentication.

Impact:

No usage tracking per client
No rate limiting per user
No access control
Potential abuse

Current mitigation: Cloudflare CDN provides some DDoS protection

Recommendation: Implement API key authentication for production deployments.

Options:

API keys: Simple, good for server-to-server
OAuth 2.0: Better for user-facing applications
JWT tokens: Stateless, scalable

Migration effort: Medium (2-3 days)

4. Tests Disabled in CI

Severity: Medium

Issue: Test suite exists but is commented out in Azure Pipelines.

Reason: Tests require full infrastructure (MusicBrainz DB, Solr, Redis)

Impact:

No automated regression testing
Increased risk of breaking changes
Reduced confidence in deployments

Current test coverage:

Configuration: High (152 lines)
Providers: Medium (98 lines)
Cache: Medium (87 lines)
API: Low (76 lines)
Utilities: High (45 lines)
Application: Low (34 lines)

Recommendation: Implement integration tests with Docker Compose in CI.

Approach:

# Azure Pipelines
- script: |
    docker-compose -f docker-compose.yml -f docker-compose.test.yml up -d
    sleep 30  # Wait for services
    poetry run pytest tests/
    docker-compose down
  displayName: 'Run integration tests'

Migration effort: Medium (2-3 days)

5. Complex Deployment

Severity: Medium

Issue: Deployment requires 8+ containers and 10-step initialization.

Complexity factors:

MusicBrainz database dump (4-8 hours)
Search index building (4-8 hours)
Custom database indices
AMQP trigger setup
Replication configuration

Total initialization time: 8-16 hours

Impact:

High barrier to entry
Difficult local development
Complex disaster recovery
Expensive infrastructure

Recommendation: Provide simplified deployment options.

Options:

Sample database: Smaller dataset for development (1GB vs 100GB)
Docker image with pre-loaded data: Skip dump download
Managed service: Hosted MusicBrainz database
API-only mode: Use MusicBrainz web API instead of direct DB

Migration effort: High (1-2 weeks for managed service option)

6. Single Worker Default

Severity: Low

Issue: Gunicorn runs with 1 worker by default.

Impact:

Limited concurrency
Underutilized CPU cores
Reduced throughput

Current configuration:

gunicorn -w 1 -k uvicorn.workers.UvicornWorker ...

Recommendation: Use multiple workers in production.

Formula: workers = (2 * CPU_cores) + 1

Example (4 CPU cores):

gunicorn -w 9 -k uvicorn.workers.UvicornWorker ...

Migration effort: Trivial (configuration change)

7. No Pagination

Severity: Low

Issue: Search and list endpoints return all results without pagination.

Impact:

Large response sizes
Increased latency
Memory pressure
Poor mobile experience

Current workaround: limit parameter on some endpoints

Recommendation: Implement cursor-based pagination.

Example:

{
  "results": [...],
  "pagination": {
    "next_cursor": "eyJpZCI6MTIzNDU2fQ==",
    "has_more": true
  }
}

Migration effort: Medium (2-3 days)

8. No Webhooks

Severity: Low

Issue: No webhook support for cache invalidation or updates.

Impact:

Clients must poll for changes
Increased API load
Delayed updates

Current workaround: Poll /recent/artist and /recent/album endpoints

Recommendation: Implement webhooks for real-time notifications.

Use cases:

Cache invalidation notifications
New artist/album notifications
Chart update notifications

Migration effort: Medium (3-5 days)

Applicability to Metadata Aggregator Project

High Applicability (Must Adopt)

1. Provider Mixin Architecture

Why: Clean separation of concerns, testable, extensible

Implementation priority: High

Effort: Medium (3-5 days)

Pattern:

class ArtistByIdMixin:
    async def get_artist_by_id(self, mbid: str) -> dict:
        raise NotImplementedError

class MusicBrainzProvider(ArtistByIdMixin):
    async def get_artist_by_id(self, mbid: str) -> dict:
        # Implementation
        pass

class SpotifyProvider(ArtistByIdMixin):
    async def get_artist_by_id(self, spotify_id: str) -> dict:
        # Implementation
        pass

2. Three-Tier Caching

Why: Proven performance and cost optimization

Implementation priority: High

Effort: High (1-2 weeks)

Tiers:

Redis (hot cache, 512MB, LFU eviction)
PostgreSQL (persistent cache, compressed)
CDN (edge cache, Cloudflare/CloudFront)

3. Fallback Chains

Why: Resilience to external service failures

Implementation priority: High

Effort: Low (1-2 days)

Pattern:

async def get_artist_images(mbid):
    providers = [
        (fanart_provider, "FanArt.tv"),
        (theaudiodb_provider, "TheAudioDB"),
        (musicbrainz_provider, "MusicBrainz")
    ]
    
    for provider, name in providers:
        try:
            images = await provider.get_artist_images(mbid)
            if images:
                return images
        except Exception as e:
            logger.warning(f"{name} failed: {e}")
    
    return []

4. Async-First Design

Why: High concurrency, efficient resource usage

Implementation priority: High

Effort: Low (built into Python 3.11+)

Pattern: Use asyncio, aiohttp, asyncpg throughout

5. Comprehensive Monitoring

Why: Production readiness, operational visibility

Implementation priority: High

Effort: Medium (3-5 days)

Stack:

Sentry (error tracking)
Prometheus + Grafana (metrics)
Structured logging (JSON logs)

Medium Applicability (Consider Adopting)

1. Direct Database Access

Why: Performance and flexibility

Implementation priority: Medium

Effort: High (2-3 weeks including setup)

Decision factors:

Expected traffic volume (>1M requests/day → direct DB)
Infrastructure budget (direct DB requires ~100GB storage)
Maintenance capacity (schema changes require SQL updates)

Recommendation: Start with web API, migrate to direct DB if performance becomes an issue.

2. Background Crawler

Why: Improved cache hit rate and user experience

Implementation priority: Medium

Effort: Medium (1 week)

Decision factors:

Traffic patterns (predictable → crawler valuable)
Cache hit rate (< 80% → crawler helps)
Infrastructure capacity (crawler adds load)

Recommendation: Implement after MVP is stable and traffic patterns are understood.

3. Real-Time Search Updates

Why: Better UX, always-current search results

Implementation priority: Low

Effort: High (2-3 weeks including RabbitMQ setup)

Decision factors:

Search importance (core feature → real-time valuable)
Infrastructure complexity tolerance
Update frequency (hourly updates may be sufficient)

Recommendation: Start with periodic reindexing, add real-time updates if search is critical.

4. Change Detection

Why: Automatic cache invalidation

Implementation priority: Medium

Effort: Medium (1 week)

Decision factors:

Data freshness requirements
Upstream change notification availability
Cache invalidation strategy

Recommendation: Implement for data sources with change detection APIs or webhooks.

Low Applicability (Optional)

1. Dual-Version Deployment

Why: Gradual rollout, A/B testing

Implementation priority: Low

Effort: Low (configuration change)

Recommendation: Defer until service is mature and has significant traffic.

2. Chart Integration

Why: Additional value-add feature

Implementation priority: Low

Effort: Medium (1 week per chart source)

Recommendation: Only implement if charts align with product goals.

3. Spotify ID Mapping

Why: Cross-platform integration

Implementation priority: Medium

Effort: Medium (3-5 days)

Recommendation: Implement if cross-platform features are planned.

Recommended Architecture for Metadata Aggregator

Based on this evaluation, here's a recommended architecture:

Phase 1: MVP (4-6 weeks)

Core features:

Provider mixin architecture
MusicBrainz web API integration
Two-tier caching (Redis + PostgreSQL)
Basic monitoring (Sentry + structured logging)
Async-first design
Fallback chains

Infrastructure:

2 containers: API + Redis
PostgreSQL for cache (can be shared with application DB)
No MusicBrainz replica
No search index (use MusicBrainz search API)

Estimated cost: $50-100/month

Phase 2: Production (8-12 weeks)

Additional features:

CDN integration (Cloudflare/CloudFront)
Comprehensive monitoring (Prometheus + Grafana)
API authentication
Rate limiting
Change detection
Background crawler

Infrastructure:

4+ containers: API (x2) + Redis + Crawler
Dedicated cache database
CDN
Monitoring stack

Estimated cost: $200-400/month

Phase 3: Scale (16-24 weeks)

Additional features:

Direct MusicBrainz database access
Real-time search updates
Horizontal scaling
Multi-region deployment

Infrastructure:

8+ containers: API (x4) + MusicBrainz DB + Solr + Redis + RabbitMQ + Indexer + Crawler
Multi-region CDN
Load balancer

Estimated cost: $500-1000/month

Key Takeaways

What to Adopt Immediately

Provider mixin architecture: Clean, testable, extensible
Three-tier caching: Proven performance optimization
Fallback chains: Resilience to service failures
Async-first design: High concurrency
Comprehensive monitoring: Production readiness

What to Defer

Direct MusicBrainz database: Start with web API
Real-time search updates: Periodic reindexing sufficient for MVP
Dual-version deployment: Overkill for early stage
Chart integration: Nice-to-have, not core

What to Avoid

Hardcoded credentials: Use secrets management from day one
No authentication: Implement API keys for production
Outdated dependencies: Use latest stable versions
Tests disabled in CI: Invest in integration tests

Conclusion

The Lidarr Metadata API is an excellent reference implementation that demonstrates production-grade metadata aggregation. Its strengths (multi-source aggregation, sophisticated caching, operational maturity) far outweigh its weaknesses (outdated dependencies, security issues, complex deployment).

Overall recommendation: Use this project as a blueprint for architecture and patterns, but modernize dependencies and security before deploying to production.

Key learnings:

Provider mixin architecture is elegant and scalable
Three-tier caching is essential for performance and cost
Direct database access is powerful but complex
Operational maturity (monitoring, logging, error tracking) is critical
Security must be addressed from day one

Estimated effort to build similar system:

MVP: 4-6 weeks (1 developer)
Production-ready: 12-16 weeks (1-2 developers)
Full feature parity: 24-32 weeks (2-3 developers)

Recommended approach:

Start with simplified architecture (web API, two-tier cache)
Adopt proven patterns (provider mixins, fallback chains)
Invest in monitoring and testing from day one
Scale infrastructure as traffic grows
Add advanced features (direct DB, real-time search) when needed

This project proves that comprehensive metadata aggregation is achievable with the right architecture and patterns. The key is to start simple, adopt proven patterns, and scale incrementally based on actual needs.

22 KiB Raw Blame History

Lidarr Metadata API - Evaluation and Recommendations

Executive Summary

Strengths

1. Multi-Source Metadata Aggregation

2. Three-Tier Caching Strategy

3. Direct MusicBrainz Database Access

4. Change Detection and Cache Invalidation

5. Background Crawler for Cache Warming

6. Real-Time Search Index Updates

7. Operational Maturity

8. Dual-Version Deployment Strategy

9. Spotify ID Mapping

10. Chart Integration

Weaknesses

1. Outdated Dependencies

2. Insecure Defaults

3. No Authentication on Read Endpoints

4. Tests Disabled in CI

5. Complex Deployment

6. Single Worker Default

7. No Pagination

8. No Webhooks

Applicability to Metadata Aggregator Project

High Applicability (Must Adopt)

1. Provider Mixin Architecture

2. Three-Tier Caching

3. Fallback Chains

4. Async-First Design

5. Comprehensive Monitoring

Medium Applicability (Consider Adopting)

1. Direct Database Access

2. Background Crawler

3. Real-Time Search Updates

4. Change Detection

Low Applicability (Optional)

1. Dual-Version Deployment

2. Chart Integration

3. Spotify ID Mapping

Recommended Architecture for Metadata Aggregator

Phase 1: MVP (4-6 weeks)

Phase 2: Production (8-12 weeks)

Phase 3: Scale (16-24 weeks)

Key Takeaways

What to Adopt Immediately

What to Defer

What to Avoid

Conclusion

22 KiB

Raw Blame History