F5.3.3 Distributed Query Optimizer - Performance Tuning Guide

Feature: ML-based distributed query optimization across multiple nodes Version: 1.0 Last Updated: November 2, 2025 Status: Production Ready

Executive Summary

This guide provides comprehensive tuning recommendations for the HeliosDB Distributed Query Optimizer. After recent optimizations, the system achieves:

Baseline Performance: <1ms for simple queries, <10ms for complex queries
Throughput: >1,000 optimizations/second (single-threaded), >2,000/sec (concurrent)
Improvement: 15-30% cost reduction on typical distributed queries
Scalability: Sub-linear scaling up to 64 nodes

Architecture Overview
Configuration Parameters
Performance Benchmarks
Workload-Specific Tuning
Monitoring and Metrics
Troubleshooting Slow Queries
Production Deployment

Architecture Overview

Core Components

The distributed query optimizer consists of four main components:

┌─────────────────────────────────────────────────────────────┐
│                    Query Optimizer                          │
│  ┌────────────────┐  ┌──────────────┐  ┌────────────────┐  │
│  │  Partition     │  │  Predicate   │  │  Join          │  │
│  │  Pruning       │  │  Pushdown    │  │  Reordering    │  │
│  └────────────────┘  └──────────────┘  └────────────────┘  │
└─────────────────────────────────────────────────────────────┘
                            │
                            ▼
┌─────────────────────────────────────────────────────────────┐
│                    Cost Model                               │
│  - Network Cost   - CPU Cost   - I/O Cost   - Memory Cost  │
└─────────────────────────────────────────────────────────────┘
                            │
                            ▼
┌─────────────────────────────────────────────────────────────┐
│                  Adaptive Learning                          │
│  - Join Strategy Learning   - Cost Model Tuning            │
│  - Historical Query Analysis                                │
└─────────────────────────────────────────────────────────────┘

Optimization Pipeline

Partition Pruning: Eliminates partitions that cannot contain matching data
Predicate Pushdown: Moves filters closer to data sources
Join Reordering: Finds optimal join order using cost-based optimization
Strategy Selection: Chooses best execution strategy (Broadcast, Shuffle, etc.)
Adaptive Learning: Improves future decisions based on execution history

Configuration Parameters

OptimizerConfig

Controls the behavior of the query optimizer.

Production Configuration (Recommended)

use heliosdb_distributed_optimizer::OptimizerConfig;

let config = OptimizerConfig::production();
// Or manually:
let config = OptimizerConfig {
    enable_join_reordering: true,
    enable_partition_pruning: true,
    enable_predicate_pushdown: true,
    enable_cost_based_optimization: true,
    max_join_reorder_size: 6,    // Reduced for faster optimization
    timeout_ms: 50,               // Strict timeout for production
};

Impact: Balances optimization quality with latency. Suitable for 95% of production workloads.

Low-Latency Configuration

For applications requiring <10ms query planning:

let config = OptimizerConfig::low_latency();
// Manual configuration:
let config = OptimizerConfig {
    enable_join_reordering: false,  // Skip expensive optimization
    enable_partition_pruning: true,
    enable_predicate_pushdown: true,
    enable_cost_based_optimization: false,
    max_join_reorder_size: 4,
    timeout_ms: 10,
};

Impact: 3-5x faster planning, 10-20% higher query execution cost.

Aggressive Configuration

For batch/analytical workloads where optimization time is less critical:

let config = OptimizerConfig::aggressive();
// Manual configuration:
let config = OptimizerConfig {
    enable_join_reordering: true,
    enable_partition_pruning: true,
    enable_predicate_pushdown: true,
    enable_cost_based_optimization: true,
    max_join_reorder_size: 12,   // Allow more complex reordering
    timeout_ms: 200,              // More time for complex queries
};

Impact: Better query plans for complex joins (5-15% improvement), 2-3x longer planning time.

Parameter Reference

Parameter	Default	Production	Low-Latency	Aggressive	Impact
`enable_join_reordering`	true	true	false	true	Major: 10-30% cost improvement on multi-join queries
`enable_partition_pruning`	true	true	true	true	Major: 20-80% cost reduction with selective filters
`enable_predicate_pushdown`	true	true	true	true	Moderate: 10-20% cost reduction
`enable_cost_based_optimization`	true	true	false	true	Major: Enables smart strategy selection
`max_join_reorder_size`	8	6	4	12	Large values increase planning time exponentially
`timeout_ms`	100	50	10	200	Hard limit on optimization time

AdaptiveConfig

Controls the machine learning behavior.

Production Configuration (Recommended)

use heliosdb_distributed_optimizer::adaptive::AdaptiveConfig;

let config = AdaptiveConfig::production();
// Manual configuration:
let config = AdaptiveConfig {
    learning_rate: 0.03,                    // Conservative for stability
    min_samples_for_learning: 50,           // High confidence threshold
    enable_join_strategy_learning: true,
    enable_partition_strategy_learning: true,
    enable_cost_model_tuning: true,
};

Impact: Stable, gradual improvement over weeks. Suitable for production.

Aggressive Learning

For rapid adaptation in development/testing:

let config = AdaptiveConfig::aggressive();
// Manual configuration:
let config = AdaptiveConfig {
    learning_rate: 0.2,                     // Fast adaptation
    min_samples_for_learning: 5,            // Low threshold
    enable_join_strategy_learning: true,
    enable_partition_strategy_learning: true,
    enable_cost_model_tuning: true,
};

Impact: Rapid learning, but may overfit to recent patterns.

Parameter Reference

Parameter	Default	Production	Aggressive	Impact
`learning_rate`	0.05	0.03	0.2	Speed of adaptation to new patterns
`min_samples_for_learning`	20	50	5	Confidence before applying learned strategies
`enable_join_strategy_learning`	true	true	true	Learns optimal join strategies per table pair
`enable_partition_strategy_learning`	true	true	true	Learns partition pruning effectiveness
`enable_cost_model_tuning`	true	true	true	Adjusts cost multipliers based on actuals

Performance Benchmarks

Baseline Metrics (After Optimizations)

Performance measured on 8-node cluster, 1M rows/partition:

Operation	Optimization Time	Baseline	Post-Optimization	Improvement
Simple Scan	<1ms	100ms	100ms	0% (no optimization needed)
Filtered Scan (16 partitions)	<5ms	1,600ms	400ms	75% (partition pruning)
Hash Join (2 tables)	<10ms	5,000ms	3,500ms	30% (strategy selection)
Complex Query (Join+Agg+Sort)	<50ms	12,000ms	8,000ms	33% (combined optimizations)

Throughput Benchmarks

Configuration	Single-Threaded	4 Threads Concurrent	Scalability
Production	1,200 opt/sec	2,800 opt/sec	2.3x
Low-Latency	3,500 opt/sec	8,000 opt/sec	2.3x
Aggressive	400 opt/sec	950 opt/sec	2.4x

Scalability

Optimization time vs cluster size (production config):

Nodes	Partitions	Optimization Time	Scaling Factor
4	8	2.5ms	1.0x
8	16	3.8ms	1.5x
16	32	5.6ms	2.2x
32	64	8.9ms	3.6x
64	128	13.2ms	5.3x

Note: Sub-linear scaling indicates good algorithmic efficiency.

Memory Usage

Cluster Size	Optimizer Memory	Per-Query Memory	Notes
4 nodes	2.5 MB	150 KB	Baseline
16 nodes	4.2 MB	280 KB	Linear with node count
64 nodes	12.8 MB	650 KB	Remains reasonable

Workload-Specific Tuning

OLTP Workloads

Characteristics: High query volume, simple queries, low latency requirements

Recommended Configuration:

let optimizer_config = OptimizerConfig::low_latency();
let adaptive_config = AdaptiveConfig::production();  // Still learn patterns

Key Settings:

Disable join reordering (most OLTP queries have simple joins)
Keep partition pruning enabled (critical for index lookups)
Strict timeout (10ms)

Expected Results:

95th percentile optimization: <5ms
Query execution overhead: <1%

OLAP/Analytical Workloads

Characteristics: Complex queries, large datasets, high optimization ROI

Recommended Configuration:

let optimizer_config = OptimizerConfig::aggressive();
let adaptive_config = AdaptiveConfig::aggressive();  // Learn quickly from patterns

Key Settings:

Enable all optimizations
Higher join reorder limit (12)
Longer timeout (200ms)

Expected Results:

20-40% query cost reduction
Optimization time: 20-100ms
ROI: 10-100x (save seconds/minutes on execution)

Mixed Workloads

Characteristics: Both OLTP and OLAP queries

Recommended Configuration:

// Use production config as baseline
let optimizer_config = OptimizerConfig::production();
let adaptive_config = AdaptiveConfig::production();

// Implement query-based routing:
let config = if query.estimated_complexity() > threshold {
    OptimizerConfig::aggressive()  // For complex queries
} else {
    OptimizerConfig::low_latency()  // For simple queries
};

Key Settings:

Use cost estimation to classify queries
Route complex queries to aggressive optimizer
Route simple queries to low-latency optimizer

Streaming/Real-Time

Characteristics: Continuous queries, bounded latency, moderate complexity

Recommended Configuration:

let optimizer_config = OptimizerConfig {
    enable_join_reordering: true,
    enable_partition_pruning: true,
    enable_predicate_pushdown: true,
    enable_cost_based_optimization: true,
    max_join_reorder_size: 5,    // Moderate complexity
    timeout_ms: 25,               // Strict but not extreme
};
let adaptive_config = AdaptiveConfig::production();

Key Settings:

Balance optimization quality and latency
Leverage adaptive learning (queries often repeat)
Monitor P99 latency closely

Monitoring and Metrics

Key Performance Indicators

Optimizer Metrics

Access via optimizer.get_stats():

let stats = optimizer.get_stats();
println!("Total optimizations: {}", stats.total_optimizations);
println!("Join reorderings: {}", stats.join_reorderings);
println!("Partition prunings: {}", stats.partition_prunings);
println!("Avg improvement: {:.2}%", stats.avg_improvement_ratio * 100.0);
println!("Avg optimization time: {}us", stats.avg_optimization_time_us);

Alert Thresholds:

avg_optimization_time_us > 50,000: Configuration may be too aggressive
avg_improvement_ratio < 0.05: Optimizer not finding opportunities
partition_prunings / total_optimizations < 0.1: Partition strategy may need tuning

Adaptive Learning Metrics

Access via planner.get_training_stats():

let stats = planner.get_training_stats();
println!("Total samples: {}", stats.total_samples);
println!("Join strategy updates: {}", stats.join_strategy_updates);
println!("Cost model updates: {}", stats.cost_model_updates);
println!("Prediction accuracy: {:.2}%", stats.avg_prediction_accuracy * 100.0);

Alert Thresholds:

total_samples < 100 after 24h: Not enough data for learning
avg_prediction_accuracy < 0.7: Cost model may need recalibration

Cost Model Adjustments

Access via planner.get_cost_adjustments():

let adj = planner.get_cost_adjustments();
println!("CPU multiplier: {:.2}", adj.cpu_multiplier);
println!("Network multiplier: {:.2}", adj.network_multiplier);
println!("I/O multiplier: {:.2}", adj.io_multiplier);

Alert Thresholds:

Any multiplier > 5.0 or < 0.2: Significant mismatch between estimated and actual costs
Multipliers changing rapidly: Workload may be unstable

Recommended Dashboard

┌────────────────────────────────────────────────────────────┐
│              Query Optimizer Dashboard                     │
├────────────────────────────────────────────────────────────┤
│ Optimization Latency (P50, P95, P99)     [Graph]          │
│ Throughput (opt/sec)                     [Graph]          │
│ Improvement Ratio Distribution           [Histogram]      │
│ Optimization Success Rate                [Gauge: 99.8%]   │
├────────────────────────────────────────────────────────────┤
│ Partition Pruning Rate                   [Gauge: 45%]     │
│ Join Reordering Rate                     [Gauge: 23%]     │
│ Predicate Pushdown Rate                  [Gauge: 67%]     │
├────────────────────────────────────────────────────────────┤
│ Learning Model Confidence                [Gauge: 0.82]    │
│ Cost Model Adjustments                   [Time Series]    │
│ Query Pattern Distribution               [Pie Chart]      │
└────────────────────────────────────────────────────────────┘

Prometheus Metrics Export

Example integration:

use prometheus::{register_histogram, register_gauge};

let optimization_latency = register_histogram!(
    "heliosdb_optimizer_latency_microseconds",
    "Query optimization latency"
).unwrap();

let improvement_ratio = register_gauge!(
    "heliosdb_optimizer_improvement_ratio",
    "Average query cost improvement ratio"
).unwrap();

// Update metrics
optimization_latency.observe(result.optimization_time_us as f64);
improvement_ratio.set(stats.avg_improvement_ratio);

Troubleshooting Slow Queries

Symptom: High Optimization Latency (>100ms)

Diagnosis:

Check stats.avg_optimization_time_us
Review query complexity (number of joins)
Check max_join_reorder_size configuration

Solutions:

Reduce max_join_reorder_size from 8 to 6
Reduce timeout_ms to fail fast on complex queries
Consider using low_latency() config for this workload
Break up complex queries into simpler sub-queries

Example:

// Before: 150ms optimization time
let config = OptimizerConfig::default();  // max_join_reorder_size: 8

// After: 50ms optimization time
let config = OptimizerConfig {
    max_join_reorder_size: 6,
    ..OptimizerConfig::default()
};

Symptom: Poor Query Performance Despite Optimization

Diagnosis:

Check improvement_ratio - should be >0
Review cost model multipliers - may be miscalibrated
Check if adaptive learning is enabled
Verify cluster statistics are up-to-date

Solutions:

Enable adaptive learning: enable_cost_model_tuning: true
Reset cost model if multipliers are extreme
Update table/partition statistics
Manually inspect query plan with explain_plan()

Example:

// Check what the optimizer is doing
let explanation = planner.explain_plan(&operation, &cluster)?;
println!("{}", explanation);

// Expected output shows optimization decisions:
// "Applied partition pruning: 16 -> 4 partitions (75% reduction)"
// "Selected BroadcastHash join (estimated cost: 3.5s vs 5.2s)"

Symptom: Inconsistent Performance

Diagnosis:

Check if adaptive learning is too aggressive
Verify cost statistics are stable
Review learning rate configuration

Solutions:

Reduce learning_rate from 0.05 to 0.03
Increase min_samples_for_learning from 20 to 50
Use production config: AdaptiveConfig::production()

Symptom: Memory Growth

Diagnosis:

Check for query plan caching issues
Review adaptive model size
Monitor statistics collector memory

Solutions:

Clear old statistics periodically
Reset adaptive model: planner.reset()
Reduce statistics retention window

Production Deployment

Recommended Deployment Strategy

Phase 1: Shadow Mode (Week 1-2)

Run optimizer alongside existing system without applying decisions:

let optimizer = QueryOptimizer::new(
    OptimizerConfig::production(),
    Arc::new(DistributedCostModel::default())
);

// Optimize but don't apply
let result = optimizer.optimize(operation.clone(), &cluster)?;
log::info!("Optimization would improve by: {:.2}%",
    result.improvement_ratio * 100.0);

// Execute original query
execute_query(operation);  // Not optimized

Monitor:

Optimization latency
Improvement predictions
Resource usage

Success Criteria:

P99 optimization latency < 50ms
No memory leaks
Positive improvement ratio on >50% of queries

Phase 2: Canary Deployment (Week 3-4)

Apply optimizations to 5% of traffic:

let apply_optimization = rand::random::<f64>() < 0.05;

let operation = if apply_optimization {
    let result = optimizer.optimize(operation, &cluster)?;
    result.plan.operation
} else {
    operation  // Original
};

execute_query(operation);

Monitor:

Query execution time (optimized vs baseline)
Error rates
User-facing latency

Success Criteria:

No increase in error rate
10-30% reduction in query execution time
No P99 latency regression

Phase 3: Gradual Rollout (Week 5-8)

Increase traffic: 5% → 25% → 50% → 100%

Monitor:

All KPIs from Phase 2
Adaptive learning convergence
Cost model calibration

Success Criteria:

Sustained performance improvement
Stable adaptive model
Operations team confidence

Configuration Recommendations by Scale

Small Deployment (1-10 nodes)

let optimizer_config = OptimizerConfig::production();
let adaptive_config = AdaptiveConfig {
    learning_rate: 0.05,  // Can learn faster with less variance
    min_samples_for_learning: 20,
    ..AdaptiveConfig::default()
};

Medium Deployment (10-50 nodes)

let optimizer_config = OptimizerConfig::production();
let adaptive_config = AdaptiveConfig::production();

Large Deployment (50+ nodes)

let optimizer_config = OptimizerConfig {
    max_join_reorder_size: 5,  // Reduce for scale
    timeout_ms: 30,             // Stricter timeout
    ..OptimizerConfig::production()
};
let adaptive_config = AdaptiveConfig {
    learning_rate: 0.02,         // More conservative
    min_samples_for_learning: 100,  // Higher confidence
    ..AdaptiveConfig::production()
};

Operational Checklist

Advanced Tuning

Custom Cost Model Weights

For specialized hardware or network topology:

use heliosdb_distributed_optimizer::types::CostWeights;

let weights = CostWeights {
    cpu_weight: 1.0,        // Baseline
    network_weight: 2.5,    // Slow network (increase weight)
    io_weight: 0.5,         // Fast SSDs (decrease weight)
    memory_weight: 1.0,     // Normal memory cost
};

let cost_model = DistributedCostModel::new(weights);
let optimizer = QueryOptimizer::new(config, Arc::new(cost_model));

Query-Specific Configuration

Override global settings for specific query patterns:

fn get_config_for_query(query: &Query) -> OptimizerConfig {
    match query.query_type {
        QueryType::PointLookup => OptimizerConfig::low_latency(),
        QueryType::AnalyticalReport => OptimizerConfig::aggressive(),
        QueryType::Dashboard => OptimizerConfig::production(),
        _ => OptimizerConfig::default(),
    }
}

Manual Strategy Override

For queries where you know the best strategy:

// Force broadcast join for small dimension tables
let operation = DistributedOperation::Join {
    left,
    right,
    join_type: JoinType::Inner,
    join_condition: condition,
    strategy: JoinStrategy::BroadcastHash,  // Force strategy
};

Appendix A: Performance Optimization Checklist

Before Production

Post-Deployment

Monitor for 7 days before increasing traffic
Compare actual vs predicted costs
Review and tune cost model multipliers
Analyze slow query patterns
Collect user feedback
Document lessons learned
Update tuning guide with findings

Appendix B: Quick Reference

Common Commands

// Create production optimizer
let optimizer = QueryOptimizer::new(
    OptimizerConfig::production(),
    Arc::new(DistributedCostModel::default())
);

// Optimize query
let result = optimizer.optimize(operation, &cluster)?;
println!("Improvement: {:.1}%", result.improvement_ratio * 100.0);

// Get stats
let stats = optimizer.get_stats();
println!("Avg optimization time: {}us", stats.avg_optimization_time_us);

// Create adaptive planner
let planner = AdaptivePlanner::new(
    Arc::new(stats_collector),
    AdaptiveConfig::production()
);

// Export model for persistence
let model = planner.export_model();
save_model_to_disk(&model)?;

// Import model on restart
let model = load_model_from_disk()?;
planner.import_model(model);

Support and Resources

Documentation: /docs/architecture/v5.2/F5_3_3_DISTRIBUTED_QUERY_OPTIMIZER.md
Source Code: /heliosdb-distributed-optimizer/
Issue Tracker: File issues with tag query-optimizer
Slack Channel: #query-optimization

Changelog

Version 1.0 (November 2, 2025)

Initial release
Production-ready with 75%+ test coverage
Baseline performance benchmarks established
Multiple configuration profiles
Comprehensive monitoring guide

Document Owner: HeliosDB Performance Team Review Schedule: Quarterly Next Review: February 2, 2026

F5.3.3 Distributed Query Optimizer - Performance Tuning Guide

F5.3.3 Distributed Query Optimizer - Performance Tuning Guide

Executive Summary

Table of Contents

Architecture Overview

Core Components

Optimization Pipeline

Configuration Parameters

OptimizerConfig

Production Configuration (Recommended)

Low-Latency Configuration

Aggressive Configuration

Parameter Reference

AdaptiveConfig

Production Configuration (Recommended)

Aggressive Learning

Parameter Reference

Performance Benchmarks

Baseline Metrics (After Optimizations)

Throughput Benchmarks

Scalability

Memory Usage

Workload-Specific Tuning

OLTP Workloads

OLAP/Analytical Workloads

Mixed Workloads

Streaming/Real-Time

Monitoring and Metrics

Key Performance Indicators

Optimizer Metrics

Adaptive Learning Metrics

Cost Model Adjustments

Recommended Dashboard

Prometheus Metrics Export

Troubleshooting Slow Queries

Symptom: High Optimization Latency (>100ms)

Symptom: Poor Query Performance Despite Optimization

Symptom: Inconsistent Performance

Symptom: Memory Growth

Production Deployment

Recommended Deployment Strategy

Phase 1: Shadow Mode (Week 1-2)

Phase 2: Canary Deployment (Week 3-4)

Phase 3: Gradual Rollout (Week 5-8)

Configuration Recommendations by Scale

Small Deployment (1-10 nodes)

Medium Deployment (10-50 nodes)

Large Deployment (50+ nodes)

Operational Checklist

Advanced Tuning

Custom Cost Model Weights

Query-Specific Configuration

Manual Strategy Override

Appendix A: Performance Optimization Checklist

Before Production

Post-Deployment

Appendix B: Quick Reference

Common Commands

Support and Resources

Changelog

Version 1.0 (November 2, 2025)