remove useless file

2026-05-18 14:51:03 +02:00
parent 8071ebab0b
commit 2836e759ab
1 changed files with 0 additions and 402 deletions
@@ -1,402 +0,0 @@
-#include <iostream>
-#include <vector>
-#include <algorithm>
-#include <queue>
-#include <random>
-#include <chrono>
-#include <omp.h>
-#include <numeric>
-#include <fstream>
-
-using namespace std;
-
-// ==========================================
-// 1. DATA STRUCTURES
-// ==========================================
-
-// High-performance DAG representation using adjacency lists
-struct DAG {
-    int num_nodes;
-    int num_processors;
-    
-    // Computation cost matrix (Flattened: num_nodes x num_processors)
-    vector<float> comp_costs; 
-    
-    // Edges: node -> vector of pair<target_node, communication_cost>
-    vector<vector<pair<int, float>>> successors;
-    vector<vector<pair<int, float>>> predecessors;
-
-    DAG(int n, int p) : num_nodes(n), num_processors(p), 
-                        comp_costs(n * p, 0.0f), 
-                        successors(n), predecessors(n) {}
-
-    inline float get_comp_cost(int task, int proc) const {
-        return comp_costs[task * num_processors + proc];
-    }
-};
-
-// Struct to hold the final schedule for each task
-struct TaskSchedule {
-    int processor;
-    float start_time;
-    float end_time;
-};
-
-// ==========================================
-// 2. DAG GENERATOR (REAL-WORLD SKEW)
-// ==========================================
-DAG generate_dag(int num_nodes, int num_processors, int levels, float ccr) {
-    DAG dag(num_nodes, num_processors);
-    mt19937 gen(42); // Fixed seed for reproducibility
-    uniform_real_distribution<float> comp_dist(10.0f, 100.0f);
-    
-    for (int i = 0; i < num_nodes * num_processors; ++i) {
-        dag.comp_costs[i] = comp_dist(gen);
-    }
-
-    vector<vector<int>> nodes_per_level(levels);
-    uniform_int_distribution<int> lvl_dist(0, levels - 1);
-    
-    for (int i = 0; i < num_nodes; ++i) {
-        if (i == 0) nodes_per_level[0].push_back(i);
-        else if (i == num_nodes - 1) nodes_per_level[levels - 1].push_back(i);
-        else nodes_per_level[lvl_dist(gen)].push_back(i);
-    }
-
-    float avg_comp = 55.0f;
-    uniform_real_distribution<float> comm_dist(avg_comp * ccr * 0.5f, avg_comp * ccr * 1.5f);
-    uniform_real_distribution<float> prob(0.0, 1.0);
-
-    long long total_edges = 0;
-
-    for (int l = 0; l < levels - 1; ++l) {
-        if (nodes_per_level[l].empty()) continue;
-        
-        for (int u : nodes_per_level[l]) {
-            int target_level = l + 1;
-            while (target_level < levels && nodes_per_level[target_level].empty()) target_level++;
-            
-            if (target_level < levels) {
-                // 1. BASE DEPENDENCY: Ensure the graph flows forward (no disconnected nodes)
-                int v = nodes_per_level[target_level][gen() % nodes_per_level[target_level].size()];
-                float comm = comm_dist(gen);
-                dag.successors[u].push_back({v, comm});
-                dag.predecessors[v].push_back({u, comm});
-                total_edges++;
-
-                // ----------------------------------------------------
-                // 2. THE REAL-WORLD SKEW LOGIC (Hubs vs Normal Nodes)
-                // ----------------------------------------------------
-                
-                // Make 0.5% of nodes act as "Super Hubs" (Broadcast nodes)
-                bool is_super_hub = (prob(gen) < 0.005); 
-                int extra_edges = 0;
-
-                if (is_super_hub) {
-                    // This node is a Hub! Give it 20,000 children!
-                    // (Or as many as the remaining graph size permits)
-                    extra_edges = 2000; 
-                } else {
-                    // Normal node: 20% chance to just have 1 to 3 extra children
-                    if (prob(gen) < 0.2) {
-                        uniform_int_distribution<int> normal_dist(1, 3);
-                        extra_edges = normal_dist(gen);
-                    }
-                }
-
-                // Randomly connect these extra edges to ANY node in ANY future level
-                for (int e = 0; e < extra_edges; ++e) {
-                    uniform_int_distribution<int> future_lvl_dist(target_level, levels - 1);
-                    int f_lvl = future_lvl_dist(gen);
-                    if (nodes_per_level[f_lvl].empty()) continue;
-
-                    int child_v = nodes_per_level[f_lvl][gen() % nodes_per_level[f_lvl].size()];
-                    
-                    float extra_comm = comm_dist(gen);
-                    dag.successors[u].push_back({child_v, extra_comm});
-                    dag.predecessors[child_v].push_back({u, extra_comm});
-                    total_edges++;
-                }
-            }
-        }
-    }
-    
-    cout << "   [Generator] Created " << total_edges << " total edges (simulating Hubs).\n";
-    return dag;
-}
-
-
-// ==========================================
-// 3. PEFT SCHEDULER (O(E*P) Optimized)
-// ==========================================
-void run_peft(const DAG& dag, vector<TaskSchedule>& final_schedule) {
-    int N = dag.num_nodes;
-    int P = dag.num_processors;
-    
-    // 1. Level sorting for parallel Bottom-Up OCT computation
-    vector<int> out_degree(N, 0);
-    for(int i=0; i<N; ++i) out_degree[i] = dag.successors[i].size();
-    
-    vector<vector<int>> reverse_levels;
-    queue<int> q;
-    for(int i=0; i<N; ++i) if(out_degree[i] == 0) q.push(i);
-    
-    while(!q.empty()) {
-        int size = q.size();
-        vector<int> current_level;
-        for(int i=0; i<size; ++i) {
-            int u = q.front(); q.pop();
-            current_level.push_back(u);
-            for(auto& edge : dag.predecessors[u]) {
-                int p_node = edge.first;
-                if(--out_degree[p_node] == 0) q.push(p_node);
-            }
-        }
-        reverse_levels.push_back(current_level);
-    }
-
-
-// 2. Compute OCT (Optimistic Cost Table)
-    vector<float> oct(N * P, 0.0f);
-    
-    // NEW: Cache array to drop complexity to O(E * P)
-    vector<float> min_oct_comp(N, 0.0f); 
-    
-    for (const auto& level_nodes : reverse_levels) {
-        #pragma omp parallel for schedule(dynamic)
-        for (int idx = 0; idx < level_nodes.size(); ++idx) {
-            int task = level_nodes[idx];
-            
-            vector<float> max_vals(P, 0.0f);
-            
-            // Loop over successors first (O(E * P) total instead of O(E * P^2))
-            for (auto& edge : dag.successors[task]) {
-                int succ = edge.first;
-                float comm_cost = edge.second;
-                
-                // The precalculated global minimum for this successor
-                float val_diff = min_oct_comp[succ] + comm_cost;
-                
-                // Cache-friendly, auto-vectorizable O(P) loop
-                for (int p_j = 0; p_j < P; ++p_j) {
-                    float val_same = oct[succ * P + p_j] + dag.get_comp_cost(succ, p_j);
-                    float min_w = min(val_same, val_diff);
-                    max_vals[p_j] = max(max_vals[p_j], min_w);
-                }
-            }
-            
-            // Assign to OCT and precalculate the minimum for the predecessors
-            float task_min_val = 1e9f;
-            for (int p_j = 0; p_j < P; ++p_j) {
-                oct[task * P + p_j] = max_vals[p_j];
-                task_min_val = min(task_min_val, max_vals[p_j] + dag.get_comp_cost(task, p_j));
-            }
-            min_oct_comp[task] = task_min_val;
-        }
-    }
-
-    // 3. Compute Rank_OCT and sort tasks (Phase 1)
-    vector<pair<float, int>> rank_oct(N);
-    #pragma omp parallel for
-    for (int i = 0; i < N; ++i) {
-        float avg_oct = 0;
-        for (int p = 0; p < P; ++p) avg_oct += oct[i * P + p];
-        rank_oct[i] = {avg_oct / P, i};
-    }
-    
-    sort(rank_oct.rbegin(), rank_oct.rend());
-
-    // 4. Processor Assignment (Phase 2)
-    final_schedule.resize(N);
-    vector<float> avail(P, 0.0f); 
-
-    for (int i = 0; i < N; ++i) {
-        int task = rank_oct[i].second;
-        
-        int best_p = -1;
-        float min_o_eft = 1e9f;
-        float best_est = 0.0f;
-        float best_eft = 0.0f;
-
-        for (int p = 0; p < P; ++p) {
-            float data_ready_time = 0.0f;
-            for (auto& pred_edge : dag.predecessors[task]) {
-                int pred = pred_edge.first;
-                float comm = pred_edge.second;
-                int pred_p = final_schedule[pred].processor;
-                float comm_penalty = (pred_p == p) ? 0.0f : comm;
-                data_ready_time = max(data_ready_time, final_schedule[pred].end_time + comm_penalty);
-            }
-            
-            float est = max(avail[p], data_ready_time);
-            float eft = est + dag.get_comp_cost(task, p);
-            float o_eft = eft + oct[task * P + p]; 
-            
-            if (o_eft < min_o_eft) {
-                min_o_eft = o_eft;
-                best_p = p;
-                best_est = est;
-                best_eft = eft;
-            }
-        }
-
-        final_schedule[task] = {best_p, best_est, best_eft};
-        avail[best_p] = best_eft; 
-    }
-}
-
-// ==========================================
-// 4. VISUALIZATION EXPORTERS (DOT)
-// ==========================================
-
-void export_dag_to_dot(const DAG& dag, const string& filename) {
-    ofstream out(filename);
-    out << "digraph RawDAG {\n";
-    out << "  rankdir=TB;\n"; 
-    out << "  node [shape=record, style=filled, fillcolor=lightgrey, fontname=\"Helvetica\"];\n";
-    out << "  edge [fontname=\"Helvetica\", fontsize=10];\n\n";
-
-    for (int i = 0; i < dag.num_nodes; ++i) {
-        out << "  Task_" << i << " [label=\"Task " << i << "\"];\n";
-    }
-
-    out << "\n";
-    for (int i = 0; i < dag.num_nodes; ++i) {
-        for (const auto& edge : dag.successors[i]) {
-            out << "  Task_" << i << " -> Task_" << edge.first 
-                << " [label=\"" << (int)edge.second << "\"];\n";
-        }
-    }
-    
-    out << "}\n";
-    out.close();
-}
-
-void export_schedule_to_dot(const DAG& dag, const vector<TaskSchedule>& schedule, const string& filename) {
-    ofstream out(filename);
-    out << "digraph ScheduledDAG {\n";
-    out << "  rankdir=TB;\n";
-    // FIX 1: Change shape to standard 'box' to prevent the flat edge warning
-    out << "  node [shape=box, fontname=\"Helvetica\", style=filled, fillcolor=white, rounded=true];\n";
-    out << "  edge [fontname=\"Helvetica\", fontsize=10];\n\n";
-    
-    vector<vector<int>> proc_tasks(dag.num_processors);
-    for (int i = 0; i < dag.num_nodes; ++i) {
-        proc_tasks[schedule[i].processor].push_back(i);
-    }
-    
-    for (int p = 0; p < dag.num_processors; ++p) {
-        if (proc_tasks[p].empty()) continue; 
-        
-        sort(proc_tasks[p].begin(), proc_tasks[p].end(), [&schedule](int a, int b) {
-            return schedule[a].start_time < schedule[b].start_time;
-        });
-        
-        out << "  subgraph cluster_P" << p << " {\n";
-        out << "    label=\"Processor " << p << "\";\n";
-        out << "    fontname=\"Helvetica-Bold\";\n";
-        out << "    style=rounded;\n";
-        out << "    bgcolor=\"#f0f8ff\";\n"; 
-        out << "    color=blue;\n\n";
-        
-        for (int task : proc_tasks[p]) {
-            // FIX 1 cont: Use standard \n linebreaks instead of the record | syntax
-            out << "    Task_" << task 
-                << " [label=\"Task " << task 
-                << "\\nStart: " << schedule[task].start_time 
-                << "\\nEnd: " << schedule[task].end_time << "\"];\n";
-        }
-        
-        for (size_t i = 0; i < proc_tasks[p].size() - 1; ++i) {
-            out << "    Task_" << proc_tasks[p][i] << " -> Task_" << proc_tasks[p][i+1] 
-                << " [style=invis, weight=10];\n";
-        }
-        
-        out << "  }\n\n";
-    }
-    
-    for (int i = 0; i < dag.num_nodes; ++i) {
-        for (const auto& edge : dag.successors[i]) {
-            int target = edge.first;
-            bool same_proc = (schedule[i].processor == schedule[target].processor);
-            
-            // FIX 2: If on the same processor, add 'constraint=false'. 
-            // The invisible edges already handle the layout, so don't let this edge confuse the solver.
-            out << "  Task_" << i << " -> Task_" << target 
-                << " [label=\"" << (int)edge.second << "\""
-                << (same_proc ? ", constraint=false]" : ", color=red, fontcolor=red, style=dashed]")
-                << ";\n";
-        }
-    }
-    
-    out << "}\n";
-    out.close();
-}
-
-
-// ==========================================
-// 5. MAIN
-// ==========================================
-int main() {
-    // Testing with a small graph to ensure DOT generation runs
-    int N = 30000;
-    int P = 1000;
-    
-    cout << "Generating DAG with " << N << " nodes and " << P << " processors..." << endl;
-    auto start_gen = chrono::high_resolution_clock::now();
-    DAG dag = generate_dag(N, P, 300, 1.0f); // 10 levels for a small graph
-    auto end_gen = chrono::high_resolution_clock::now();
-    cout << "DAG Generation took: " << chrono::duration<double>(end_gen - start_gen).count() << " s\n";
-
-    vector<TaskSchedule> schedule;
-    
-    cout << "Running PEFT Scheduling..." << endl;
-    auto start_sched = chrono::high_resolution_clock::now();
-    run_peft(dag, schedule);
-    auto end_sched = chrono::high_resolution_clock::now();
-    
-    cout << "Scheduling took: " << chrono::duration<double>(end_sched - start_sched).count() << " s\n\n";
-
-    // ==========================================
-    // METRICS REPORT
-    // ==========================================
-    float makespan = 0.0f;
-    for (int i = 0; i < N; ++i) makespan = max(makespan, schedule[i].end_time);
-
-    // Calculate Sequential Makespan (If we ran all tasks on the single fastest processor)
-    float best_seq_makespan = 1e9f;
-    int best_seq_processor = -1;
-    for (int p = 0; p < P; ++p) {
-        float current_seq = 0.0f;
-        for (int i = 0; i < N; ++i) current_seq += dag.get_comp_cost(i, p);
-        if (current_seq < best_seq_makespan) {
-            best_seq_makespan = current_seq;
-            best_seq_processor = p;
-        }
-    }
-
-    float time_gained = best_seq_makespan - makespan;
-    float speedup = best_seq_makespan / makespan;
-
-    cout << "--- METRICS REPORT ---\n";
-    cout << "Sequential Time (CPU " << best_seq_processor << "): " << best_seq_makespan << " units\n";
-    cout << "Parallel PEFT Makespan:    " << makespan << " units\n";
-    cout << "Total Time Gained:         " << time_gained << " units\n";
-    cout << "Overall Speedup:           " << speedup << "x\n";
-    cout << "----------------------\n";
-
-    // Generate visualization only for small graphs
-    if (N <= 50) {
-        cout << "\nGraph size is small (N <= 50). Generating Graphviz DOT files...\n";
-        export_dag_to_dot(dag, "dag_raw.dot");
-        export_schedule_to_dot(dag, schedule, "dag_scheduled.dot");
-        
-        cout << "Saved 'dag_raw.dot' and 'dag_scheduled.dot'.\n";
-        cout << "To render images, run the following commands in your terminal:\n";
-        cout << "  dot -Tpng dag_raw.dot -o dag_raw.png\n";
-        cout << "  dot -Tpng dag_scheduled.dot -o dag_scheduled.png\n";
-    }
-
-
-    return 0;
-}