Cleanup: add clarifying comments for recent NUMA fixes.
authorBrecht Van Lommel <brechtvanlommel@gmail.com>
Mon, 21 Jan 2019 09:51:19 +0000 (10:51 +0100)
committerBrecht Van Lommel <brechtvanlommel@gmail.com>
Mon, 21 Jan 2019 09:54:19 +0000 (10:54 +0100)
intern/cycles/util/util_task.cpp
intern/numaapi/source/numaapi_win32.c

index 6260d8d13aba84b72df4baa2fda256b9d523dea8..2a705c2432bc76361312734c0e206227902123c1 100644 (file)
@@ -223,10 +223,10 @@ int get_num_total_processors(const vector<int>& num_per_node_processors)
        return num_total_processors;
 }
 
-/* Assign every thread a node on which is should be running, for the best
- * performance. */
+/* Compute NUMA node for every thread to run on, for the best performance. */
 vector<int> distribute_threads_on_nodes(const int num_threads)
 {
+       /* Start with all threads unassigned to any specific NUMA node. */
        vector<int> thread_nodes(num_threads, -1);
        const int num_active_group_processors =
                system_cpu_num_active_group_processors();
index 8f1137a7bea9f57c0f1a7eb36f4c80896680c48a..bd3707076560bf8dec28bd871ff8d192fb9dab6b 100644 (file)
@@ -165,6 +165,7 @@ NUMAAPI_Result numaAPI_Initialize(void) {
 
 static int countNumSetBits(ULONGLONG mask) {
   // TODO(sergey): There might be faster way calculating number of set bits.
+  // NOTE: mask must be unsigned, there is undefined behavior for signed ints.
   int num_bits = 0;
   while (mask != 0) {
     num_bits += (mask & 1);