| [1963] | 1 |  | 
|---|
 | 2 | /*************************************************************************************************** | 
|---|
 | 3 | ** | 
|---|
 | 4 | ** Real-Time Hierarchical Profiling for Game Programming Gems 3 | 
|---|
 | 5 | ** | 
|---|
 | 6 | ** by Greg Hjelstrom & Byon Garrabrant | 
|---|
 | 7 | ** | 
|---|
 | 8 | ***************************************************************************************************/ | 
|---|
 | 9 |  | 
|---|
 | 10 | // Credits: The Clock class was inspired by the Timer classes in  | 
|---|
 | 11 | // Ogre (www.ogre3d.org). | 
|---|
 | 12 |  | 
|---|
| [2430] | 13 |  | 
|---|
 | 14 |  | 
|---|
| [1963] | 15 | #ifndef QUICK_PROF_H | 
|---|
 | 16 | #define QUICK_PROF_H | 
|---|
 | 17 |  | 
|---|
| [2430] | 18 | //To disable built-in profiling, please comment out next line | 
|---|
 | 19 | //#define BT_NO_PROFILE 1 | 
|---|
 | 20 | #ifndef BT_NO_PROFILE | 
|---|
 | 21 |  | 
|---|
| [1963] | 22 | #include "btScalar.h" | 
|---|
 | 23 | #include "LinearMath/btAlignedAllocator.h" | 
|---|
 | 24 | #include <new> | 
|---|
 | 25 |  | 
|---|
 | 26 |  | 
|---|
| [2430] | 27 |  | 
|---|
 | 28 |  | 
|---|
| [1963] | 29 | //if you don't need btClock, you can comment next line | 
|---|
 | 30 | #define USE_BT_CLOCK 1 | 
|---|
 | 31 |  | 
|---|
 | 32 | #ifdef USE_BT_CLOCK | 
|---|
 | 33 | #ifdef __CELLOS_LV2__ | 
|---|
 | 34 | #include <sys/sys_time.h> | 
|---|
 | 35 | #include <sys/time_util.h> | 
|---|
 | 36 | #include <stdio.h> | 
|---|
 | 37 | #endif | 
|---|
 | 38 |  | 
|---|
 | 39 | #if defined (SUNOS) || defined (__SUNOS__)  | 
|---|
 | 40 | #include <stdio.h>  | 
|---|
 | 41 | #endif | 
|---|
 | 42 |  | 
|---|
 | 43 | #if defined(WIN32) || defined(_WIN32) | 
|---|
 | 44 |  | 
|---|
 | 45 | #define USE_WINDOWS_TIMERS  | 
|---|
 | 46 | #define WIN32_LEAN_AND_MEAN  | 
|---|
 | 47 | #define NOWINRES  | 
|---|
 | 48 | #define NOMCX  | 
|---|
 | 49 | #define NOIME  | 
|---|
 | 50 | #ifdef _XBOX | 
|---|
 | 51 | #include <Xtl.h> | 
|---|
 | 52 | #else | 
|---|
 | 53 | #include <windows.h> | 
|---|
 | 54 | #endif | 
|---|
 | 55 | #include <time.h> | 
|---|
 | 56 |  | 
|---|
 | 57 | #else | 
|---|
 | 58 | #include <sys/time.h> | 
|---|
 | 59 | #endif | 
|---|
 | 60 |  | 
|---|
 | 61 | #define mymin(a,b) (a > b ? a : b) | 
|---|
 | 62 |  | 
|---|
 | 63 | ///The btClock is a portable basic clock that measures accurate time in seconds, use for profiling. | 
|---|
 | 64 | class btClock | 
|---|
 | 65 | { | 
|---|
 | 66 | public: | 
|---|
 | 67 |         btClock() | 
|---|
 | 68 |         { | 
|---|
 | 69 | #ifdef USE_WINDOWS_TIMERS | 
|---|
 | 70 |                 QueryPerformanceFrequency(&mClockFrequency); | 
|---|
 | 71 | #endif | 
|---|
 | 72 |                 reset(); | 
|---|
 | 73 |         } | 
|---|
 | 74 |  | 
|---|
 | 75 |         ~btClock() | 
|---|
 | 76 |         { | 
|---|
 | 77 |         } | 
|---|
 | 78 |  | 
|---|
 | 79 |         /// Resets the initial reference time. | 
|---|
 | 80 |         void reset() | 
|---|
 | 81 |         { | 
|---|
 | 82 | #ifdef USE_WINDOWS_TIMERS | 
|---|
 | 83 |                 QueryPerformanceCounter(&mStartTime); | 
|---|
 | 84 |                 mStartTick = GetTickCount(); | 
|---|
 | 85 |                 mPrevElapsedTime = 0; | 
|---|
 | 86 | #else | 
|---|
 | 87 | #ifdef __CELLOS_LV2__ | 
|---|
 | 88 |  | 
|---|
 | 89 |                 typedef uint64_t  ClockSize; | 
|---|
 | 90 |                 ClockSize newTime; | 
|---|
 | 91 |                 //__asm __volatile__( "mftb %0" : "=r" (newTime) : : "memory"); | 
|---|
 | 92 |                 SYS_TIMEBASE_GET( newTime ); | 
|---|
 | 93 |                 mStartTime = newTime; | 
|---|
 | 94 | #else | 
|---|
 | 95 |                 gettimeofday(&mStartTime, 0); | 
|---|
 | 96 | #endif | 
|---|
 | 97 |  | 
|---|
 | 98 | #endif | 
|---|
 | 99 |         } | 
|---|
 | 100 |  | 
|---|
 | 101 |         /// Returns the time in ms since the last call to reset or since  | 
|---|
 | 102 |         /// the btClock was created. | 
|---|
 | 103 |         unsigned long int getTimeMilliseconds() | 
|---|
 | 104 |         { | 
|---|
 | 105 | #ifdef USE_WINDOWS_TIMERS | 
|---|
 | 106 |                 LARGE_INTEGER currentTime; | 
|---|
 | 107 |                 QueryPerformanceCounter(¤tTime); | 
|---|
 | 108 |                 LONGLONG elapsedTime = currentTime.QuadPart -  | 
|---|
 | 109 |                         mStartTime.QuadPart; | 
|---|
 | 110 |  | 
|---|
 | 111 |                 // Compute the number of millisecond ticks elapsed. | 
|---|
 | 112 |                 unsigned long msecTicks = (unsigned long)(1000 * elapsedTime /  | 
|---|
 | 113 |                         mClockFrequency.QuadPart); | 
|---|
 | 114 |  | 
|---|
 | 115 |                 // Check for unexpected leaps in the Win32 performance counter.   | 
|---|
 | 116 |                 // (This is caused by unexpected data across the PCI to ISA  | 
|---|
 | 117 |                 // bridge, aka south bridge.  See Microsoft KB274323.) | 
|---|
 | 118 |                 unsigned long elapsedTicks = GetTickCount() - mStartTick; | 
|---|
 | 119 |                 signed long msecOff = (signed long)(msecTicks - elapsedTicks); | 
|---|
 | 120 |                 if (msecOff < -100 || msecOff > 100) | 
|---|
 | 121 |                 { | 
|---|
 | 122 |                         // Adjust the starting time forwards. | 
|---|
 | 123 |                         LONGLONG msecAdjustment = mymin(msecOff *  | 
|---|
 | 124 |                                 mClockFrequency.QuadPart / 1000, elapsedTime -  | 
|---|
 | 125 |                                 mPrevElapsedTime); | 
|---|
 | 126 |                         mStartTime.QuadPart += msecAdjustment; | 
|---|
 | 127 |                         elapsedTime -= msecAdjustment; | 
|---|
 | 128 |  | 
|---|
 | 129 |                         // Recompute the number of millisecond ticks elapsed. | 
|---|
 | 130 |                         msecTicks = (unsigned long)(1000 * elapsedTime /  | 
|---|
 | 131 |                                 mClockFrequency.QuadPart); | 
|---|
 | 132 |                 } | 
|---|
 | 133 |  | 
|---|
 | 134 |                 // Store the current elapsed time for adjustments next time. | 
|---|
 | 135 |                 mPrevElapsedTime = elapsedTime; | 
|---|
 | 136 |  | 
|---|
 | 137 |                 return msecTicks; | 
|---|
 | 138 | #else | 
|---|
 | 139 |  | 
|---|
 | 140 | #ifdef __CELLOS_LV2__ | 
|---|
 | 141 |                 uint64_t freq=sys_time_get_timebase_frequency(); | 
|---|
 | 142 |                 double dFreq=((double) freq) / 1000.0; | 
|---|
 | 143 |                 typedef uint64_t  ClockSize; | 
|---|
 | 144 |                 ClockSize newTime; | 
|---|
 | 145 |                 SYS_TIMEBASE_GET( newTime ); | 
|---|
 | 146 |                 //__asm __volatile__( "mftb %0" : "=r" (newTime) : : "memory"); | 
|---|
 | 147 |  | 
|---|
 | 148 |                 return (unsigned long int)((double(newTime-mStartTime)) / dFreq); | 
|---|
 | 149 | #else | 
|---|
 | 150 |  | 
|---|
 | 151 |                 struct timeval currentTime; | 
|---|
 | 152 |                 gettimeofday(¤tTime, 0); | 
|---|
 | 153 |                 return (currentTime.tv_sec - mStartTime.tv_sec) * 1000 +  | 
|---|
 | 154 |                         (currentTime.tv_usec - mStartTime.tv_usec) / 1000; | 
|---|
 | 155 | #endif //__CELLOS_LV2__ | 
|---|
 | 156 | #endif | 
|---|
 | 157 |         } | 
|---|
 | 158 |  | 
|---|
 | 159 |         /// Returns the time in us since the last call to reset or since  | 
|---|
 | 160 |         /// the Clock was created. | 
|---|
 | 161 |         unsigned long int getTimeMicroseconds() | 
|---|
 | 162 |         { | 
|---|
 | 163 | #ifdef USE_WINDOWS_TIMERS | 
|---|
 | 164 |                 LARGE_INTEGER currentTime; | 
|---|
 | 165 |                 QueryPerformanceCounter(¤tTime); | 
|---|
 | 166 |                 LONGLONG elapsedTime = currentTime.QuadPart -  | 
|---|
 | 167 |                         mStartTime.QuadPart; | 
|---|
 | 168 |  | 
|---|
 | 169 |                 // Compute the number of millisecond ticks elapsed. | 
|---|
 | 170 |                 unsigned long msecTicks = (unsigned long)(1000 * elapsedTime /  | 
|---|
 | 171 |                         mClockFrequency.QuadPart); | 
|---|
 | 172 |  | 
|---|
 | 173 |                 // Check for unexpected leaps in the Win32 performance counter.   | 
|---|
 | 174 |                 // (This is caused by unexpected data across the PCI to ISA  | 
|---|
 | 175 |                 // bridge, aka south bridge.  See Microsoft KB274323.) | 
|---|
 | 176 |                 unsigned long elapsedTicks = GetTickCount() - mStartTick; | 
|---|
 | 177 |                 signed long msecOff = (signed long)(msecTicks - elapsedTicks); | 
|---|
 | 178 |                 if (msecOff < -100 || msecOff > 100) | 
|---|
 | 179 |                 { | 
|---|
 | 180 |                         // Adjust the starting time forwards. | 
|---|
 | 181 |                         LONGLONG msecAdjustment = mymin(msecOff *  | 
|---|
 | 182 |                                 mClockFrequency.QuadPart / 1000, elapsedTime -  | 
|---|
 | 183 |                                 mPrevElapsedTime); | 
|---|
 | 184 |                         mStartTime.QuadPart += msecAdjustment; | 
|---|
 | 185 |                         elapsedTime -= msecAdjustment; | 
|---|
 | 186 |                 } | 
|---|
 | 187 |  | 
|---|
 | 188 |                 // Store the current elapsed time for adjustments next time. | 
|---|
 | 189 |                 mPrevElapsedTime = elapsedTime; | 
|---|
 | 190 |  | 
|---|
 | 191 |                 // Convert to microseconds. | 
|---|
 | 192 |                 unsigned long usecTicks = (unsigned long)(1000000 * elapsedTime /  | 
|---|
 | 193 |                         mClockFrequency.QuadPart); | 
|---|
 | 194 |  | 
|---|
 | 195 |                 return usecTicks; | 
|---|
 | 196 | #else | 
|---|
 | 197 |  | 
|---|
 | 198 | #ifdef __CELLOS_LV2__ | 
|---|
 | 199 |                 uint64_t freq=sys_time_get_timebase_frequency(); | 
|---|
 | 200 |                 double dFreq=((double) freq)/ 1000000.0; | 
|---|
 | 201 |                 typedef uint64_t  ClockSize; | 
|---|
 | 202 |                 ClockSize newTime; | 
|---|
 | 203 |                 //__asm __volatile__( "mftb %0" : "=r" (newTime) : : "memory"); | 
|---|
 | 204 |                 SYS_TIMEBASE_GET( newTime ); | 
|---|
 | 205 |  | 
|---|
 | 206 |                 return (unsigned long int)((double(newTime-mStartTime)) / dFreq); | 
|---|
 | 207 | #else | 
|---|
 | 208 |  | 
|---|
 | 209 |                 struct timeval currentTime; | 
|---|
 | 210 |                 gettimeofday(¤tTime, 0); | 
|---|
 | 211 |                 return (currentTime.tv_sec - mStartTime.tv_sec) * 1000000 +  | 
|---|
 | 212 |                         (currentTime.tv_usec - mStartTime.tv_usec); | 
|---|
 | 213 | #endif//__CELLOS_LV2__ | 
|---|
 | 214 | #endif  | 
|---|
 | 215 |         } | 
|---|
 | 216 |  | 
|---|
 | 217 | private: | 
|---|
 | 218 | #ifdef USE_WINDOWS_TIMERS | 
|---|
 | 219 |         LARGE_INTEGER mClockFrequency; | 
|---|
 | 220 |         DWORD mStartTick; | 
|---|
 | 221 |         LONGLONG mPrevElapsedTime; | 
|---|
 | 222 |         LARGE_INTEGER mStartTime; | 
|---|
 | 223 | #else | 
|---|
 | 224 | #ifdef __CELLOS_LV2__ | 
|---|
 | 225 |         uint64_t        mStartTime; | 
|---|
 | 226 | #else | 
|---|
 | 227 |         struct timeval mStartTime; | 
|---|
 | 228 | #endif | 
|---|
 | 229 | #endif //__CELLOS_LV2__ | 
|---|
 | 230 |  | 
|---|
 | 231 | }; | 
|---|
 | 232 |  | 
|---|
 | 233 | #endif //USE_BT_CLOCK | 
|---|
 | 234 |  | 
|---|
 | 235 |  | 
|---|
 | 236 |  | 
|---|
 | 237 |  | 
|---|
 | 238 | ///A node in the Profile Hierarchy Tree | 
|---|
 | 239 | class   CProfileNode { | 
|---|
 | 240 |  | 
|---|
 | 241 | public: | 
|---|
 | 242 |         CProfileNode( const char * name, CProfileNode * parent ); | 
|---|
 | 243 |         ~CProfileNode( void ); | 
|---|
 | 244 |  | 
|---|
 | 245 |         CProfileNode * Get_Sub_Node( const char * name ); | 
|---|
 | 246 |  | 
|---|
 | 247 |         CProfileNode * Get_Parent( void )               { return Parent; } | 
|---|
 | 248 |         CProfileNode * Get_Sibling( void )              { return Sibling; } | 
|---|
 | 249 |         CProfileNode * Get_Child( void )                        { return Child; } | 
|---|
 | 250 |  | 
|---|
 | 251 |         void                            CleanupMemory(); | 
|---|
 | 252 |         void                            Reset( void ); | 
|---|
 | 253 |         void                            Call( void ); | 
|---|
 | 254 |         bool                            Return( void ); | 
|---|
 | 255 |  | 
|---|
 | 256 |         const char *    Get_Name( void )                                { return Name; } | 
|---|
 | 257 |         int                             Get_Total_Calls( void )         { return TotalCalls; } | 
|---|
 | 258 |         float                           Get_Total_Time( void )          { return TotalTime; } | 
|---|
 | 259 |  | 
|---|
 | 260 | protected: | 
|---|
 | 261 |  | 
|---|
 | 262 |         const char *    Name; | 
|---|
 | 263 |         int                             TotalCalls; | 
|---|
 | 264 |         float                           TotalTime; | 
|---|
 | 265 |         unsigned long int                       StartTime; | 
|---|
 | 266 |         int                             RecursionCounter; | 
|---|
 | 267 |  | 
|---|
 | 268 |         CProfileNode *  Parent; | 
|---|
 | 269 |         CProfileNode *  Child; | 
|---|
 | 270 |         CProfileNode *  Sibling; | 
|---|
 | 271 | }; | 
|---|
 | 272 |  | 
|---|
 | 273 | ///An iterator to navigate through the tree | 
|---|
 | 274 | class CProfileIterator | 
|---|
 | 275 | { | 
|---|
 | 276 | public: | 
|---|
 | 277 |         // Access all the children of the current parent | 
|---|
 | 278 |         void                            First(void); | 
|---|
 | 279 |         void                            Next(void); | 
|---|
 | 280 |         bool                            Is_Done(void); | 
|---|
 | 281 |         bool                Is_Root(void) { return (CurrentParent->Get_Parent() == 0); } | 
|---|
 | 282 |  | 
|---|
 | 283 |         void                            Enter_Child( int index );               // Make the given child the new parent | 
|---|
 | 284 |         void                            Enter_Largest_Child( void );    // Make the largest child the new parent | 
|---|
 | 285 |         void                            Enter_Parent( void );                   // Make the current parent's parent the new parent | 
|---|
 | 286 |  | 
|---|
 | 287 |         // Access the current child | 
|---|
 | 288 |         const char *    Get_Current_Name( void )                        { return CurrentChild->Get_Name(); } | 
|---|
 | 289 |         int                             Get_Current_Total_Calls( void ) { return CurrentChild->Get_Total_Calls(); } | 
|---|
 | 290 |         float                           Get_Current_Total_Time( void )  { return CurrentChild->Get_Total_Time(); } | 
|---|
 | 291 |  | 
|---|
 | 292 |         // Access the current parent | 
|---|
 | 293 |         const char *    Get_Current_Parent_Name( void )                 { return CurrentParent->Get_Name(); } | 
|---|
 | 294 |         int                             Get_Current_Parent_Total_Calls( void )  { return CurrentParent->Get_Total_Calls(); } | 
|---|
 | 295 |         float                           Get_Current_Parent_Total_Time( void )   { return CurrentParent->Get_Total_Time(); } | 
|---|
 | 296 |  | 
|---|
 | 297 | protected: | 
|---|
 | 298 |  | 
|---|
 | 299 |         CProfileNode *  CurrentParent; | 
|---|
 | 300 |         CProfileNode *  CurrentChild; | 
|---|
 | 301 |  | 
|---|
 | 302 |         CProfileIterator( CProfileNode * start ); | 
|---|
 | 303 |         friend  class           CProfileManager; | 
|---|
 | 304 | }; | 
|---|
 | 305 |  | 
|---|
 | 306 |  | 
|---|
 | 307 | ///The Manager for the Profile system | 
|---|
 | 308 | class   CProfileManager { | 
|---|
 | 309 | public: | 
|---|
 | 310 |         static  void                                            Start_Profile( const char * name ); | 
|---|
 | 311 |         static  void                                            Stop_Profile( void ); | 
|---|
 | 312 |  | 
|---|
 | 313 |         static  void                                            CleanupMemory(void) | 
|---|
 | 314 |         { | 
|---|
 | 315 |                 Root.CleanupMemory(); | 
|---|
 | 316 |         } | 
|---|
 | 317 |  | 
|---|
 | 318 |         static  void                                            Reset( void ); | 
|---|
 | 319 |         static  void                                            Increment_Frame_Counter( void ); | 
|---|
 | 320 |         static  int                                             Get_Frame_Count_Since_Reset( void )             { return FrameCounter; } | 
|---|
 | 321 |         static  float                                           Get_Time_Since_Reset( void ); | 
|---|
 | 322 |  | 
|---|
 | 323 |         static  CProfileIterator *      Get_Iterator( void )     | 
|---|
 | 324 |         {  | 
|---|
 | 325 |                  | 
|---|
 | 326 |                 return new CProfileIterator( &Root );  | 
|---|
 | 327 |         } | 
|---|
 | 328 |         static  void                                            Release_Iterator( CProfileIterator * iterator ) { delete ( iterator); } | 
|---|
 | 329 |  | 
|---|
| [2430] | 330 |         static void     dumpRecursive(CProfileIterator* profileIterator, int spacing); | 
|---|
 | 331 |  | 
|---|
 | 332 |         static void     dumpAll(); | 
|---|
 | 333 |  | 
|---|
| [1963] | 334 | private: | 
|---|
 | 335 |         static  CProfileNode                    Root; | 
|---|
 | 336 |         static  CProfileNode *                  CurrentNode; | 
|---|
 | 337 |         static  int                                             FrameCounter; | 
|---|
 | 338 |         static  unsigned long int                                       ResetTime; | 
|---|
 | 339 | }; | 
|---|
 | 340 |  | 
|---|
 | 341 |  | 
|---|
 | 342 | ///ProfileSampleClass is a simple way to profile a function's scope | 
|---|
 | 343 | ///Use the BT_PROFILE macro at the start of scope to time | 
|---|
 | 344 | class   CProfileSample { | 
|---|
 | 345 | public: | 
|---|
 | 346 |         CProfileSample( const char * name ) | 
|---|
 | 347 |         {  | 
|---|
 | 348 |                 CProfileManager::Start_Profile( name );  | 
|---|
 | 349 |         } | 
|---|
 | 350 |  | 
|---|
 | 351 |         ~CProfileSample( void )                                  | 
|---|
 | 352 |         {  | 
|---|
 | 353 |                 CProfileManager::Stop_Profile();  | 
|---|
 | 354 |         } | 
|---|
 | 355 | }; | 
|---|
 | 356 |  | 
|---|
| [2430] | 357 |  | 
|---|
| [1963] | 358 | #define BT_PROFILE( name )                      CProfileSample __profile( name ) | 
|---|
| [2430] | 359 |  | 
|---|
| [1963] | 360 | #else | 
|---|
| [2430] | 361 |  | 
|---|
| [1963] | 362 | #define BT_PROFILE( name ) | 
|---|
 | 363 |  | 
|---|
| [2430] | 364 | #endif //#ifndef BT_NO_PROFILE | 
|---|
| [1963] | 365 |  | 
|---|
 | 366 |  | 
|---|
 | 367 |  | 
|---|
 | 368 | #endif //QUICK_PROF_H | 
|---|
 | 369 |  | 
|---|
 | 370 |  | 
|---|