| 1 |  | 
|---|
| 2 | /*************************************************************************************************** | 
|---|
| 3 | ** | 
|---|
| 4 | ** Real-Time Hierarchical Profiling for Game Programming Gems 3 | 
|---|
| 5 | ** | 
|---|
| 6 | ** by Greg Hjelstrom & Byon Garrabrant | 
|---|
| 7 | ** | 
|---|
| 8 | ***************************************************************************************************/ | 
|---|
| 9 |  | 
|---|
| 10 | // Credits: The Clock class was inspired by the Timer classes in  | 
|---|
| 11 | // Ogre (www.ogre3d.org). | 
|---|
| 12 |  | 
|---|
| 13 |  | 
|---|
| 14 |  | 
|---|
| 15 | #ifndef QUICK_PROF_H | 
|---|
| 16 | #define QUICK_PROF_H | 
|---|
| 17 |  | 
|---|
| 18 | //To disable built-in profiling, please comment out next line | 
|---|
| 19 | //#define BT_NO_PROFILE 1 | 
|---|
| 20 | #ifndef BT_NO_PROFILE | 
|---|
| 21 |  | 
|---|
| 22 | #include "btScalar.h" | 
|---|
| 23 | #include "LinearMath/btAlignedAllocator.h" | 
|---|
| 24 | #include <new> | 
|---|
| 25 |  | 
|---|
| 26 |  | 
|---|
| 27 |  | 
|---|
| 28 |  | 
|---|
| 29 | //if you don't need btClock, you can comment next line | 
|---|
| 30 | #define USE_BT_CLOCK 1 | 
|---|
| 31 |  | 
|---|
| 32 | #ifdef USE_BT_CLOCK | 
|---|
| 33 | #ifdef __CELLOS_LV2__ | 
|---|
| 34 | #include <sys/sys_time.h> | 
|---|
| 35 | #include <sys/time_util.h> | 
|---|
| 36 | #include <stdio.h> | 
|---|
| 37 | #endif | 
|---|
| 38 |  | 
|---|
| 39 | #if defined (SUNOS) || defined (__SUNOS__)  | 
|---|
| 40 | #include <stdio.h>  | 
|---|
| 41 | #endif | 
|---|
| 42 |  | 
|---|
| 43 | #if defined(WIN32) || defined(_WIN32) | 
|---|
| 44 |  | 
|---|
| 45 | #define USE_WINDOWS_TIMERS  | 
|---|
| 46 | #define WIN32_LEAN_AND_MEAN  | 
|---|
| 47 | #define NOWINRES  | 
|---|
| 48 | #define NOMCX  | 
|---|
| 49 | #define NOIME  | 
|---|
| 50 | #ifdef _XBOX | 
|---|
| 51 | #include <Xtl.h> | 
|---|
| 52 | #else | 
|---|
| 53 | #include <windows.h> | 
|---|
| 54 | #endif | 
|---|
| 55 | #include <time.h> | 
|---|
| 56 |  | 
|---|
| 57 | #else | 
|---|
| 58 | #include <sys/time.h> | 
|---|
| 59 | #endif | 
|---|
| 60 |  | 
|---|
| 61 | #define mymin(a,b) (a > b ? a : b) | 
|---|
| 62 |  | 
|---|
| 63 | ///The btClock is a portable basic clock that measures accurate time in seconds, use for profiling. | 
|---|
| 64 | class btClock | 
|---|
| 65 | { | 
|---|
| 66 | public: | 
|---|
| 67 |         btClock() | 
|---|
| 68 |         { | 
|---|
| 69 | #ifdef USE_WINDOWS_TIMERS | 
|---|
| 70 |                 QueryPerformanceFrequency(&mClockFrequency); | 
|---|
| 71 | #endif | 
|---|
| 72 |                 reset(); | 
|---|
| 73 |         } | 
|---|
| 74 |  | 
|---|
| 75 |         ~btClock() | 
|---|
| 76 |         { | 
|---|
| 77 |         } | 
|---|
| 78 |  | 
|---|
| 79 |         /// Resets the initial reference time. | 
|---|
| 80 |         void reset() | 
|---|
| 81 |         { | 
|---|
| 82 | #ifdef USE_WINDOWS_TIMERS | 
|---|
| 83 |                 QueryPerformanceCounter(&mStartTime); | 
|---|
| 84 |                 mStartTick = GetTickCount(); | 
|---|
| 85 |                 mPrevElapsedTime = 0; | 
|---|
| 86 | #else | 
|---|
| 87 | #ifdef __CELLOS_LV2__ | 
|---|
| 88 |  | 
|---|
| 89 |                 typedef uint64_t  ClockSize; | 
|---|
| 90 |                 ClockSize newTime; | 
|---|
| 91 |                 //__asm __volatile__( "mftb %0" : "=r" (newTime) : : "memory"); | 
|---|
| 92 |                 SYS_TIMEBASE_GET( newTime ); | 
|---|
| 93 |                 mStartTime = newTime; | 
|---|
| 94 | #else | 
|---|
| 95 |                 gettimeofday(&mStartTime, 0); | 
|---|
| 96 | #endif | 
|---|
| 97 |  | 
|---|
| 98 | #endif | 
|---|
| 99 |         } | 
|---|
| 100 |  | 
|---|
| 101 |         /// Returns the time in ms since the last call to reset or since  | 
|---|
| 102 |         /// the btClock was created. | 
|---|
| 103 |         unsigned long int getTimeMilliseconds() | 
|---|
| 104 |         { | 
|---|
| 105 | #ifdef USE_WINDOWS_TIMERS | 
|---|
| 106 |                 LARGE_INTEGER currentTime; | 
|---|
| 107 |                 QueryPerformanceCounter(¤tTime); | 
|---|
| 108 |                 LONGLONG elapsedTime = currentTime.QuadPart -  | 
|---|
| 109 |                         mStartTime.QuadPart; | 
|---|
| 110 |  | 
|---|
| 111 |                 // Compute the number of millisecond ticks elapsed. | 
|---|
| 112 |                 unsigned long msecTicks = (unsigned long)(1000 * elapsedTime /  | 
|---|
| 113 |                         mClockFrequency.QuadPart); | 
|---|
| 114 |  | 
|---|
| 115 |                 // Check for unexpected leaps in the Win32 performance counter.   | 
|---|
| 116 |                 // (This is caused by unexpected data across the PCI to ISA  | 
|---|
| 117 |                 // bridge, aka south bridge.  See Microsoft KB274323.) | 
|---|
| 118 |                 unsigned long elapsedTicks = GetTickCount() - mStartTick; | 
|---|
| 119 |                 signed long msecOff = (signed long)(msecTicks - elapsedTicks); | 
|---|
| 120 |                 if (msecOff < -100 || msecOff > 100) | 
|---|
| 121 |                 { | 
|---|
| 122 |                         // Adjust the starting time forwards. | 
|---|
| 123 |                         LONGLONG msecAdjustment = mymin(msecOff *  | 
|---|
| 124 |                                 mClockFrequency.QuadPart / 1000, elapsedTime -  | 
|---|
| 125 |                                 mPrevElapsedTime); | 
|---|
| 126 |                         mStartTime.QuadPart += msecAdjustment; | 
|---|
| 127 |                         elapsedTime -= msecAdjustment; | 
|---|
| 128 |  | 
|---|
| 129 |                         // Recompute the number of millisecond ticks elapsed. | 
|---|
| 130 |                         msecTicks = (unsigned long)(1000 * elapsedTime /  | 
|---|
| 131 |                                 mClockFrequency.QuadPart); | 
|---|
| 132 |                 } | 
|---|
| 133 |  | 
|---|
| 134 |                 // Store the current elapsed time for adjustments next time. | 
|---|
| 135 |                 mPrevElapsedTime = elapsedTime; | 
|---|
| 136 |  | 
|---|
| 137 |                 return msecTicks; | 
|---|
| 138 | #else | 
|---|
| 139 |  | 
|---|
| 140 | #ifdef __CELLOS_LV2__ | 
|---|
| 141 |                 uint64_t freq=sys_time_get_timebase_frequency(); | 
|---|
| 142 |                 double dFreq=((double) freq) / 1000.0; | 
|---|
| 143 |                 typedef uint64_t  ClockSize; | 
|---|
| 144 |                 ClockSize newTime; | 
|---|
| 145 |                 SYS_TIMEBASE_GET( newTime ); | 
|---|
| 146 |                 //__asm __volatile__( "mftb %0" : "=r" (newTime) : : "memory"); | 
|---|
| 147 |  | 
|---|
| 148 |                 return (unsigned long int)((double(newTime-mStartTime)) / dFreq); | 
|---|
| 149 | #else | 
|---|
| 150 |  | 
|---|
| 151 |                 struct timeval currentTime; | 
|---|
| 152 |                 gettimeofday(¤tTime, 0); | 
|---|
| 153 |                 return (currentTime.tv_sec - mStartTime.tv_sec) * 1000 +  | 
|---|
| 154 |                         (currentTime.tv_usec - mStartTime.tv_usec) / 1000; | 
|---|
| 155 | #endif //__CELLOS_LV2__ | 
|---|
| 156 | #endif | 
|---|
| 157 |         } | 
|---|
| 158 |  | 
|---|
| 159 |         /// Returns the time in us since the last call to reset or since  | 
|---|
| 160 |         /// the Clock was created. | 
|---|
| 161 |         unsigned long int getTimeMicroseconds() | 
|---|
| 162 |         { | 
|---|
| 163 | #ifdef USE_WINDOWS_TIMERS | 
|---|
| 164 |                 LARGE_INTEGER currentTime; | 
|---|
| 165 |                 QueryPerformanceCounter(¤tTime); | 
|---|
| 166 |                 LONGLONG elapsedTime = currentTime.QuadPart -  | 
|---|
| 167 |                         mStartTime.QuadPart; | 
|---|
| 168 |  | 
|---|
| 169 |                 // Compute the number of millisecond ticks elapsed. | 
|---|
| 170 |                 unsigned long msecTicks = (unsigned long)(1000 * elapsedTime /  | 
|---|
| 171 |                         mClockFrequency.QuadPart); | 
|---|
| 172 |  | 
|---|
| 173 |                 // Check for unexpected leaps in the Win32 performance counter.   | 
|---|
| 174 |                 // (This is caused by unexpected data across the PCI to ISA  | 
|---|
| 175 |                 // bridge, aka south bridge.  See Microsoft KB274323.) | 
|---|
| 176 |                 unsigned long elapsedTicks = GetTickCount() - mStartTick; | 
|---|
| 177 |                 signed long msecOff = (signed long)(msecTicks - elapsedTicks); | 
|---|
| 178 |                 if (msecOff < -100 || msecOff > 100) | 
|---|
| 179 |                 { | 
|---|
| 180 |                         // Adjust the starting time forwards. | 
|---|
| 181 |                         LONGLONG msecAdjustment = mymin(msecOff *  | 
|---|
| 182 |                                 mClockFrequency.QuadPart / 1000, elapsedTime -  | 
|---|
| 183 |                                 mPrevElapsedTime); | 
|---|
| 184 |                         mStartTime.QuadPart += msecAdjustment; | 
|---|
| 185 |                         elapsedTime -= msecAdjustment; | 
|---|
| 186 |                 } | 
|---|
| 187 |  | 
|---|
| 188 |                 // Store the current elapsed time for adjustments next time. | 
|---|
| 189 |                 mPrevElapsedTime = elapsedTime; | 
|---|
| 190 |  | 
|---|
| 191 |                 // Convert to microseconds. | 
|---|
| 192 |                 unsigned long usecTicks = (unsigned long)(1000000 * elapsedTime /  | 
|---|
| 193 |                         mClockFrequency.QuadPart); | 
|---|
| 194 |  | 
|---|
| 195 |                 return usecTicks; | 
|---|
| 196 | #else | 
|---|
| 197 |  | 
|---|
| 198 | #ifdef __CELLOS_LV2__ | 
|---|
| 199 |                 uint64_t freq=sys_time_get_timebase_frequency(); | 
|---|
| 200 |                 double dFreq=((double) freq)/ 1000000.0; | 
|---|
| 201 |                 typedef uint64_t  ClockSize; | 
|---|
| 202 |                 ClockSize newTime; | 
|---|
| 203 |                 //__asm __volatile__( "mftb %0" : "=r" (newTime) : : "memory"); | 
|---|
| 204 |                 SYS_TIMEBASE_GET( newTime ); | 
|---|
| 205 |  | 
|---|
| 206 |                 return (unsigned long int)((double(newTime-mStartTime)) / dFreq); | 
|---|
| 207 | #else | 
|---|
| 208 |  | 
|---|
| 209 |                 struct timeval currentTime; | 
|---|
| 210 |                 gettimeofday(¤tTime, 0); | 
|---|
| 211 |                 return (currentTime.tv_sec - mStartTime.tv_sec) * 1000000 +  | 
|---|
| 212 |                         (currentTime.tv_usec - mStartTime.tv_usec); | 
|---|
| 213 | #endif//__CELLOS_LV2__ | 
|---|
| 214 | #endif  | 
|---|
| 215 |         } | 
|---|
| 216 |  | 
|---|
| 217 | private: | 
|---|
| 218 | #ifdef USE_WINDOWS_TIMERS | 
|---|
| 219 |         LARGE_INTEGER mClockFrequency; | 
|---|
| 220 |         DWORD mStartTick; | 
|---|
| 221 |         LONGLONG mPrevElapsedTime; | 
|---|
| 222 |         LARGE_INTEGER mStartTime; | 
|---|
| 223 | #else | 
|---|
| 224 | #ifdef __CELLOS_LV2__ | 
|---|
| 225 |         uint64_t        mStartTime; | 
|---|
| 226 | #else | 
|---|
| 227 |         struct timeval mStartTime; | 
|---|
| 228 | #endif | 
|---|
| 229 | #endif //__CELLOS_LV2__ | 
|---|
| 230 |  | 
|---|
| 231 | }; | 
|---|
| 232 |  | 
|---|
| 233 | #endif //USE_BT_CLOCK | 
|---|
| 234 |  | 
|---|
| 235 |  | 
|---|
| 236 |  | 
|---|
| 237 |  | 
|---|
| 238 | ///A node in the Profile Hierarchy Tree | 
|---|
| 239 | class   CProfileNode { | 
|---|
| 240 |  | 
|---|
| 241 | public: | 
|---|
| 242 |         CProfileNode( const char * name, CProfileNode * parent ); | 
|---|
| 243 |         ~CProfileNode( void ); | 
|---|
| 244 |  | 
|---|
| 245 |         CProfileNode * Get_Sub_Node( const char * name ); | 
|---|
| 246 |  | 
|---|
| 247 |         CProfileNode * Get_Parent( void )               { return Parent; } | 
|---|
| 248 |         CProfileNode * Get_Sibling( void )              { return Sibling; } | 
|---|
| 249 |         CProfileNode * Get_Child( void )                        { return Child; } | 
|---|
| 250 |  | 
|---|
| 251 |         void                            CleanupMemory(); | 
|---|
| 252 |         void                            Reset( void ); | 
|---|
| 253 |         void                            Call( void ); | 
|---|
| 254 |         bool                            Return( void ); | 
|---|
| 255 |  | 
|---|
| 256 |         const char *    Get_Name( void )                                { return Name; } | 
|---|
| 257 |         int                             Get_Total_Calls( void )         { return TotalCalls; } | 
|---|
| 258 |         float                           Get_Total_Time( void )          { return TotalTime; } | 
|---|
| 259 |  | 
|---|
| 260 | protected: | 
|---|
| 261 |  | 
|---|
| 262 |         const char *    Name; | 
|---|
| 263 |         int                             TotalCalls; | 
|---|
| 264 |         float                           TotalTime; | 
|---|
| 265 |         unsigned long int                       StartTime; | 
|---|
| 266 |         int                             RecursionCounter; | 
|---|
| 267 |  | 
|---|
| 268 |         CProfileNode *  Parent; | 
|---|
| 269 |         CProfileNode *  Child; | 
|---|
| 270 |         CProfileNode *  Sibling; | 
|---|
| 271 | }; | 
|---|
| 272 |  | 
|---|
| 273 | ///An iterator to navigate through the tree | 
|---|
| 274 | class CProfileIterator | 
|---|
| 275 | { | 
|---|
| 276 | public: | 
|---|
| 277 |         // Access all the children of the current parent | 
|---|
| 278 |         void                            First(void); | 
|---|
| 279 |         void                            Next(void); | 
|---|
| 280 |         bool                            Is_Done(void); | 
|---|
| 281 |         bool                Is_Root(void) { return (CurrentParent->Get_Parent() == 0); } | 
|---|
| 282 |  | 
|---|
| 283 |         void                            Enter_Child( int index );               // Make the given child the new parent | 
|---|
| 284 |         void                            Enter_Largest_Child( void );    // Make the largest child the new parent | 
|---|
| 285 |         void                            Enter_Parent( void );                   // Make the current parent's parent the new parent | 
|---|
| 286 |  | 
|---|
| 287 |         // Access the current child | 
|---|
| 288 |         const char *    Get_Current_Name( void )                        { return CurrentChild->Get_Name(); } | 
|---|
| 289 |         int                             Get_Current_Total_Calls( void ) { return CurrentChild->Get_Total_Calls(); } | 
|---|
| 290 |         float                           Get_Current_Total_Time( void )  { return CurrentChild->Get_Total_Time(); } | 
|---|
| 291 |  | 
|---|
| 292 |         // Access the current parent | 
|---|
| 293 |         const char *    Get_Current_Parent_Name( void )                 { return CurrentParent->Get_Name(); } | 
|---|
| 294 |         int                             Get_Current_Parent_Total_Calls( void )  { return CurrentParent->Get_Total_Calls(); } | 
|---|
| 295 |         float                           Get_Current_Parent_Total_Time( void )   { return CurrentParent->Get_Total_Time(); } | 
|---|
| 296 |  | 
|---|
| 297 | protected: | 
|---|
| 298 |  | 
|---|
| 299 |         CProfileNode *  CurrentParent; | 
|---|
| 300 |         CProfileNode *  CurrentChild; | 
|---|
| 301 |  | 
|---|
| 302 |         CProfileIterator( CProfileNode * start ); | 
|---|
| 303 |         friend  class           CProfileManager; | 
|---|
| 304 | }; | 
|---|
| 305 |  | 
|---|
| 306 |  | 
|---|
| 307 | ///The Manager for the Profile system | 
|---|
| 308 | class   CProfileManager { | 
|---|
| 309 | public: | 
|---|
| 310 |         static  void                                            Start_Profile( const char * name ); | 
|---|
| 311 |         static  void                                            Stop_Profile( void ); | 
|---|
| 312 |  | 
|---|
| 313 |         static  void                                            CleanupMemory(void) | 
|---|
| 314 |         { | 
|---|
| 315 |                 Root.CleanupMemory(); | 
|---|
| 316 |         } | 
|---|
| 317 |  | 
|---|
| 318 |         static  void                                            Reset( void ); | 
|---|
| 319 |         static  void                                            Increment_Frame_Counter( void ); | 
|---|
| 320 |         static  int                                             Get_Frame_Count_Since_Reset( void )             { return FrameCounter; } | 
|---|
| 321 |         static  float                                           Get_Time_Since_Reset( void ); | 
|---|
| 322 |  | 
|---|
| 323 |         static  CProfileIterator *      Get_Iterator( void )     | 
|---|
| 324 |         {  | 
|---|
| 325 |                  | 
|---|
| 326 |                 return new CProfileIterator( &Root );  | 
|---|
| 327 |         } | 
|---|
| 328 |         static  void                                            Release_Iterator( CProfileIterator * iterator ) { delete ( iterator); } | 
|---|
| 329 |  | 
|---|
| 330 |         static void     dumpRecursive(CProfileIterator* profileIterator, int spacing); | 
|---|
| 331 |  | 
|---|
| 332 |         static void     dumpAll(); | 
|---|
| 333 |  | 
|---|
| 334 | private: | 
|---|
| 335 |         static  CProfileNode                    Root; | 
|---|
| 336 |         static  CProfileNode *                  CurrentNode; | 
|---|
| 337 |         static  int                                             FrameCounter; | 
|---|
| 338 |         static  unsigned long int                                       ResetTime; | 
|---|
| 339 | }; | 
|---|
| 340 |  | 
|---|
| 341 |  | 
|---|
| 342 | ///ProfileSampleClass is a simple way to profile a function's scope | 
|---|
| 343 | ///Use the BT_PROFILE macro at the start of scope to time | 
|---|
| 344 | class   CProfileSample { | 
|---|
| 345 | public: | 
|---|
| 346 |         CProfileSample( const char * name ) | 
|---|
| 347 |         {  | 
|---|
| 348 |                 CProfileManager::Start_Profile( name );  | 
|---|
| 349 |         } | 
|---|
| 350 |  | 
|---|
| 351 |         ~CProfileSample( void )                                  | 
|---|
| 352 |         {  | 
|---|
| 353 |                 CProfileManager::Stop_Profile();  | 
|---|
| 354 |         } | 
|---|
| 355 | }; | 
|---|
| 356 |  | 
|---|
| 357 |  | 
|---|
| 358 | #define BT_PROFILE( name )                      CProfileSample __profile( name ) | 
|---|
| 359 |  | 
|---|
| 360 | #else | 
|---|
| 361 |  | 
|---|
| 362 | #define BT_PROFILE( name ) | 
|---|
| 363 |  | 
|---|
| 364 | #endif //#ifndef BT_NO_PROFILE | 
|---|
| 365 |  | 
|---|
| 366 |  | 
|---|
| 367 |  | 
|---|
| 368 | #endif //QUICK_PROF_H | 
|---|
| 369 |  | 
|---|
| 370 |  | 
|---|