Direct3D 12 予習(1)


 1.はじめに…
先日,Windows 10 Technical Previewがインストールできるようになり,ようやくDirect3D 12が触れるようになりました。
触れるといっても正式版ではないのでAPIは大幅に変更される可能性もあります。そんなわけで,予習と題してプレビュー版を少し触ってDirect3D 12がどんなものかを勉強していくことにしてみます。




 2.Direct3D 12とは
Direct3D 12は久しぶりのDirectXのメジャーバージョンアップになります。詳しい説明はビデオを見て頂くのが良いかと思います。

DirectX:Evolving Microsoft's Graphics Platform
https://channel9.msdn.com/Blogs/DirectX-Developer-Blog/DirectX-Evolving-Microsoft-s-Graphics-Platform?wt.mc_id=player
Direct3D 12 API Preview
http://channel9.msdn.com/events/Build/2014/3-564

あとは,4gamerとかにわかりやすく説明されているので,そちらを参照してください。
Direct3D 12ですが,11と比べて何が良いかというとドローコールによるCPU側の負荷が減るというメリットがある反面,いままでドライバーがやっていた部分をアプリケーション側で制御する必要があり,APIがPS4やXB1のようにコンシューマーライクなAPIになるのでコーディングが若干面倒くさくなるといったデメリットがあります。
正式版が出ていない状況なので,今回は省略しDirect3D 12の正式版がリリースされたらその辺の話をしようと思います。
…というか自分自身がまだよくわかっとらんのですよ。
ちなみに,MSDNにドキュメントも上がっていますが若干APIが無いもの等あるので注意してください。

Direct3D 12 Graphics
https://msdn.microsoft.com/en-us/library/dn903821%28v=vs.85%29.aspx


 3.初期化処理
まずは,レンダーターゲットをクリアするプログラムまでを書いてみます。
初期化部分の説明から始めていきます。今回のサンプルは本当に画面をクリアするだけなのでパイプラインステートオブジェクトやルートシグネチャは使わないので,初期化は下記のような流れになります。

まずは,デバイスを作成します。これはDirect3D 11と同じですね。
つづいて,Direct3D 11のDeviceContextにあたる部分を生成していきます。Direct3D 11ではDeviceContextという形で色々隠ぺいしてくれていましたが,Direct3D 12では,CommandQueue, CommandAllocator, CommandListなどが対応するものとなります。
今回はDirect3D 11スタイルでやっていくので,これらはD3D12_COMMAND_LIST_TYPE_DIRECTを指定作っておきます。Bundleについて別の機会で説明しますので,ここでは特に触れずに,コマンドバッファに直済みしていくD3D12_COMMAND_LIST_TYPE_DIRECTを設定しておきます。
あと注意してほしいのは,CreateSwapChain()ですが,Direct3D 11のように第1引数にDeviceを設定するとエラーログが表示され正しくない設定だと怒られます(参考)。ひげねこさんによる説明だとCommnadQueueを渡せばよいということだそうです。
実際のコードは下記のようになります。
00181:  //-------------------------------------------------------------------------------------------------
00182:  //      D3D12の初期化処理です.
00183:  //-------------------------------------------------------------------------------------------------
00184:  bool App::InitD3D()
00185:  {
00186:      HRESULT hr = S_OK;
00187:  
00188:      // ウィンドウ幅を取得.
00189:      RECT rc;
00190:      GetClientRect( m_hWnd, &rc );
00191:      u32 w = rc.right - rc.left;
00192:      u32 h = rc.bottom - rc.top;
00193:  
00194:      // デバイス生成フラグ.
00195:      auto createDeviceFlags = D3D12_CREATE_DEVICE_NONE;
00196:  #if defined(DEBUG) || defined(_DEBUG)
00197:      createDeviceFlags |= D3D12_CREATE_DEVICE_DEBUG;
00198:  #endif
00199:  
00200:      // ドライバータイプ.
00201:      std::array<D3D_DRIVER_TYPE, 4> driverTypes = { 
00202:          D3D_DRIVER_TYPE_HARDWARE,
00203:          D3D_DRIVER_TYPE_WARP,
00204:          D3D_DRIVER_TYPE_REFERENCE,
00205:          D3D_DRIVER_TYPE_SOFTWARE
00206:      };
00207:  
00208:      // デバイス生成.
00209:      for( size_t i=0; i<driverTypes.size(); ++i )
00210:      {
00211:          hr = D3D12CreateDevice(
00212:              nullptr,
00213:              driverTypes[i],
00214:              createDeviceFlags,
00215:              D3D_FEATURE_LEVEL_9_1,
00216:              D3D12_SDK_VERSION,
00217:              IID_ID3D12Device,
00218:              (void**)m_Device.GetAddress() );
00219:  
00220:          if ( SUCCEEDED( hr ) )
00221:          { break; }
00222:      }
00223:  
00224:      // 生成チェック.
00225:      if ( FAILED( hr ) )
00226:      {
00227:          ELOG( "Error : D3D12CreateDevice()Failed." );
00228:          return false;
00229:      }
00230:  
00231:      // コマンドアロケータを生成.
00232:      hr = m_Device->CreateCommandAllocator(
00233:          D3D12_COMMAND_LIST_TYPE_DIRECT, 
00234:          IID_ID3D12CommandAllocator,
00235:          (void**)m_CmdAllocator.GetAddress() );
00236:      if ( FAILED( hr ) )
00237:      {
00238:          ELOG( "Error : ID3D12Device::CreateCommandAllocator() Failed." );
00239:          return false;
00240:      }
00241:  
00242:      // コマンドキューを生成.
00243:      {
00244:         D3D12_COMMAND_QUEUE_DESC desc;
00245:         ZeroMemory( &desc, sizeof(desc) );
00246:         desc.Type        = D3D12_COMMAND_LIST_TYPE_DIRECT;
00247:         desc.Priority    = 0;
00248:         desc.Flags       = D3D12_COMMAND_QUEUE_NONE;
00249:  
00250:         hr = m_Device->CreateCommandQueue( &desc, IID_ID3D12CommandQueue, (void**)m_CmdQueue.GetAddress() );
00251:         if ( FAILED( hr ) )
00252:         {
00253:             ELOG( "Error : ID3D12Device::CreateCommandQueue() Failed." );
00254:             return false;
00255:         }
00256:      }
00257:  
00258:      // スワップチェインを生成.
00259:      {
00260:          hr = CreateDXGIFactory( IID_IDXGIFactory, (void**)m_Factory.GetAddress() );
00261:          if ( FAILED( hr ) )
00262:          {
00263:              ELOG( "Error : CreateDXGIFactory() Failed." );
00264:              return false;
00265:          }
00266:  
00267:          DXGI_SWAP_CHAIN_DESC desc;
00268:          ZeroMemory( &desc, sizeof(desc) );
00269:          desc.BufferCount                        = m_BufferCount;
00270:          desc.BufferDesc.Format                  = m_SwapChainFormat;
00271:          desc.BufferDesc.Width                   = w;
00272:          desc.BufferDesc.Height                  = h;
00273:          desc.BufferDesc.RefreshRate.Numerator   = 60;
00274:          desc.BufferDesc.RefreshRate.Denominator = 1;
00275:          desc.BufferUsage                        = DXGI_USAGE_RENDER_TARGET_OUTPUT | DXGI_USAGE_SHADER_INPUT;
00276:          desc.OutputWindow                       = m_hWnd;
00277:          desc.SampleDesc.Count                   = 1;
00278:          desc.SampleDesc.Quality                 = 0;
00279:          desc.Windowed                           = TRUE;
00280:  
00281:          // アダプター単位の処理にマッチするのは m_Device ではなく m_CmdQueue なので,m_CmdQueue を第一引数として渡す.
00282:          hr = m_Factory->CreateSwapChain( m_CmdQueue.GetPtr(), &desc, m_SwapChain.GetAddress() );
00283:          if ( FAILED( hr ) )
00284:          {
00285:              ELOG( "Error : IDXGIFactory::CreateSwapChain() Failed." );
00286:              return false;
00287:          }
00288:      }
00289:  
00290:      // デスクリプタヒープの生成.
00291:      {
00292:          D3D12_DESCRIPTOR_HEAP_DESC desc;
00293:          ZeroMemory( &desc, sizeof(desc) );
00294:  
00295:          desc.NumDescriptors = 1;
00296:          desc.Type           = D3D12_RTV_DESCRIPTOR_HEAP;
00297:          desc.Flags          = D3D12_DESCRIPTOR_HEAP_NONE;
00298:  
00299:          hr = m_Device->CreateDescriptorHeap( &desc, IID_ID3D12DescriptorHeap, (void**)m_DescriptorHeap.GetAddress() );
00300:          if ( FAILED( hr ) )
00301:          {
00302:              ELOG( "Error : ID3D12Device::CreateDescriptorHeap() Failed." );
00303:              return false;
00304:          }
00305:      }
00306:  
00307:      // コマンドリストの生成.
00308:      {
00309:          hr = m_Device->CreateCommandList(
00310:              1,
00311:              D3D12_COMMAND_LIST_TYPE_DIRECT,
00312:              m_CmdAllocator.GetPtr(),
00313:              nullptr,
00314:              IID_ID3D12GraphicsCommandList,
00315:              (void**)m_CmdList.GetAddress() );
00316:          if ( FAILED( hr ) )
00317:          {
00318:              ELOG( "Error : ID3D12Device::CreateCommandList() Failed." );
00319:              return false;
00320:          }
00321:      }
00322:  
00323:      // バックバッファからレンダーターゲットを生成.
00324:      {
00325:          hr = m_SwapChain->GetBuffer( 0, IID_ID3D12Resource, (void**)m_ColorTarget.GetAddress() );
00326:          if ( FAILED( hr ) )
00327:          {
00328:              ELOG( "Error : IDXGISwapChain::GetBuffer() Failed." );
00329:              return false;
00330:          }
00331:  
00332:          m_ColorTargetHandle = m_DescriptorHeap->GetCPUDescriptorHandleForHeapStart();
00333:          m_Device->CreateRenderTargetView( m_ColorTarget.GetPtr(), nullptr, m_ColorTargetHandle );
00334:      }
00335:  
00336:      // フェンスの生成.
00337:      {
00338:          m_EventHandle = CreateEvent( 0, FALSE, FALSE, 0 );
00339:  
00340:          hr = m_Device->CreateFence( 0, D3D12_FENCE_MISC_NONE, IID_ID3D12Fence, (void**)m_Fence.GetAddress() );
00341:          if ( FAILED( hr ) )
00342:          {
00343:              ELOG( "Error : ID3D12Device::CreateFence() Failed." );
00344:              return false;
00345:          }
00346:      }
00347:  
00348:      // ビューポートの設定.
00349:      {
00350:          m_Viewport.TopLeftX = 0;
00351:          m_Viewport.TopLeftY = 0;
00352:          m_Viewport.Width    = FLOAT(w);
00353:          m_Viewport.Height   = FLOAT(h);
00354:          m_Viewport.MinDepth = 0.0f;
00355:          m_Viewport.MaxDepth = 1.0f;
00356:      }
00357:  
00358:      // 正常終了.
00359:      return true;
00360:  }
かなり初期化コード長いですね(汗)。
知識のない初心者は間違いなく心折れますね。


 4.描画処理
さて,いよいよ画面クリア処理です。
Direct3D 11のように初期化は長いですが,実際の描画コマンドをつくる処理は比較的に短いです。
Direct3D 12でも11と同じようにまずビューポートを設定しておきます。この時にD3D11と違い,リソースのバリアを張る必要があります。このあたり人に説明できるまでちゃんと理解していないです。間違いを恐れずにいうと,GPUの読み書き/書き込みするタイミングを考えずに描画コマンドを実行すると書き込み中にコマンドを実行してしまって,描画結果がおかしくなったりとかハードウェア的におかしくなったりとかするので,複数のアクセスを処理する必要があります。そのあたりをするのがこのリソースバリアなのかなぁと個人的には思っています。間違っている可能性もあるので,もし詳しい人がいらっしゃったらメール等で指摘していただけるとありがたいです。
そんなわけで,リソース関係をいじる場合にはリソースバリアを考える必要があります。今回のサンプルではレンダーターゲットのみなので,ビューポートを設定するタイミングと,レンダーターゲットをクリアする箇所は意識する必要があります。
00468:  //-------------------------------------------------------------------------------------------------
00469:  //      フレーム描画処理です.
00470:  //-------------------------------------------------------------------------------------------------
00471:  void App::OnFrameRender()
00472:  {
00473:      // ビューポートを設定.
00474:      m_CmdList->RSSetViewports( 1, &m_Viewport );
00475:      SetResourceBarrier( m_CmdList.GetPtr(), m_ColorTarget.GetPtr(), D3D12_RESOURCE_USAGE_PRESENT, D3D12_RESOURCE_USAGE_RENDER_TARGET );
00476:  
00477:      // カラーバッファをクリア.
00478:      float clearColor[] = { 0.39f, 0.58f, 0.92f, 1.0f };
00479:      m_CmdList->ClearRenderTargetView( m_ColorTargetHandle, clearColor, nullptr, 0 );
00480:      SetResourceBarrier( m_CmdList.GetPtr(), m_ColorTarget.GetPtr(), D3D12_RESOURCE_USAGE_RENDER_TARGET, D3D12_RESOURCE_USAGE_PRESENT );
00481:  
00482:      // 画面に表示.
00483:      Present( 0 );
00484:  }
SetResourceBarrier()メソッドはMSDNのサンプルを基に実装しました。サンプルは下記ページの下側にあります。
https://msdn.microsoft.com/en-us/library/dn859356%28v=vs.85%29.aspx
00513:  //-------------------------------------------------------------------------------------------------
00514:  //      リソースバリアの設定.
00515:  //-------------------------------------------------------------------------------------------------
00516:  void App::SetResourceBarrier
00517:  (
00518:      ID3D12GraphicsCommandList* pCmdList,
00519:      ID3D12Resource* pResource,
00520:      UINT stateBefore,
00521:      UINT stateAfter
00522:  )
00523:  {
00524:      D3D12_RESOURCE_BARRIER_DESC desc = {};
00525:      desc.Type                   = D3D12_RESOURCE_BARRIER_TYPE_TRANSITION;
00526:      desc.Transition.pResource   = pResource;
00527:      desc.Transition.Subresource = D3D12_RESOURCE_BARRIER_ALL_SUBRESOURCES;
00528:      desc.Transition.StateBefore = stateBefore;
00529:      desc.Transition.StateAfter  = stateAfter;
00530:  
00531:      pCmdList->ResourceBarrier( 1, &desc );
00532:  }
クリアの描画コマンドを積んだら,実際にコマンドリストを実行をしてGPUに処理してもらい,画面に表示するという作業を行う必要があります。
この処理を行っているのが下記のPresent()メソッドです。まず,ID3D12GraphicsCommandLst::Close()メソッドで描画コマンドの記録が終了したことを教えてあげます。つぎにID3D12CommandQueue::ExecuteCommandLists()で記録したしたコマンドリストを実行し,GPU側に転送します。転送自体はすぐに終わるのですが,GPU側ではすぐに処理が終わらない場合があるので,ID3D12Fence::Signal()でシグナル状態にして,SetEventOnCompletion()メソッドを使用してイベントが終了した時に与える数値を設定します。今回のサンプルでは,待ち状態が0で,完了時を1とするため,SetEventOnCompletion(1, m_EventHandle)を設定しています。CommandQueueの実行が終わった時に1をシグナルとするために,ID3D12CommandQueue::Signal()で1を設定します。あとは,WaitForSingleObject()メソッドで,完了を待機します。
完了したら,描画コマンドが実行済みでバックバッファが更新された状態になるので,IDXGISwapChain::Present()でバックバッファをフロントバッファに表示し,バッファを交換します。
これでコマンドリストを実行して,画面に表示まで終わったので現在コマンドリストに積まれている描画コマンドは不要になるので,次のフレームの描画を行うためにコマンドリストとコマンドを積むために使用したメモリをリセットしてやります。これを行っているのが,ID3D12CommandAllocator::Reset(), ID3D11GraphicsCommnadList::Reset()です。
00534:  //-------------------------------------------------------------------------------------------------
00535:  //      コマンドを実行して画面に表示します.
00536:  //-------------------------------------------------------------------------------------------------
00537:  void App::Present( u32 syncInterval )
00538:  {
00539:      // コマンドリストへの記録を終了し,コマンド実行.
00540:      m_CmdList->Close();
00541:      m_CmdQueue->ExecuteCommandLists( 1, CommandListCast( m_CmdList.GetAddress() ) );
00542:  
00543:      // コマンドの実行の終了を待機する
00544:      m_Fence->Signal( 0 );
00545:      m_Fence->SetEventOnCompletion( 1, m_EventHandle );
00546:      m_CmdQueue->Signal( m_Fence.GetPtr(), 1 );
00547:      WaitForSingleObject( m_EventHandle, INFINITE );
00548:  
00549:      // 画面に表示する.
00550:      m_SwapChain->Present( syncInterval, 0 );
00551:  
00552:      // コマンドリストとコマンドアロケータをリセットする.
00553:      m_CmdAllocator->Reset();
00554:      m_CmdList->Reset( m_CmdAllocator.GetPtr(), nullptr );
00555:  }


 5. おわりに
今回は,一番簡単な画面クリアまでの処理を行いました。
たったこれだけの処理をするだけでも,結構大変だなぁと思いました。次回の予習ではポリゴン描画を取り扱う予定です。


 SourceCode
本ソースコードおよびプログラムはMIT Licenseに準じます。
プログラムの作成にはWindows 10 Technical Preview Build 10041 および Microsoft Visual Studio 2015 CTPを用いています。