CEDEC参加中。

Share

今年はとあるプロジェクトから無事に脱出することが出来たので,CEDECに参加しています。
後ほどレポートをまとめようと思います!
これから基調講演聴いてきます。

漬物がうまい。

Share

実はPocolは漬物に目がないのですが,昨日児島さんで買ってきた「赤みの樹」がかなり美味しかったので,後で,自分で漬物を作れるようにメモを残しておこうと思います。

(さらに…)

プログラマー飲み会!!冬の陣

Share

春に引き続き,プログラマー飲み会!!を開催しようかなと思います。
興味ある人は下記のページから参加登録をお願い致します。
https://atnd.org/events/72705

あ、ちなみに教員の方とかプログラマーではない人でも大丈夫です。
興味ある人であればOKです!
開催日程はこれから調整しようと思いますが,12/19か20のいずれかを予定しています。
年末でも大丈夫な方が多ければ20日以降に開催しようかと思います。
参加登録の際に19・20・年末のいずれかをコメント記載していただけると助かります。

ちなみに参考として,前回の開催内容は下記のとおりです。
https://atnd.org/events/63383

エイリアシング誤差の可視化

Share

※2015/10/04 やっぱりHLSLのコードが間違えていたようで修正しました。

LogPSMで出てきたエイリアシング誤差の可視化を実装してみました。
実装に当たっては,”Robust Hard Shadows”のAppendix A.3 Sampling rateと,博士論文でない方のLograthimic Perspective Shadowの論文中の式84, 式85を参考にしました。
RobustHardShadows_Fig_5_6

※図はMartin Stingl, 2011, Robust Hard Shadows. p.58より引用。

論文中で使われている下の画像ようなものを表示するためのものです。
LogPSM_Fig_5_32

※図はLloyd, B. 2007. Logarithmic perspective shadow maps. PhD thesis, University of North Carolina. p.116 より引用。
float3 VisualizeError( float2 shadowCoord, float2 shadowMapSize )
{
    const float3 values[] = {
        float3( 0.0f,       1.0/7.75,   1.0f/7.75f ),
        float3( 1.0f/7.75f, 1.0f/3.25f, 1.0f/3.25f - 1.0f/7.75f ),
        float3( 1.0f/3.25f, 1.0f,       1.0f - 1.0f/3.25f ),
        float3( 1.0f,       3.25f,      2.25f ),
        float3( 3.25f,      7.75f,      4.5f ),
        float3( 7.75f,      10.0f,      7.75f ),
    };

    const float3 colors[] = {
        float3( 0.2f, 0.0f, 0.0f ),
        float3( 1.0f, 0.2f, 0.0f ),
        float3( 1.0f, 1.0f, 0.0f ),
        float3( 0.0f, 1.0f, 0.0f ),
        float3( 0.3f, 0.8f, 1.0f ),
        float3( 0.0f, 0.0f, 1.0f ),
        float3( 0.0f, 0.0f, 0.2f )
    };

    float2 ds = shadowMapSize.x * ddx( shadowCoord );
    float2 dt = shadowMapSize.y * ddy( shadowCoord );

    float error = max( length( ds + dt ), length( ds - dt ) );

    float3 result = (float3)1.0f;
    [unroll]
    for( int i=0; i<6; ++i )
    {
        if ( error >= values[i].x && error < values[i].y )
        {
            result = lerp( colors[i], colors[i+1], (error - values[i].x) / values[i].z );
            break;
        }
        else
        {
            result = colors[6];
        }
    }

    return result;
}

Uniform Shadow Mapに適用すると下記のようになります。
test_visualize
うちのサンプルで公開しているものは,それなりによさげに見えます。
Prallel-Split Shadow Mapの方にも適用してみました。
test_visualize2
PSSM適用するまでもないシーンなのですが,一応緑色が占める割合が多いので,適切にシャドウマップが適用されていることが分かりますね。
奥の方はこんだけちっこいシーンなので当たり前ですがオーバーサンプリング気味になっているので,カスケードの枚数を減らしても大丈夫そうな気がします。
再びUSMで2048×2048だったシャドウマップのサイズを256×256に落とすと下記のようになります。
test_visualize3
test_visualize4
奥の方は緑色になっているので確かにシャドウが適切に表示されていますね。
手前部分は赤から黄色に近い色になっているので,確かにちょっと汚いのが見て取れます。
こういう感じでデバッグに結構役立ちそうです。

もし実装間違え等があれば,正しい実装と一緒に指摘していただけると幸いです。

TortoiseGitでのリモートブランチの削除方法

Share

TortoiseGitでのリモートブランチの削除方法をいつも忘れてしまうので,メモにしておきます。

①フォルダをクリックして,コンテキストメニューを表示して,「切り替え(W)」を選択。
git01
②ダイアログの「…」をクリックする。
git02
③左側のrefsからremotesを選択する。ブランチ名一覧から削除したいブランチを選択し,コンテキストメニューの「リモートブランチを削除」を選択する。
git03
これでリモートブランチが削除できるようです。

用語メモ

Share

こんにちわ、Pocolです。
今回は用語についてメモを残しておこうと思います。
間違いが多々あると思いますので,間違いがあったらご指摘いただけると幸いです。

バス

バスとは、コンピュータ内部でデータや信号を伝達するための回路や通路のこと。

メモリバス幅

メモリがデータを一度に送れる量。
NVIDIA GeForce GTX 980 はメモリバス幅は256 bit
NVIDIA GeForce GTX 980 Ti は 384 bit

メモリ帯域幅

バス幅×周波数×1サイクル当たりの転送回数=帯域幅 …らしい。
NVIDIA GeForce GTX 980 はメモリ帯域幅が 224 GB/s
NVIDIA GeForce GTX 980 Ti は336.5 GB/s

VRAM

パソコン本体のメモリ(メインメモリ)と同じく、一時的にデータを保存する場所で、グラフィックカードについているメモリは「VRAM」と呼ばれるそうです。

キャッシュメモリ

処理装置と主記憶装置とのデータのやり取りを高速化するためのメモリーだそうです。
キャッシュメモリで調べると「CPUとの~」的な説明が多いですが,GPUにも搭載されています。
L1キャッシュ,L2キャッシュの例え話。


* キッチン:L1キャッシュ
* 台所:L2キャッシュ
* 冷蔵庫:L3キャッシュ
* スーパー:HDD
という例えもある。

キャッシュミス

キャッシュの中に必要なデータが無いこと。

命令セット

命令セットとは、あるマイクロプロセッサで使用できる命令の集合。
そのプロセッサを動かすための機械語コードの体系で、プロセッサに対してどのような命令が使用できるか、また、命令がどのような動作をするのかを定めたものだそうです。

コマンド

命令のこと。

コマンドバッファ

コマンドバッファとは,GPUが実行するコマンド列のバッファのこと。

mantle_software_instructure
図は,Matle Programing Guide p.13 より引用。

コマンドリスト

Microsoftのドキュメントによると(https://msdn.microsoft.com/ja-jp/library/ee422102(v=vs.85).aspx)
「コマンド リストは、記録と再生が可能な GPU コマンド シーケンスです。」
とのこと。

DMA転送

DMAはDirect Memory Accessの略。
CPUを介さずに「直接」メモリに転送すること。
DMA転送のメリットは,CPUの負荷を上げずにハードウェアの能力を利用した高速なデータ転送が実現できること。

ヒープ

メモリ関係で,ヒープといったらツリー構造ではなく,動的にメモリ確保可能なメモリ領域のことを指す。
ヒープ (heap) とは,「山積み」という言葉の中の「山」をさす英単語らしい。

フィルレート

1秒あたり何ピクセルの描画をすることが出来るかという能力値のこと。

スピンロック

マルチスレッドなどの環境の排他制御において、ロックを獲得するまでスピン(ビジーループ)で待つ方法