NVIDIA GPUによる計算の高速化
CPU対GPU
● | ディープラーニングのアルゴリズムは多くの計算を実行し、CPU上でのトレーニングが非常に遅くなる可能性があります。 |
たとえば、シングルスレッドが搭載されたハイエンドなIntel Core i9-7900X CPUの場合、データを拡張することはできません。
□ | トレーニングは、最大0.5メガピクセル/秒まで処理できます。 |
□ | 検証と分類は、1.5メガピクセル/秒まで処理できます。 |
● | 最近のNVIDIA GPUを使用すると、処理速度が大幅に向上します。 |
NVIDIA GeForce 1080Tiでは、データ拡張なし:
□ | トレーニングは、最大50メガピクセル/秒まで処理できます。 |
□ | 検証は、最大160メガピクセル/秒まで処理できます。 |
□ | 単一画像の分類は、最大55メガピクセル/秒(800×256グレースケール画像/秒以上に相当)を処理できます。 |
実際の速度は、入力画像フォーマット、データ拡張、バッチサイズ、GPUモデルによって異なります。
NVIDIACUDA® GPUの使用
1. | EasyDeepLearningライブラリでNVIDIA GPUを使用するには、次のNVIDIAライブラリをコンピュータにインストールします。 |
□ | NVIDIA CUDA® Toolkit バージョンv10.0(https://developer.nvidia.com/cuda-toolkit) |
□ | NVIDIACUDA® Deep Neural Network ライブラリ(cuDNN)v7(https://developer.nvidia.com/cudnn) |
2. | インストールの場所に応じて: |
□ | NVIDIACUDA®Toolkitをデフォルトの場所(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0)にインストールすると、EasyDeepLearningライブラリは必要なものを自動的に見つけ出します。 |
□ | それ以外の場合は、cusolver64_100.dll、curand64_100.dll、cufft64_100.dll、cublas64_90.dllのDLLをOpen eVision DLLフォルダにコピーする必要があります(デフォルトの場所は、C:\Program Files (x86)\Euresys\Open eVision X.X\Bin64\です)。 |
3. | zipアーカイブとして提供されているNVIDIA CUDA® Deep Neural Networkライブラリ(cuDNN)をインストールします。 |
a. | ファイルを解凍します。 |
b. | 解凍したファイルをhttps://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installwindowsに示されているNVIDIACUDA®Toolkitインストールディレクトリにコピーします。 |
c. | NVIDIACUDA® Toolkitがデフォルトの場所にインストールされていない場合は、Open eVision DLLフォルダ(デフォルトの場所はC:\Program Files (x86)\Euresys\Open eVision X.X\Bin64\です)にDLLファイルcudnn64_7.dllをコピーします。 |
4. | EasyDeepLearningにGPUを使用するように指示するには、EClassifier::SetEnableGPUメソッドを使用します。 |
5. | コンピュータに複数のGPUがインストールされている場合は、EClassifier::SetGPUIndexメソッドで使用するGPUのインデックスを設定します。 |