硬件支持(CPU/GPU)

●

由于深度学习算法执行了大量的计算，在CPU上进行训练将会非常缓慢。

例如，对于 EasyClassify，在具有单线程的高端Intel Core i9-7900X CPU上，且没有数据增强：

□

其训练的处理速度可达0.5兆像素/每秒。

□

其验证及分类的处理速度可达1.5兆像素/每秒。

●

使用 EDeepLearningTool::SetEnableGPU(false) 方法将CPU与深度学习工具结合使用。

深度学习工具支持处理32位和64位应用的CPU。但是，32位应用程序的内存限制为2 GB，这可能会减慢大图像的训练或分类。

●

使用最新的NVIDIA GPU，则可大大地加快处理速度。

对于 EasyClassify，在NVIDIA GeForce 1080Ti上，且没有数据增强：

□

其训练的处理速度可达50兆像素/每秒。

□

其验证的处理速度可达160兆像素/秒。

□

单个图像的分类的处理速度可达55兆像素/秒（相当于每秒800多个256×256灰度图像）。

请注意，其实际速度因输入图像格式、数据增强、批量大小、及GPU型号而异。

1.

要将NVIDIA GPU与深度学习工具一起使用，请在计算机上安装以下NVIDIA库：

□

NVIDIA CUDA® 工具箱版本 v11.1 (https://developer.nvidia.com/cuda-toolkit)

□

NVIDIA CUDA® 深度神经网络库 (cuDNN) v8.1 for CUDA 11.1 (https://developer.nvidia.com/cudnn)

2.

按照安装位置：

□

如果将NVIDIA CUDA®工具包安装在其默认位置，（C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1），则深度学习工具会自动找到所需内容。

□

否则，DLLs cusolver64_11.dll, curand64_10.dll, cufft64_10.dll 以及 cublas64_11.dll 将被拷贝到 Open eVision DLL 文件夹（其默认位置为 C:\Program Files (x86)\Euresys\Open eVision X.X\Bin64\)。

3.

安装以zip存档的NVIDIACUDA®深度神经网络库（cuDNN）：

a.

解压缩文件。

b.

将解压缩文件复制到NVIDIACUDA®工具箱安装目录，见https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installwindows.

c.

如果 NVIDIA CUDA® 工具箱没有安装在默认位置，请将DLL文件复制到Open eVision DLL文件夹 cudnn*8.dll 中，（该文件夹的默认位置是 C:\Program Files (x86)\Euresys\Open eVision X.X\Bin64\）。

4.

使用方法，将CPU与深度学习工具结合使用。

使用多个GPU

您可以使用多个GPU进行训练和批量分类。

●

在API中，要设置GPU列表，请使用 EDeepLearningTool::SetGPUIndexes 方法。

只有当这些GPU是具有TCC驱动模式的Quadro或Tesla模式时，使用多个GPU才能提高训练和批处理分类速度(见 http://docs . NVIDIA . com/gameworks/content/developer tools/desktop/n sight/Tesla_compute_cluster .htm)。
使用多个 GeForce GPU 比使用一个GUP要慢。如果计算机上安装了多个GPU，请使用 EDeepLearningTool::SetGPUIndexes 方法来设置GPU索引的使用。

●

在 Deep Learning Studio中，要选择处理设备，请选择一个执行配置文件。