1.通过实时推理提供快速相应的用户体验
相应速度是决定用户是否使用互动语音,视觉搜索和视频推荐的服务的关键因素。随着模型的准确性和复杂性越来越高,提供相应灵敏的用户体验至关重要。4片/16片Tesla P4借助INT8运算能力提供高达176TOPS的推理性能,极大降低延迟。
2.借助专业解码引擎开发新的人工智能视频服务
单片 Tesla P4 配备硬件加速解码引擎,能对多达35路高清视频流进行实时转码和推理,该解码引擎可与进行推理的GPU并行运作。将深度学习集成到视频管线后,客户可以向用户提供之前无法实现的智能创新视频服务
3.使用TensorRT和DeepSTREAM SDK加快部署速度
TensorRT是为优化部署到生产环境的深度学习模型而创建的库。它通常以32位或16位数据的形式获取接受训练的神经网络,并针对降低精度的INT8运算能力优化这些网络。NVIDIA DeepStream SDK 利用Pascal GPU的强大功能,可以同时解码和分析视频。 |