迪丽热巴 dl( 四 )


P40的有12tfloat单精度计算的能力,并且p40的显存是24G,P4的显存只有8GB 。所以我们在P4做我们这个模型的部署和服务,在P40,V100上去做模型的训练 。

迪丽热巴 dl

文章插图
我们模型的线上推理阶段采用了大规模的P4为主的集群 。通过我们这里的数据可以看到,利用GPU集群的性能远远超过了CPU的集群 。在我们典型的一个业务场景下,我们对集群单点的承载和实验的性能进行了压力的测试,大家可以看到我GPU集群的显著优于CPU的集群 。
迪丽热巴 dl

文章插图
由于基于GPU集群的训练和服务都足够的快,所以说在用户体验方面,我们EasyDL的用户最快五分钟就可以完成一些小规模的数据集的训练并且获得服务 。我们比同样的需求通常需要数天的训练的周期相比我们大幅的提升了效率 。这样的就解决了我们定制化模型训练和服务中的一些效率的挑战 。
我们用刚才所说的kubernetes来完成了我们GPU集群的搭建 。这样我们可以对训练和服务做到统一的资源调度来高效的利用我们的资源 。并且也有很好的扩展性,我们还可以通过扩展我们GPU的集群的规模来拓展训练的能力,扩展我们服务的能力 。并且我们有这个高可用的特性,如果有故障了,也不会影响到我们集群的一个服务能力,保证我们服务的一个稳定性 。
迪丽热巴 dl

文章插图
最后,跟大家分享一下我们EasyDL行业的一些案例 。目前,我们可以解决两个问题 。其实现在已经是三类的问题了,就是后面我会给大家介绍我们第三类的能力 。这两个问题是说我们有图像分类的能力,我们可以通过一张图片去识别它到底是属于客厅还是餐厅 。这样的话可以方便我们互联网内容的平台去做图片的自动打标签的一些功能 。我们还有物品检测的能力,就是说我们可以识别出来这张图片里面有没有空调,空调在什么地方 。我们可以将这种能力的应用到我们零售仓储行业的商品货品,检测统计等等这样的场景中 。
我们EasyDL平台,从去年十月份上线一测以来就支持了刚才所说的图像分类能力,在今年四月份我们又开放的物品检测的能力 。在今年五月底我们支持了刚才介绍的设备端计算能力也就是离线SDK能力 。刚刚大家跟大家想到我们有第三个能力,这也就是我们昨天刚刚上线的声音定制化识别的能力,大家有兴趣就可以去我们平台上试用 。
迪丽热巴 dl

文章插图
第一个给大家分享的案例是蝶鱼科技的案例 。这是一家制造键盘的制造商,然后他们的场景是说在键盘的制造过程当中会有一些缺陷或者错装以及不符合规格的情况 。他们要把这些识别出来的跟正常的做区别然后再出场 。之前这都是通过人工去做的 。在利用了我们EasyDL平台去训练了三千多张图片之后,识别率达到了百分之九十九以上 。他们就让我们的EasyDL接口和他们自己的供应摄像头做了一个综合的检测系统来帮助他们的生产线每年节省了十二万的人工检测成本 。
迪丽热巴 dl

文章插图
第二个案例是美国的零售安防的供应商,他在美国的纽约州,新泽西州等等七个州一百多个超市里面有一千多台摄像头设备,主要就是来监控购物车下层有没有没付款的商品 。之前他们都是通过传感器去判断的,但是传感器对于一些残疾人购物车或者儿童购物车这些错误的识别率很高,所以他们利用我们的平台去做一个EasyDL模型的训练 。最后的准确率能够达到百分之九十五以上,远远超过了这个客户的预期 。
迪丽热巴 dl

文章插图
前面介绍的都是图像分类的一些案例,这个是物品检测的案例 。这家客户是叫做惠合科技,他们有个产品叫做e店佳 。就是通过零售部门店去做拍照,然后去看这个摆放的商品合不合规 。之前的他们都是巡检员去巡检,然后用人工的方式去统计 。这样一方面成本很高,另一方面 。作弊的现象也比较多,利用我们EasyDL平台去做这样的一个物品检测的模型训练之后,他们接入了这样的一个自动化的审核的方案使得他们审核效率提升了百分之三十 。
迪丽热巴 dl

文章插图
最后一个案例,那来自于我们百度的合作伙伴CELLA,CELLA是面向企业客户的一个系统集成商,这是他为圣象地板做的解决方案,圣象地板会有一些瑕疵 。利用我们百度EasyDL平台,他对前面两种瑕疵去做图像的分类,对后面两个去做物体检测,整体的测试识别准确率能达到百分之九十五以上 。然后 。我们将这样的一个方案的离线SDK移植到我们客户的智能摄像头里面,去做成了一个软硬一体的方案 。这样的话提高了我们单片木板的产能,现在的处理时间仅为原来的一个四分之一 。

秒懂生活扩展阅读